16-12-2018 20:17

Facebook открыла код PyText, библиотеки для обработки естественной речи

Содержание статьи:

geralt

Facebook открыла исходный код PyText, библиотеки для обработки устной и письменной речи. По мнению разработчиков, такой шаг должен ускорить развитие проекта.

Сфера применения PyText

NLP-библиотека (Natural Language Processing — обработка естественной речи) используется в используется в нейросетях для обработки письменной и устной речи. По словам разработчиков, инструмент полезен для классификации документов, разметки речевых последовательностей, семантического анализа и многозадачного моделирования.

Вам будет интересно:В Госдуму внесли законопроект об автономной работе Рунета

Структура библиотеки позволяет легко перейти от разработки NLP-системы к практическому применению. Инженеры компании утверждают, что с использованием PyText реализация модели нейросети, распознающей человеческую речь, займёт всего несколько дней.

PyText workflow

Особенности библиотеки

PyText основана на PyTorch, фреймворке с развитой экосистемой, поэтому модели, созданные с помощью NLP-библиотеки, легко публиковать.
В состав инструмента входит несколько уже готовых моделей. Структура PyText позволяет модифицировать их с небольшими трудозатратами, что упрощает разработку.
Разработчики включили в библиотеку специальные модели, использующие контекст речи для лучшего распознавания сути высказываний. Они протестированы на датасетах с помощью инструмента M Suggestions (одна из функций помощника) в Facebook Messenger.
PyText может проводить распределённое обучение, а также работать с несколькими моделями одновременно.
Интеграция с фреймворком PyTorch позволяет библиотеке конвертировать модели в ONNX и использовать движок Caffe2 для их экспорта.
Масштабирование собственных моделей в PyTorch ограниченно из-за лимита многопоточности принципа Global Interpreter Lock в Python.
Экспортированные модели позволяют использовать возможности C++ для повышения производительности.

Компания уже применяет PyText на практике. По словам разработчиков, созданные с её помощью модели ежедневно делают более миллиарда прогнозов на Facebook. Открытие исходного кода и свободная лицензия должны привлечь к совершенствованию инструмента независимых специалистов. При этом инженеры компании не устраняются от дальнейшей разработки системы. Они намерены сконцентрировать усилия на использовании её возможностей в сфере мобильных устройств.

Исходный код инструмента размещён в репозитории GitHub. Лежащая в основе NLP-библиотеки стабильная версия фреймворка PyTorch 1.0 вышла в декабре 2018 года.

Источник

Автор:

Роман Наумов 16-12-2018 20:17

Жду ваши вопросы и мнения в комментариях

III этап Чемпионата России по ралли-кроссу в Рязани 20-21 июля

III этап Чемпионата России по ралли-кроссу в Рязани 20-21 июля Уже совсем скоро мы доберёмся до экватора соревнований по ралли-кроссу. 21 июля на АСК «Атрон» пройдет 3 этап Чемпионата, Первенства и Кубка России по ралли-кроссу. Борьба становится ярче и жестче, каждый спортсмен борется за очки, которые могут сыграть решающую роль по итогам года.

Август Герасимов

17-07-2019 07:00

Информационные технологии

Подробнее

Кроссовер Dodge Challenger

Мускул-кроссовер Dodge Challenger: каким он может быть В наше время кроссоверы всё больше захватывают автомобильный рынок, есть модели уже практически на любой вкус. Кто знает, может быть появятся и вседорожные версии культовых американских спорткаров. Что из этого могло бы получиться?

Август Герасимов

17-07-2019 07:00

Информационные технологии

Подробнее

Новый SsangYong Actyon может сменить бренд и получить семиместную версию

Новый SsangYong Actyon может сменить бренд и получить семиместную версию В Индии корейский паркетник может появиться под местной маркой Mahindra. Модель якобы собираются позиционировать в качестве XUV500 следующего поколения.

Август Борисов

17-07-2019 06:59

Информационные технологии

Подробнее

Пикап Fiat Toro-2020: дизель теперь и в «базе», у новой топ-версии – кузов с крышкой

Пикап Fiat Toro-2020: дизель теперь и в «базе», у новой топ-версии – кузов с крышкой Итальянская марка представила свой обновленный грузовик. У модели слегка подправили дизайн экстерьера, также расширен список доступного оборудования.

Август Борисов

17-07-2019 06:25

Информационные технологии

Подробнее

Самый дешёвый кросс Hyundai: теперь глобальная версия. Что не досталось индийцам?

Самый дешёвый кросс Hyundai: теперь глобальная версия. Что не досталось индийцам? Вторым рынком для нового компактного паркетника Venue стала родная Корея. Там модель предложат только с одним двигателем, полный привод новинке не положен в принципе.

Август Борисов

17-07-2019 05:53

Информационные технологии

Подробнее

Водители стали реже оплачивать штрафы ГИБДД

Водители стали реже оплачивать штрафы ГИБДД Число неоплаченных штрафов заметно выросло с начала года. Об этом рассказали в Федеральной службе судебных приставов (ФССП) России.

Август Герасимов

17-07-2019 05:53

Информационные технологии

Подробнее

Автокультура в Архангельском 2019

Автокультура в Архангельском 2019 В минувшие выходные в одном из самых живописных мест Подмосковья музее-усадьбе «Архангельское» состоялся фестиваль «Автокультура 2019».

Август Борисов

17-07-2019 05:17

Информационные технологии

Подробнее

Ночной кошмар: американцы превратили Ford F-150 в самый быстрый в мире пикап

Ночной кошмар: американцы превратили Ford F-150 в самый быстрый в мире пикап Тюнинг-ателье Roush Performance подтвердила на треке впечатляющие характеристики пикапа F-150 Nitemare, оснащённого 5,0-литровым компрессорным V8 мощностью 659 л.с.

Август Борисов

17-07-2019 05:16

Информационные технологии

Подробнее

Срок уплаты штрафа со скидкой хотят увеличить

Срок уплаты штрафа со скидкой хотят увеличить Сейчас оплатить всего лишь половину взыскания за нарушение ПДД можно в течение 20 дней с момента появления постановления.

Август Борисов

17-07-2019 05:16

Информационные технологии

Подробнее

Будущий кроссвэн Chevrolet: три варианта компоновки салона и богатое оснащение

Будущий кроссвэн Chevrolet: три варианта компоновки салона и богатое оснащение В Китае стартовало производство компактвэна «в стиле SUV» местной марки Baojun. Ожидается, что позже модель начнут выпускать и с эмблемами Chevrolet.

Август Борисов

17-07-2019 04:25

Информационные технологии

Подробнее