Facebook запатентовал новую систему распознавания речи без участия людей

Технология будет самообучаться без текстовых расшифровок и ручного перевода. Таким образом социальная сеть может создать бюджетный и быстрый переводчик для редких языков, а также систему для распознавания речи.

Как сообщает англоязычное издание The Machine, рабочее название новой системы Facebook – Wav2vec-U. В нее достаточно загрузить образцы речи и случайный отрывок текста на нужном языке. Из данных программа сама соотнесет повторяющиеся слова и фразы, а также соотнесет их с базой словарей. 

На данный момент все похожие технологии работают только с расшифровками голосовых сегментов. Их готовят переводчики или носители языка вручную. Новая технология работает так, что в процессе работы пытается прийти к полному соответствию между звуковыми сочетаниями и записанными словами.

На данный момент усилиями инженеров социальной сети Wav2vec-U знает суахили, киргизский и крымско-татарский языки. Она выдает на 63% меньше ошибок, чем предыдущая система такого же типа. В качестве исходных данных ей дали 9,6 часов речи и 3000 написанных фраз. 


Если ты увидел что-то интересное, выиграл грант или стал очевидцем события, расскажи нам об этом:
Portal072@gmail.com
8 (3452) 68-34-55 /
VK / Instagram

Оцените материал: