wav2vec Unsupervised: система распознавания речи от Facebook

Компания представила новую технологию по распознаванию речи.

wav2vec Unsupervised: система распознавания речи от Facebook

wаv2vec-U является системой речи, разработанной компанией Facebook. По данным разработчиков, для работы системы достаточно загрузить текст на определенном языке и образцы речи, после этого система самостоятельно сможет распознать отдельные слова, а также фразы используя словарь.

Тестирование системы прошло на таких языках как татарский, а также на суахили. Именно для этих языков сейчас недоступна технология по распознаванию речи, так как отсутствуют нужные обучающие данные для систем. wаv2vec-U удалось более чем на 60% выдать меньше ошибок, по сравнению с предыдущей технологией, которую также тестировали на данных языках. Для распознавания данных языков было задействовано 3 тыс. фраз и почти 10 часов аудио речи.

Первоначально система изучает структуру речи из аудио отрывка. После этого идет разделение данного аудио на единицы речи. Для распознавания слов была специально обучена генеративная состязательная речь. Как отмечают в компании, первоначальные результаты были неутешительны, но через время им удалось достичь более высоких результатов. Чтобы достичь результатов, представленных в wаv2vec-U, компания работала несколько лет.

Обсудить и заказать можно через форму ниже

wav2vec Unsupervised: система распознавания речи от Facebook
Создание недорогих сайтов
Добавить комментарий