Система распознавания речи Microsoft установила новый рекорд

Система распознавания речи Microsoft установила новый рекорд


Microsoft побила рекорд в распознавании речи. Теперь доля ошибок составляет лишь 5,1%. Предыдущий рекорд принадлежит IBM — 5,5% ошибок.


Microsoft объявила о том, что ей удалось добиться нового рекорда в распознавании речи — 5,1% ошибок, пишет TechCrunch. Прежний рекорд алгоритма от Microsoft составлял 5,9% ошибок.


Для тестирования системы был использован Switchboard corpus — сборник из 2400 телефонных разговоров. Он применяется для аналогичных задач с начала 1990-х годов. Исследователи хотели добиться такой же точности распознавания, как у людей, делающих распечатку аудиозаписи.

Доля ошибок алгоритма компании в прошлый раз составляла 5,9%. Теперь исследователям Microsoft удалось улучшить результаты до рекордных 5,1%. Кроме того, они позволили системе использовать целые разговоры, чтобы дать ей возможность адаптировать свои расшифровки к контексту и предсказывать, какие слова или фразы, скорее всего, последуют дальше.

Предыдущий рекорд в технологиях распознавания речи принадлежит IBM. Компании соревнуются, то и дело обгоняя друг друга. Весной IBM удалось снизить долю ошибок в компьютерном распознавании речи с 6,9%  до 5,5%, а до этого рекорд принадлежал Microsoft.


Report Page