Google создал распознание голоса оффлайн

Google создали автономную систему распознавания речи, которая быстрее и точнее, чем сопоставимые системы, что подключены к Интернету. В то время как многие аналоги так и остаются на бумаге, новая система уже запущена и протестирована на Nexus 5.

Google создал распознание голоса оффлайн
В настоящее время, Google App имеет очень ограниченные возможности в автономном режиме. Более сложные команды должны быть отправлены на сервер, где и подвергнуться обработке. Это приводит к ошибкам из-за ненадёжных сетей.

Альтернативой является “встроенная система распознавания речи, которая работает локально на мобильном устройстве. Однако, такая система может быть неточной и может потреблять значительный объём памяти и других ресурсов.

С помощью различных методов машинного обучения, Google создали систему объёмом 20.3 MB, которая в 7 раз быстрее, чем системы, что подключены к Интернету, а коэффициент ошибок составил всего 13.5%. Он был реализован и протестирован Nexus 5 с четырехъядерным процессором на частоте 2.26 ГГц и 2 GB оперативной памяти.

Для достижения такого размера и экономии ресурсов, система использует единую модель для диктовки и голосовых команд. Также были использованы дополнительные методы сжатия. Система прошла обучение по экспозиции до 3 миллионов анонимных голосовых сэмплов (около 2000 часов). Каждый речевой образец также имеет 20 искаженных версий, созданных путём извлечения шумов из видео YouTube.

В документе отмечается, что такая система не ограничивается только смартфонами, а также может использоваться носимыми устройствами. Будем надеяться, что такие улучшения будут появляться на смартфонах в ближайшем будущем.

Источник: 9to5Google