Разговоры с гаджетами: шизофрения или глобальный тренд?

Разговоры с гаджетами: шизофрения или глобальный тренд?

@mts24blog

Недавно в Лас-Вегасе завершилась выставка электроники CES 2017, одной из главных тем которой стали голосовые помощники. Лайф выяснил, почему эти ассистенты набрали такую популярность и когда мода на общение с гаджетами дойдёт до России.

Семь лет вся IT-индустрия только и говорила, что о Siri. Амбициозная команда разработчиков презентовала самое перспективное приложение того времени — голосового ассистента, который умел разговаривать с владельцем смартфона. За распознавание речи отвечала компания Nuance (самая крупная на этом рынке), а информация для ответов зачастую бралась из WolframAlpha (сервис с фантастическим объёмом важной статистики).

Дизайн Siri был достаточно примитивным, зато функциональность на тот момент поражала. Как и сама идея - голосовой ввод информации в машину это самый "человеческий" и самый технически сложный способ, т.е. его реализация говорит о том, что будущее уже здесь. Неудивительно, что спустя три месяца после релиза стартап перешёл под крыло Apple — по слухам, компания из Купертино заплатила за свою долю 200–300 миллионов долларов. Как выяснилось, сделка получилась взаимовыгодной. Уже через полтора года Apple анонсировала iPhone 4S (S — Siri) — первый смартфон с голосовым помощником.

По сравнению с оригинальной версией ассистент ощутимо поглупел: на многие вопросы он отвечал "Я не понял" или "Я не знаю". Причина этого вынужденного даунгрейда — нагрузка на сервера. Apple боялась, что чересчур умная Siri будет слишком медлительной — это отпугнуло бы пользователей даже сильнее, чем тупость помощника.

iPhone сразу же стал сверхпопулярным, и конкуренты связали этот триумф в том числе и с Siri. Вскоре Samsung анонсировала ассистент под названием S Voice, а Google научила смартфоны отвечать голосом на реплику "Окей, Google" (аналог — "Привет, Siri").

В 2014-м для создания собственного помощника созрела и Microsoft. Её Cortana отличалась от других подобных приложений тем, что сразу же умела работать и на компьютере. Наконец, в конце того же 2014-го Amazon презентовал домашнего ассистента по имени Alexa. Этого помощника встроили в колонку Amazon Echo — специальный гаджет, выпущенный исключительно для общения с владельцем и выполнения его команд.

Кадр фильма "Она"/ © Кинопоиск

Сейчас расклад сил в сфере актуальных голосовых ассистентов выглядит так:

1. Siri — самый популярный, но один из самых нефункциональных помощников (например, нельзя даже выключить LTE). Во-первых, его достаточно долго не улучшали (максимум — перевод на другие языки). Во-вторых, Apple слишком затянула с предоставлением доступа к Siri для сторонних приложений. В-третьих, Siri — преимущественно телефонный ассистент: программы для Mac всё ещё не интегрированы. При этом глупо спорить с тем, что голосовой секретарь от Apple всё равно самый практичный. Он может быть действительно полезным, если пользователь тщательно подойдёт к формулированию запросов.

2. Alexa — ассистент с самым приятным голосом и самым явным потенциалом. Amazon создала для своего помощника специальный магазин приложений, поэтому функциональность колонки Echo можно постоянно расширять. Например, скачать читалку для соцсети Twitter (записи будут произноситься вслух), управлять любыми элементами умного дома или запускать двигатель автомобиля. Программ для Alexa уже несколько тысяч, но поддержки русского языка в них нет, потому что Amazon вообще не работает с нашей страной.

3. Google Voice Search — надстройка над обычным поиском, которая выслушивает запросы и готовит ответы в виде карточек. Основное преимущество в том, что ответ есть всегда. Если его вдруг не обнаруживается, Voice Search просто показывает результаты на странице поисковика. Среди конкурентов у этого помощника однозначно лучшее распознавание речи.

4. Cortana — помощник от Microsoft с неплохим распознаванием голоса. Главный минус — ассистентом не пользуются на смартфонах, потому что смартфонов на Windows фактически не осталось, а приложения для iOS и Android по понятным причинам остаются невостребованными. Русский язык в Cortana тоже отсутствует. 

5. Google Assistant — помощник, который появился вместе со смартфонами Pixel. По факту ничем не отличается от стандартного голосового поиска Google Now, но умеет вести диалоги с владельцем в стиле Siri. Есть небольшой плюс — Assistant встроен в мессенджер Allo в виде текстового чата. Впрочем, этим приложением никто не пользуется, так что польза тут относительная.

6. Google Home Assistant — самый продвинутый помощник, интегрированный в домашнюю колонку. Этот сервис возвышается над всеми остальными за счёт того, что основан на технологиях глубинного обучения нейросетей. Соответственно, Home Assistant способен интерпретировать предложения и правильно реагировать на нестандартные запросы. С другой стороны, иногда вместо нужного действия (например, "Включи музыку") он внезапно активирует режим философа и начинает разговаривать с пользователем на высокодуховные темы. В Twitch даже есть стрим с двумя колонками от Google, которые просто общаются обо всём подряд.

7. Viv — новое поколение ассистента от разработчиков Siri, уволенных из Apple. Всю команду вовремя перекупила Samsung, и теперь эти люди трудятся над лучшим голосовым помощником на рынке. Вероятно, первую версию мы увидим уже в Samsung Galaxy S8.

Как можно заметить, все голосовые секретари отличаются не только по платформам и функциональности, но и по принципу работы. Большинство (от Siri до Assistant) в ответ на запрос пользователя обращаются к огромной базе заготовок. На данный момент это приемлемо, но перспектив у такого решения мало: новые ответы добавляются вручную, спектр поиска всегда ограничен. Гораздо интереснее наблюдать за прогрессом Google Home Assistant — колонки, которая накапливает опыт и в процессе общения учится понимать пользователя.

Например, Amazon Echo периодически вляпывается в нелепые истории со случайно заказанными в Интернете вещами: человек просто произносит название продукта, а колонка сразу же оформляет покупку. C помощником от Google таких ситуаций возникать не должно, потому что он способен понимать контекст. Но до того момента, когда Home Assistant настолько поумнеет, пройдёт ещё несколько лет.

Нынешний же тренд основан в первую очередь на прогрессе технологий умного дома и большом выборе приложений для Amazon Alexa. К слову, на CES 2017 сообщили, что теперь этот помощник встроен в смартфон Huawei Mate 9. Так китайцы подготовились к внедрению Viv в Galaxy S8. Если верить презентации, новый голосовой ассистент станет симбиозом Siri и Home Assistant — у него в распоряжении будет и обширная база с готовыми ответами, и технология глубинного обучения.

Кадр фильма "Она"/ © Кинопоиск

Когда со смартфонами заговорят в России?

Несмотря на популярность мема "Окей, Google" и наличие русского языка в Siri, у нас откровенно не принято болтать с электронными устройствами. У этой особенности есть три объяснения:

1. В России в принципе считается странным говорить что-либо в микрофон телефона, если вокруг есть люди. Чтобы избавить себя от их назойливых вопросов и косых взглядов, проще сделать нужную операцию пальцами, а не открывать рот. К Siri прибегают только в крайних случаях — например, на морозе, когда не хочется снимать перчатки, но нужно кому-то позвонить.

2. Siri ещё недостаточно хорошо распознаёт голос. Сейчас уровень точности далёк от 100%. Увы, одна случайная ошибка напрочь отбивает желание пользоваться помощником.

3. На русском языке формулировать короткие запросы тяжелее, чем на английском. Соответственно, человеку проще напечатать запрос в окне поиска, чем думать, как задать вопрос Siri, чтобы она поняла и всё сделала правильно.

С одной стороны, это печально: пока на Западе осваивают голосовое управление, мы угрюмо тыкаем в экран. Но, с другой стороны, как только помощники научатся полноценно общаться с пользователем, их переведут на все языки и наша страна не останется обделённой.

Процесс привыкания тоже не займёт много времени — уже можно готовиться к тому, что в течение 3–5 лет разговоры со смартфонами и умными колонками станут обыденностью.

А пока в России больше любят слушать смартфон, а не говорить с ним. Например, питерский Центр речевых технологий, который в основном делает продукты для работы с голосом, предназначенные для российских и иностранных госструктур, пять лет назад представил удобное и практичное приложение "Читатель". Его основная функция – превращение любой литературы в аудиокнигу: текстовый файл можно воспроизводить с разной скоростью и разными голосами. При этом в разработке использовались фирменные движки ЦРТ, благодаря которым нет проблем с интонационной, смысловой и эмоциональной окраской.


Еще много интересных новостей на @mts24blog

Report Page