Проще сказать, чем набирать текст: как изменились голосовые помощники к 2021

Проще сказать, чем набирать текст: как изменились голосовые помощники к 2021

t.me/Finveritas


Добраться до момента, когда мы можем спросить у наших Apple Watch о рекомендациях поужинать поблизости, — нелегкий подвиг. Для этого потребовались десятилетия достижений в области обработки естественного языка на основе искусственного интеллекта, распознавания речи, вычислительных мощностей и беспроводных сетей. 

И все же мы только начинаем осознавать потенциал этих технологий. Управление голосом практически не требует предварительного изучения функционала, как когда мы обучались или учим наших родителей сейчас пользоваться интерфейсом смартфона. Устройства с голосовым управлением учатся приспосабливаться к нашему естественному поведению, а не наоборот.

Ожидается, что рынок распознавания голоса и речи будет расти на 17,2% в годовом исчислении и достигнет 26,8 млрд долларов к 2025 году. Между тем, искусственный интеллект — технология, которая лежит в основе голоса и во многих отношениях соответствует его истинному потенциалу, — стоимость ежегодно увеличивается на 5,8 триллиона долларов.


Как голосовые технологии перешли от разговоров к действиям

Разработка искусственного интеллекта и связанных с ним технологий сложна и требует больших затрат, поэтому мегакапитализированные гиганты, такие как Google, Apple и Amazon, стали первопроходцами и создали тем самым себе преимущество. Но они также создали прибыльные ниши в своих экосистемах для других компаний. 

Подобно тому, как iPhone породил экономику мобильных приложений стоимостью 6,3 триллиона долларов, такие платформы, как Alexa и Google Assistant, уже дали возможность разработчикам для создания более 100 000 «навыков» Alexa и 4000 приложений или действий Google Assistant. В предстоящие годы эта экосистема, вероятно, вырастет и станет конкурировать с традиционными приложениями по количеству и стоимости.

Осведомленность потребителей о голосовых помощниках с точки зрения всех существующих технологий и возможностей только зарождается. Тем не менее, нельзя отрицать, что голос — это будущее. 

По результатам исследования PwC, только 10% опрошенных никогда не пользовались устройствами с поддержкой голоса. Сегодня голосовые помощники используют, как более быстрый и простой способ выполнять повседневные дела. Для более серьезных операций, связанных с деньгами, пока предпочитают привычные способы.

Потребители чаще используют голосовых помощников на ранних этапах процесса покупки — 48% пользователей смартфона и 31% владельцев умной колонки используют голосовой помощник для поиска ресторана или магазина. Для заказа продуктов и еды — 19% опрошенных делают это со смартфона и 10% с помощью умной колонки. 

В России голосовыми ассистентами пользуются 30% граждан, из них 59% заказывают такси. Также три самых популярных услуги — это доставка еды (48%), а также покупка одежды и обуви (48%).


Голос — главный тренд 2021 года

Если четыре года назад соцсети запускали дополнительный функционал, позволяющий вести трансляции в прямом эфире. Сегодня наступила эра подкастов и голосовых чатов

Так, в феврале в России все заговорили о новой соцсети Clubhouse. 1 февраля 2021 года голосовая соцсеть насчитывала 2 млн пользователей, а ее стоимость оценивалась в $1 млрд. Пользователи приложения собираются в «комнаты», в которых есть спикеры и слушатели. Все взаимодействие происходит только голосом. Спикеры обсуждают какую-то тему, все остальные — внимают. При этом вставить свое слово может каждый, но только если разрешение на это даст модератор комнаты. Тогда слушатель сможет включить микрофон и вступить в беседу. 

Российские компании осознают, что голос — это растущий тренд. Уже сегодня 50 млн россиян используют голосовые ассистенты минимум раз в месяц.

 

В прошлом году «Сбер» выпустил ТВ-приставку SberBox со встроенным голосовым ассистентом. Он построен на базе искусственного интеллекта, включая голосовое взаимодействие, распознавание лиц, управление жестами рук и обнаружение жестов глазами. 

Сегодня самым популярным голосовым ассистентом в России является «Алиса» — 45 млн активных пользователей в месяц. Google Assistant используют около 7 млн россиян, Siri — 8 млн.

«Алиса» от Яндекса работает с десятками самых разных компаний. В октябре 2018 года первый банк в мессенджерах TalkBank запустил навык для «Алисы». С помощью голоса можно оформить банковскую карту, узнать текущий баланс и посмотреть анализ расходов за прошедший период. В будущем необанк планирует добавить перевод денег с помощью «Алисы», заказ дополнительных финансовых услуг и управление действующими продуктами.

Онлайн-рекрутинг платформа hh.ru разработала навык для «Алисы», который рассказывает о новых вакансиях и зарплатах. Школа английского Skyeng запустила игру в слова — тренажер помогает тренировать лексику и учить слова в контексте. Также компании используют навыки «Алисы» как канал связи с клиентом. Например, так сделали онлайн-магазин доставки продуктов «Утконос» и онлайн-площадка цветов Flowwow.

 

Голосовые ассистенты в банковской сфере

В колл-центрах многих крупных банков уже можно услышать голосового робота. В Банке Хоум Кредит работает голосовой помощник Мария, но только по телефону.

Голосовой помощник «Олег» Тинькофф Банка теперь работает не только в приложении, но и помогаетразгружать колл-центр. Сейчас он может подсказать актуальный баланс, помочь со сменой тарифа, отправить справку, заблокировать карту по просьбе клиента или отправить смс с номером договора. 

Пользователи необанка TalkBank уже в 2018 году получили возможность управлять счетом при помощи голосового ассистента «Алисы» в популярных мессенджерах. Клиентам нет необходимости устанавливать приложения и разбираться в интерфейсах, как это происходит в классических банках. Пользователи общаются с банком, как с другом, и дают команды не только текстом, но и голосом. 

Голосовое управление в чат-боте необанка появилось еще раньше. В марте 2014 года в Telegram появились голосовые сообщения, в 2017 TalkBank уже запустил управление своим счетом при помощи голоса. Сегодня таким образом можно выполнить все доступные банковские операции: запросить баланс, перевести деньги другу, создать шаблон частых платежей и другие. Голосовой сервис сокращает время финансовых манипуляций до минимума, освобождая драгоценные минуты для более важных дел.

Сегодня голосовые помощники достигли того уровня, когда мы можем не переживать о том, как построить фразу, с какой интонацией говорить, чтобы робот ее распознал. Современные технологии хорошо воспринимают голосовые обращения, могут учитывать даже тональность и настроение. Это дает возможность понимать не только отдельные распоряжения, но и контекст, в котором находится клиент. Таким образом компании могут работать с опережением — подбирать актуальные задачи и функции здесь и сейчас, а не заставлять пользователя перебирать различные опции, которые дает ему сервис.

 

Михаил Попов, СЕО TalkBank:

«Благодаря голосовым ассистентам, которые мы разработали для пользователей, представители поколения Z и даже люди преклонного возраста могут общаться с роботом также легко, как со своими друзьями или родственниками. Это позволяет пользоваться банковскими услугами без ограничений, делать качественный сервис и пожилым людям, и людям с ограниченными возможностями здоровья. Если посмотреть на существующие решения, то на рынке мало предложений для слабовидящих — они в значительной степени отрезаны от банковского обслуживания».

 

Так, в декабре Amazon объявила об интеграции Alexa с Voiceitt, израильским стартапом, поддерживаемым Amazon Alexa Fund, который позволяет людям с нарушениями речи обучать алгоритм распознавания их собственных уникальных голосовых паттернов. Интеграция, запуск которой запланирован на ближайшие месяцы, позволит людям с нетипичной речью управлять устройствами Alexa, разговаривая с приложением Voiceitt.

Apple Inc. заявила, что ее функция Hold to Talk, представленная на портативных устройствах в 2015 году, уже позволяет пользователям контролировать, как долго они хотят, чтобы голосовой помощник Siri слушал, не позволяя помощнику прерывать пользователей, которые заикаются, до того, как они закончат говорить.


Будущее за голосом

Несмотря на все достижения, мы все еще находимся в эре «Voice 1.0». В основном мы просто приказываем нашим устройствам выполнять простые задачи, например, поставить напоминание или включить любимую песню. На самом деле это только начало того, что возможно в будущем. 

Машинное обучение лежит в основе голосовых технологий, а искусственный интеллект становится умнее по мере того, как мы передаем ему все больше данных. Количество используемых голосовых устройств стремительно растет — продажи умных колонок выросли на 70% в период с 2018 по 2019 год. И это не считая миллиардов пользователей смартфонов, разговаривающих с Siri и Google Assistant. 

Amazon и Google могут вскоре поднять разговорные навыки машин на более глубокий уровень. Обе компании зарегистрировали патенты на технологию распознавания эмоций по голосам людей.

Например, в фильме Спайка Джонза «Она» рассказывается история одинокого писателя, который завел отношения со своей компьютерной операционной системой Самантой. Когда фильм вышел в 2013 году, общение с роботами казалось надуманным, но когда пандемия этого года изолировала миллионы людей, сотни тысяч скачали Replika, приложение с чат-ботом, который умеет дружить и даже стать романтическим партнером.

 


 


Report Page