Голосовые ассистенты и интернет: как технологии меняют нашу жизнь?

Siri, Google Assistant,Alexa и Алиса — эти имена отлично знакомы современным людям. Большинство хотя бы раз пользовались услугами голосового помощника, а многие делают это регулярно. В этом обзоре давайте рассмотрим преимущества голосовых ассистентов, особенности их эксплуатации, примеры использования и историю развития технологии.

Этапы появления и совершенствования голосовых ассистентов

Идея зародилась почти одновременно с появлением первых компьютеров. Уже тогда инженеры поняли, что вводить команды голосом намного удобнее, чем с помощью использовавшихся на тот момент способов. Первый голосовой помощник появился в 1961 году. Компьютер IBM Shoebox умел распознавать цифры от девяти до нуля, а также шесть голосовых команд — плюс, минус, промежуточный итог, неверно, итог, выключить. С их помощью ЭВМ выполняла сложные математические расчеты.

Технологии совершенствовались, и уже в 1972 в Университете Карнеги-Меллона экспериментаторы провели шахматную партию против компьютера, используя только голосовые команды. Система, которую спроектировали ученые, умела распознавать более 1000 команд, что отвечает словарному запасу трехлетнего ребенка.

В 1990 году появился Dragon Dictate — девайс для распознавания голосовых команд, разработанное компанией Nuance Communications и ориентированное на рядовых пользователей. Стоило такое удовольствие 9000 долларов и представляло собой печатную машинку, работающую по голосовому вводу. Базовый словарный запас устройства составлял более 30 тысяч слов.

Уже в 2011 году случился самый настоящий прорыв в сфере искусственного интеллекта в целом и голосовых помощников в частности. Суперкомпьютер Watson, созданный компанией IBM, победил двух рекордсменов американской викторины Jeopardy! (у нас локализована под названием «Своя игра»). Компьютер не был подключен к интернету и отвечал на вопросы, оперируя знаниями, которые он получил при индексации колоссального количества текстовых материалов.

В этом же году компанией Apple представлена первая версия голосового помощника Siri. Алгоритм распознавания речи для нее был создан Nuance Communications, которые за десятилетия сильно поднаторели в этой сфере. Интеграция Siri с сенсорным смартфоном по-настоящему раскрыла потенциал голосового помощника. Поначалу он умел только вводить распознанную речь в виде текстовых символов, но по мере развития алгоритмов искусственного интеллекта список доступных опций значительно увеличился.

Сравнение голосовых ассистентов Siri, Alexa, Алиса и Google Assistant

Давайте сравним одни из популярных в мире голосовых ассистентов и рассмотрим доступные функции.

Siri

Разработана и поддерживается компанией Apple. Появилась в 2011 как виртуальный голосовой ассистент на умных гаджетах этого бренда. Управлять Siri можно как с помощью голосовых команд и жестов, так и нажатием кнопок. Используется система обработки речи, благодаря которой ассистент понимает запросы и выдает ответы на них, дает рекомендации, управляет работой интегрированных девайсов и выполняет прочие функции.

На вопросы владельца Siri отвечает с помощью встроенного генератора речи, дублируя информацию на экране гаджета. Ассистента можно использовать для диктовки электронных писем, СМС и сообщений других типов, обработки входящих сообщений. Одно из преимуществ ассистента от Apple — идентификация речи и способность отвечать более чем на 20 языках. Для запуска достаточно рядом с гаджетом произнести фразу-активатор «Hey Siri».

Не менее важной является система понимания контекста, которая делает голосового ассистента чрезвычайно сообразительным. Благодаря такой особенности Siri легко адаптируется к привычкам, распорядку дня, речевым оборотам и прочим чертам владельца, запоминая часто используемые слова и выражения. Зная контекст, Сири буквально понимает пользователя с полуслова, предоставляя персонализированные ответы на запросы.

Alexa

Этот виртуальный ассистент выпущен компанией Amazon в 2014 году. Если сравнить с Siri, Alexa на американском рынке лидирует с более чем 60-процентной долей, и длится это уже в течение нескольких лет. Такую популярность голосовой ассистент обрел во много благодаря умной колонке Amazon Echo, выступающей в роли центрального хаба для AI помощника. В отличие от Siri, ориентированной на продукцию Apple, Alexa легко интегрируется в девайсы сторонних производителей, за что разработчик получает свою долю прибыли. Ее можно увидеть во многих предметах электроники: смартфонах, планшетах, смарт-телевизорах, медиацентрах и подобном. Кроме того, Alexa доступна для скачивания с Google Play и App Store.

На большинстве устройств помощник активируется фразой, которую можно настроить под себя, но которая должна начинаться с имени Alexa. В некоторых гаджетах для активации требуется нажать предназначенную для этого отдельную кнопку. Виртуальный ассистент поддерживает 8 языков. Главное его преимущество — большее количество навыков, если сравнить с другими ИИ помощниками. Сегодня их количество перевалило за 30 тысяч — во многом благодаря тому, что поддерживаются навыки от сторонних разработчиков, устанавливаемые с помощью модуля Alexa Skills Kit. Интересный факт: в 2018 году Alexa получила премию Большого Брата в Германии. Награда названа в честь одного из персонажей антиутопии Джорджа Оруэлла «1984» и вручается за самое грубое нарушение неприкосновенности частной жизни и свободы граждан.

Google Assistant

«Корпорация добра» не спешила с внедрением голосовых помощников и предпочла учиться на опыте конкурентов. Google Assistant появился позже всех — в 2016 году. Сегодня этот голосовой помощник доступен на всех устройствах, работающих на Android, на умных колонках Google Home, а также интегрирован в ряд сервисов, доступных пользователям интернета.

Google Assistant разработан на базе системы персонализированного поиска Google Now. Как и прочие AI помощники, он использует технологии распознавания голоса, когнитивных вычислений и машинного обучения. Активируется с помощью кнопки на старых девайсах или с помощью голосовой команды «OK, Google!». Является большим полиглотом по сравнению с конкурентами, так как умеет распознавать более 40 языков.

Алиса

Голосовой помощник Алиса, созданный компанией Яндекс, впервые появился в 2017 году. Он быстро завоевал популярность среди пользователей в России благодаря естественному голосу и способности поддерживать диалог. В отличие от западных аналогов, Алиса изначально адаптирована под русский язык и локальные сервисы, что делает ее особенно удобной. Кстати, интересно, что разработчики использовали нейросеть для обучения помощника, а не традиционные алгоритмы.

Запускается Алиса фразой «Привет, Алиса» или нажатием специальной кнопки в приложении. Ее можно встретить в смартфонах, компьютерах, умных колонках Яндекса, а также в автомобилях и даже бытовой технике.

Главная особенность помощника — умение вести диалог и адаптироваться к стилю общения собеседника. Алиса поддерживает десятки тысяч навыков, которые позволяют ей заказывать еду, включать музыку, искать информацию в интернете и даже играть в словесные игры. Примечательно, что она умеет распознавать контекст разговора, чего не хватает многим ее конкурентам.

Еще один плюс — интеграция с сервисами Яндекса: помощник может строить маршруты в Навигаторе, искать товары на Маркете, напоминать о делах через Календарь и даже зачитывать новости. Несмотря на многочисленные преимущества, помощник не идеален. Например, иногда он путается в сложных фразах или не понимает сарказм. Однако разработчики регулярно обновляют систему, улучшая её возможности.

Алиса продолжает развиваться, и с каждым обновлением она становится умнее. Кто знает, возможно, в будущем она сможет поддерживать полноценный разговор не хуже человека.

Какой из голосовых помощников лучше?

Рассматривая виртуальных ассистентов, нужно учитывать, что каждый из них обладает своими преимуществами и недостатками. Они не зря считаются топовыми, ведь созданы крупнейшими технологическими компаниями с огромным опытом. Однозначного лидера или аутсайдера выделить сложно — многое зависит от экосистемы, в которой вы привыкли работать.

На наш взгляд, самым универсальным и функциональным можно считать Google Assistant. Он поддерживает множество устройств, хорошо понимает контекст и умеет выполнять сложные команды. Однако раскрывает свой потенциал в основном на гаджетах с Android. Если же вы приверженец Apple, то ваш выбор очевиден — Siri. Она идеально интегрирована в экосистему iPhone, Mac и других устройств бренда.

Для управления системой «Умный дом» многие рекомендуют Alexa. Она легко подключается к различной технике и поддерживает десятки тысяч сторонних навыков. Однако если говорить о российском рынке, то особого внимания заслуживает Алиса от Яндекса. В отличие от западных конкурентов, она с самого начала была адаптирована под русский язык, а также глубоко интегрирована с сервисами Яндекса.

Алиса умеет вести естественные диалоги, поддерживает тысячи навыков, помогает в поиске информации, маршрутов и товаров. Она доступна на смартфонах, компьютерах, в умных колонках и даже в автомобилях. Кроме того, помощник умеет шутить, петь песни и иногда выдавать весьма неожиданные ответы.

Выбор голосового ассистента зависит от ваших предпочтений и задач. Если вам важна интеграция с российскими сервисами и живое общение, Алиса — отличный вариант. Для работы в экосистеме Apple лучше выбрать Siri, для умного дома — Alexa, а для универсального использования — Google Assistant.

Примеры использования голосовых ассистентов

Несколько примеров того, как использовать голосового помощника в разных сферах:

  • Искать информацию в интернете — новости, прогнозы погоды, результаты спортивных матчей и многое другое;
  • Обрабатывать голосовые вызовы, входящие и исходящие;
  • Добавлять задачи в календарь и напоминать о них;
  • Получать голосовые команды для умного дома и на их основании управлять подключенными в систему смарт-устройствами;
  • Создавать и отправлять текстовые сообщения через разные каналы;
  • Составлять маршруты на карте, учитывая разные способы перемещения;
  • Проверять авиарейсы и бронировать билеты;
  • Подбирать отели, рестораны и увеселительные заведения;
  • Рекомендовать развлекательный контент — музыку, подкасты, фильмы, игры и прочее;
  • Управлять функциями устройства — сделать снимок, запустить таймер и т.д.;
  • Выполнять переводы между поддерживаемыми языками;
  • Устанавливать и удалять приложения;
  • Управлять транзакциями в платежных системах;
  • Заказывать доставку еду и прочих товаров;
  • Зачитывать входящие текстовые сообщения.

Такой функционал делает эксплуатацию гаджетов намного удобнее и значительно расширяет возможности, доступные пользователю.

Тренды, прогнозы и вызовы в будущем

Будущее голосовых технологий, конечно же, за нейросетями. Интеграция с ними, в частности, продвинутым чат-ботом ChatGPT, значительно расширила возможности современных голосовых помощников, сделав их еще умнее и позволив выполнять больше бытовых, контентных и коммуникационных задач. В перспективе — акцент на гиперперсонализации ассистента под владельца, расширение списка поддерживаемых языков и развитие эмоционального интеллекта, то есть понимания эмоций, намерений и желаний пользователя.

Бизнес-сегмент активно заменяет коммуникацию с клиентами силами сотрудников колл-центров голосовыми ассистентами, что экономит время и деньги. Многие рутинные задачи уже сегодня можно доверить ИИ, что избавит от лишних расходов на оптимизацию рабочих процессов.

Заключение. Итоговое резюме и выводы

Человек несовершенен и часто делает ошибки. ИИ ассистенты, созданные людьми, пускай и талантливыми, тем более несовершенны. Слепо полагаться на их помощь нерационально — нужно, в первую очередь, уметь мыслить критически и думать своей головой, особенно в экстренных ситуациях. Однако у этой технологии большое будущее. Голосовые ассистенты прочно вошли в нашу жизнь и вряд ли уже исчезнут — наоборот, станут только лучше и сумеют реализовать больше опций.

Вернуться назад