
Голосовые ассистенты и интернет: как технологии меняют нашу жизнь?
Siri, Google Assistant,Alexa и Алиса — эти имена отлично знакомы современным людям. Большинство хотя бы раз пользовались услугами голосового помощника, а многие делают это регулярно. В этом обзоре давайте рассмотрим преимущества голосовых ассистентов, особенности их эксплуатации, примеры использования и историю развития технологии.
Этапы появления и совершенствования голосовых ассистентов
Идея зародилась почти одновременно с появлением первых компьютеров. Уже тогда инженеры поняли, что вводить команды голосом намного удобнее, чем с помощью использовавшихся на тот момент способов. Первый голосовой помощник появился в 1961 году. Компьютер IBM Shoebox умел распознавать цифры от девяти до нуля, а также шесть голосовых команд — плюс, минус, промежуточный итог, неверно, итог, выключить. С их помощью ЭВМ выполняла сложные математические расчеты.
Технологии совершенствовались, и уже в 1972 в Университете Карнеги-Меллона экспериментаторы провели шахматную партию против компьютера, используя только голосовые команды. Система, которую спроектировали ученые, умела распознавать более 1000 команд, что отвечает словарному запасу трехлетнего ребенка.
В 1990 году появился Dragon Dictate — девайс для распознавания голосовых команд, разработанное компанией Nuance Communications и ориентированное на рядовых пользователей. Стоило такое удовольствие 9000 долларов и представляло собой печатную машинку, работающую по голосовому вводу. Базовый словарный запас устройства составлял более 30 тысяч слов.
Уже в 2011 году случился самый настоящий прорыв в сфере искусственного интеллекта в целом и голосовых помощников в частности. Суперкомпьютер Watson, созданный компанией IBM, победил двух рекордсменов американской викторины Jeopardy! (у нас локализована под названием «Своя игра»). Компьютер не был подключен к интернету и отвечал на вопросы, оперируя знаниями, которые он получил при индексации колоссального количества текстовых материалов.
В этом же году компанией Apple представлена первая версия голосового помощника Siri. Алгоритм распознавания речи для нее был создан Nuance Communications, которые за десятилетия сильно поднаторели в этой сфере. Интеграция Siri с сенсорным смартфоном по-настоящему раскрыла потенциал голосового помощника. Поначалу он умел только вводить распознанную речь в виде текстовых символов, но по мере развития алгоритмов искусственного интеллекта список доступных опций значительно увеличился.
Сравнение голосовых ассистентов Siri, Alexa, Алиса и Google Assistant
Давайте сравним одни из популярных в мире голосовых ассистентов и рассмотрим доступные функции.
Siri
Разработана и поддерживается компанией Apple. Появилась в 2011 как виртуальный голосовой ассистент на умных гаджетах этого бренда. Управлять Siri можно как с помощью голосовых команд и жестов, так и нажатием кнопок. Используется система обработки речи, благодаря которой ассистент понимает запросы и выдает ответы на них, дает рекомендации, управляет работой интегрированных девайсов и выполняет прочие функции.
На вопросы владельца Siri отвечает с помощью встроенного генератора речи, дублируя информацию на экране гаджета. Ассистента можно использовать для диктовки электронных писем, СМС и сообщений других типов, обработки входящих сообщений. Одно из преимуществ ассистента от Apple — идентификация речи и способность отвечать более чем на 20 языках. Для запуска достаточно рядом с гаджетом произнести фразу-активатор «Hey Siri».
Не менее важной является система понимания контекста, которая делает голосового ассистента чрезвычайно сообразительным. Благодаря такой особенности Siri легко адаптируется к привычкам, распорядку дня, речевым оборотам и прочим чертам владельца, запоминая часто используемые слова и выражения. Зная контекст, Сири буквально понимает пользователя с полуслова, предоставляя персонализированные ответы на запросы.
Alexa
Этот виртуальный ассистент выпущен компанией Amazon в 2014 году. Если сравнить с Siri, Alexa на американском рынке лидирует с более чем 60-процентной долей, и длится это уже в течение нескольких лет. Такую популярность голосовой ассистент обрел во много благодаря умной колонке Amazon Echo, выступающей в роли центрального хаба для AI помощника. В отличие от Siri, ориентированной на продукцию Apple, Alexa легко интегрируется в девайсы сторонних производителей, за что разработчик получает свою долю прибыли. Ее можно увидеть во многих предметах электроники: смартфонах, планшетах, смарт-телевизорах, медиацентрах и подобном. Кроме того, Alexa доступна для скачивания с Google Play и App Store.
На большинстве устройств помощник активируется фразой, которую можно настроить под себя, но которая должна начинаться с имени Alexa. В некоторых гаджетах для активации требуется нажать предназначенную для этого отдельную кнопку. Виртуальный ассистент поддерживает 8 языков. Главное его преимущество — большее количество навыков, если сравнить с другими ИИ помощниками. Сегодня их количество перевалило за 30 тысяч — во многом благодаря тому, что поддерживаются навыки от сторонних разработчиков, устанавливаемые с помощью модуля Alexa Skills Kit. Интересный факт: в 2018 году Alexa получила премию Большого Брата в Германии. Награда названа в честь одного из персонажей антиутопии Джорджа Оруэлла «1984» и вручается за самое грубое нарушение неприкосновенности частной жизни и свободы граждан.
Google Assistant
«Корпорация добра» не спешила с внедрением голосовых помощников и предпочла учиться на опыте конкурентов. Google Assistant появился позже всех — в 2016 году. Сегодня этот голосовой помощник доступен на всех устройствах, работающих на Android, на умных колонках Google Home, а также интегрирован в ряд сервисов, доступных пользователям интернета.
Google Assistant разработан на базе системы персонализированного поиска Google Now. Как и прочие AI помощники, он использует технологии распознавания голоса, когнитивных вычислений и машинного обучения. Активируется с помощью кнопки на старых девайсах или с помощью голосовой команды «OK, Google!». Является большим полиглотом по сравнению с конкурентами, так как умеет распознавать более 40 языков.
Алиса
Голосовой помощник Алиса, созданный компанией Яндекс, впервые появился в 2017 году. Он быстро завоевал популярность среди пользователей в России благодаря естественному голосу и способности поддерживать диалог. В отличие от западных аналогов, Алиса изначально адаптирована под русский язык и локальные сервисы, что делает ее особенно удобной. Кстати, интересно, что разработчики использовали нейросеть для обучения помощника, а не традиционные алгоритмы.
Запускается Алиса фразой «Привет, Алиса» или нажатием специальной кнопки в приложении. Ее можно встретить в смартфонах, компьютерах, умных колонках Яндекса, а также в автомобилях и даже бытовой технике.
Главная особенность помощника — умение вести диалог и адаптироваться к стилю общения собеседника. Алиса поддерживает десятки тысяч навыков, которые позволяют ей заказывать еду, включать музыку, искать информацию в интернете и даже играть в словесные игры. Примечательно, что она умеет распознавать контекст разговора, чего не хватает многим ее конкурентам.
Еще один плюс — интеграция с сервисами Яндекса: помощник может строить маршруты в Навигаторе, искать товары на Маркете, напоминать о делах через Календарь и даже зачитывать новости. Несмотря на многочисленные преимущества, помощник не идеален. Например, иногда он путается в сложных фразах или не понимает сарказм. Однако разработчики регулярно обновляют систему, улучшая её возможности.
Алиса продолжает развиваться, и с каждым обновлением она становится умнее. Кто знает, возможно, в будущем она сможет поддерживать полноценный разговор не хуже человека.
Какой из голосовых помощников лучше?
Рассматривая виртуальных ассистентов, нужно учитывать, что каждый из них обладает своими преимуществами и недостатками. Они не зря считаются топовыми, ведь созданы крупнейшими технологическими компаниями с огромным опытом. Однозначного лидера или аутсайдера выделить сложно — многое зависит от экосистемы, в которой вы привыкли работать.
На наш взгляд, самым универсальным и функциональным можно считать Google Assistant. Он поддерживает множество устройств, хорошо понимает контекст и умеет выполнять сложные команды. Однако раскрывает свой потенциал в основном на гаджетах с Android. Если же вы приверженец Apple, то ваш выбор очевиден — Siri. Она идеально интегрирована в экосистему iPhone, Mac и других устройств бренда.
Для управления системой «Умный дом» многие рекомендуют Alexa. Она легко подключается к различной технике и поддерживает десятки тысяч сторонних навыков. Однако если говорить о российском рынке, то особого внимания заслуживает Алиса от Яндекса. В отличие от западных конкурентов, она с самого начала была адаптирована под русский язык, а также глубоко интегрирована с сервисами Яндекса.
Алиса умеет вести естественные диалоги, поддерживает тысячи навыков, помогает в поиске информации, маршрутов и товаров. Она доступна на смартфонах, компьютерах, в умных колонках и даже в автомобилях. Кроме того, помощник умеет шутить, петь песни и иногда выдавать весьма неожиданные ответы.
Выбор голосового ассистента зависит от ваших предпочтений и задач. Если вам важна интеграция с российскими сервисами и живое общение, Алиса — отличный вариант. Для работы в экосистеме Apple лучше выбрать Siri, для умного дома — Alexa, а для универсального использования — Google Assistant.
Примеры использования голосовых ассистентов
Несколько примеров того, как использовать голосового помощника в разных сферах:
- Искать информацию в интернете — новости, прогнозы погоды, результаты спортивных матчей и многое другое;
- Обрабатывать голосовые вызовы, входящие и исходящие;
- Добавлять задачи в календарь и напоминать о них;
- Получать голосовые команды для умного дома и на их основании управлять подключенными в систему смарт-устройствами;
- Создавать и отправлять текстовые сообщения через разные каналы;
- Составлять маршруты на карте, учитывая разные способы перемещения;
- Проверять авиарейсы и бронировать билеты;
- Подбирать отели, рестораны и увеселительные заведения;
- Рекомендовать развлекательный контент — музыку, подкасты, фильмы, игры и прочее;
- Управлять функциями устройства — сделать снимок, запустить таймер и т.д.;
- Выполнять переводы между поддерживаемыми языками;
- Устанавливать и удалять приложения;
- Управлять транзакциями в платежных системах;
- Заказывать доставку еду и прочих товаров;
- Зачитывать входящие текстовые сообщения.
Такой функционал делает эксплуатацию гаджетов намного удобнее и значительно расширяет возможности, доступные пользователю.
Тренды, прогнозы и вызовы в будущем
Будущее голосовых технологий, конечно же, за нейросетями. Интеграция с ними, в частности, продвинутым чат-ботом ChatGPT, значительно расширила возможности современных голосовых помощников, сделав их еще умнее и позволив выполнять больше бытовых, контентных и коммуникационных задач. В перспективе — акцент на гиперперсонализации ассистента под владельца, расширение списка поддерживаемых языков и развитие эмоционального интеллекта, то есть понимания эмоций, намерений и желаний пользователя.
Бизнес-сегмент активно заменяет коммуникацию с клиентами силами сотрудников колл-центров голосовыми ассистентами, что экономит время и деньги. Многие рутинные задачи уже сегодня можно доверить ИИ, что избавит от лишних расходов на оптимизацию рабочих процессов.
Заключение. Итоговое резюме и выводы
Человек несовершенен и часто делает ошибки. ИИ ассистенты, созданные людьми, пускай и талантливыми, тем более несовершенны. Слепо полагаться на их помощь нерационально — нужно, в первую очередь, уметь мыслить критически и думать своей головой, особенно в экстренных ситуациях. Однако у этой технологии большое будущее. Голосовые ассистенты прочно вошли в нашу жизнь и вряд ли уже исчезнут — наоборот, станут только лучше и сумеют реализовать больше опций.