Обзор бесплатных голосовых помощников для ПК на русском языке

Cortana для Windows

«Cortana» — голосовой помощник, интегрированный в операционную систему и созданный компанией Microsoft. Помощница предназначается прежде всего для Windows, но также в качестве приложений работает на платформах iOS, Android, Xbox One, Microsoft Phone, Microsoft Band. «Cortana» поможет систематизировать и распланировать ваши задачи и планы на определенный период, напоминает о выполнении каких-либо действий, предоставляет по вашему запросу информацию.

Также имеет встроенный функционал для ответов на общие вопросы, используя поиск Bing. В функционал входит прокладка маршрута, информация о состоянии дорог, поможет не опаздывать. Вводить информацию можно с помощью голоса и клавиатуры в текстовой форме. Она поддерживает разговор: поет песни, присылает анекдоты – не лишена чувства юмора.

К особенностям можно отнести такую функцию, как предугадывание желаний пользователя. Если дать доступ к личным данным, виртуальный помощник от Microsoft будет «подстраиваться» под вас, постоянно анализируя ваши действия: места, в которых вам нравится находиться; ваши предпочтения в тех или иных вещах; ваши долгосрочные интересы, хобби и многое другое.

Виртуальный ассистент Cortana тесно связана с операционной системой и может управлять Windows 10 и отдельными приложениями во время вашей работы: поможет прочитать Ваши электронные письма, отследить местоположение, проверить список контактов, следить за календарем, управлять музыкой и напоминания, охватывая многочисленные музыкальные приложения и контролируя звук в соответствии с  предпочтениями пользователя.

Есть возможно синхронизации нескольких устройств. Cortana будет поддерживать актуальность на нескольких компьютерах одновременно.

Проблемы мобильных голосовых помощников

Все мобильные голосовые ассистенты сегодня работают по принципу

— под одной кнопкой микрофона прячутся сотни и тысячи функций. Казалось бы — что удобнее? Не нужно держать под рукой десяток-другой иконок сторонних приложений. Просто нажал на микрофон, сказал — и

работает.

Но вот те проблемы, с которыми вы столкнетесь и как пользователь, и как разработчик голосовой функции для таких «помощников».

У каждого голосового «скила» (у Алисы — «навыка») должно быть

. Ведь иначе однокнопочный «комбайн» не может различать их между собой! И чем больше функций у голосового ассистента, тем сложнее подобрать такое название, чтобы пользователи его запомнили.

«Алиса, запусти навык Мой любимый магазин». Или «Okay Google, talk to Pizza Papa Johns». Знакомо? Пользователя еще нужно научить запускать ваш голосовой сервис.

Голосовой ассистент — это стороннее приложение со своими ограничениями. Вы, как разработчик, не сможете добавить в его интерфейс нужные вам контроллы и виджеты. В итоге — вы просто вынуждены работать с тем, что есть, хотя ваш функционал мог бы быть гораздо шире!

И много чего еще

Кроме этого, есть ограничения, накладываемые технологиями распознавания и синтеза речи, сложно авторизовать пользователя в вашем сервисе

В итоге — пользователь зачастую просто не может найти ваш голосовой сервис, не знает, как с ним разговаривать и сталкивается с ограниченностью функционала. А вам, как разработчику, непонятно, как вообще привести вашего пользователя в новый канал, который обещает миллионную аудиторию.

Алиса Яндекс (десктопная версия)

Алиса – голосовой помощник, устанавливаемый на ПК (Windows 7-10), Android и IOS. Алиса может показать прогноз погоды, найти данные об общественных местах, найти музыку, проводить конвертацию валют, решает несложные математические вычисления и может поддержать разговор.  Программа очень молодая и все время совершенствуется.

Поисковая строка Яндекс или другое название – Яндекс.Строка находится в панели задач операционной системы Windows. Поисковая строка Яндекс умеет находить на просторах Интернета информацию, которую пользователь вводить с помощью голоса или текста. Пользователь может задать команду открыть любую папку и документ, расположенные на компьютере.

Программа открывается на портативном компьютере с помощью нажатия кнопки Строки или же горячих клавиш. По сути это частный случай Алисы для ПК. Для экономии места на панели задач 8 см кнопку заменяют на иконку с микрофоном. Подробнее способах отображения помощника на ПК в статье Настройки Алисы для Windows.

Читать далее:  6 лучших стеновых панелей рейтинг 2020

Концепция in-app ассистента

Вам понятно, откуда там пользователь, и кто он. Какими функциями он пользуется, как их улучшать, развивать, и как это влияет на бизнес. За всем этим стоит ваша команда мобильной разработки, дизайнеры, UX-специалисты, QA-отдел и продуктовики.

А пользователю — понятно, какой функционал у вашего приложения.

и запускает то мобильное приложение, которое точно удовлетворит его потребность здесь и сейчас. Нет оснований полагать, что пользователь обязательно будет нажимать на кнопку микрофона в надежде на то, что голосовой ассистент имеет нужную ему функцию и выполнит его запрос!

Так и появилась концепция in-app ассистента — концепция голосового помощника, который работает уже внутри вашего мобильного приложения как дополнительный пользовательский интерфейс. В этом случае все ограничения ассистентов-комбайнов нивелируются, а пользователю становится понятен функционал помощника исходя из контекста мобильного приложения.

Typle — голосовое управление компьютером

Обзор бесплатных голосовых помощников для ПК на русском языке

Программа разработана для операционной системы Windows. Здесь не нужны знания английского языка, нет возможности работы с плеером и нет восприятия текстовой формы.  Из-за ограниченного количества функций программа кажется не такой эффективной и функциональной в использовании. Ограниченность помощника заключается в открывании лишь утилитов и Интернет-страниц.

Speaker – голосовой помощник и программное обеспечение, которое используется в операционной системе Windows. Программное обеспечение отличается от остальных более широким функционалом. Пользователь может открывать и закрывать различные папки на ПК, делать фото экрана. Для работы со «Speaker» необходимо иметь стабильное Интернет-соединение.

Кейсы in-app ассистента

Голосовая функция — точно так же ситуативна, как и запуск мобильного приложения. Пользователю может быть удобно запустить какую-то функцию голосом, если

  • Это новый пользователь, и он еще не разобрался со структурой UI вашего приложения
  • Пользователь не помнит, где спрятано нужное меню или кнопка
  • Если ему нужно просто повторить предыдущее действие
  • Если можно сказать два слова вместо 5-ти тапов и скроллов
  • Когда легче объяснить проблему, чем искать ее решение внутри приложения

Посмотрите на пару простых кейсов

Например, в банковском приложении можно переводить средства людям из списка контактов. In-app ассистент может понимать, кого пользователь имеет в виду, когда говорит «Переведи маме 500 рублей». А пользователю не нужно искать нужную кнопку, искать контакт и вводить сумму.

В приложении ритейлера пользователь может вызвать ассистента, чтобы просто описать проблему, а ассистент предложит нужный товар.

Здесь важно понимать, что такой голосовой интерфейс является только дополнительным к уже существующему UI. Как уже было сказано выше — ценность появится только там, где ассистент выступает в качестве «навигатора» или рекомендательной системы.

А так как это ваш собственный ассистент внутри вашего же приложения, то он не ограничен всем тем, что мы перечисляли выше в этой статье: не нужно придумывать уникальное имя, UI может быть любым, ассистент может взаимодействовать с функциями приложения напрямую и так далее.

Горыныч

Отечественная разработка голосового помощника, для управления ПК операционной системы Windows 7, XP, Vista. Размер 30,4 мб. Язык русский и английский.  В основе идеи лежит приложение «Dragon Dictate», которое создано западными специалистами. Голосовой помощник выполняет все среднестатистические команды, которые выполняют его аналоги.

С помощью голоса, пользователь может открывать любые папки в компьютере. Эта функция подобна функции из программы Typle. Особенностью голосового помощника «Горыныч» считается ввод текста в Word с помощью собственного голоса. Минус подобной функции в том, что речь пользователя должна быть без дефектов и четкой. Со временем программа запоминает голос владельца компьютера и начинает быстрее выполнять команды.

Проблемы мобильных голосовых помощников

История голосовых ассистентов начинается с конца 1930-х годов, когда ученые начали предпринимать попытки распознать голос силами технологий. Тогда созданию качественного помощника мешали две большие проблемы:

  • существование омонимов — слов с одинаковым звучанием, но с разным значением,
  • постоянный шумовой фон, из которого система должна выбирать речь пользователя.

1939 год. Советский физик Лев Мясников создал аппарат, способный распознавать человеческую речь — несколько гласных и согласных звуков.

1952 год. Сотрудники лаборатории Bell разработали механизм, который распознавал продиктованные по телефону числа от 1 до 9.

Первый голосовой распознаватель чисел, разработанный сотрудниками лаборатории Bell

1962 год.Компания IBM представила собственную технологию распознавания речи — Shoebox. Машина распознавала 16 английских слов, 10 цифр и 6 арифметических команд.

Презентация системы распознавания речи Shoebox от IBM

1980 год. Инженеры научились применять методы «Скрытой модели Маркова». Со временем это позволило голосовым системам лучше распознавать речь. Они обрабатывают слово, учитывая несколько предыдущих и предсказывая, что может с ними сочетаться.

#справка Скрытая модель Маркова описывает генерацию случайных событий в зависимости от текущего состояния объекта. Пример: человек может находиться в одном из четырех состояний и не в каждое их них может перейти сразу (схема ниже). Например, если человек лежит, то он не может моментально пойти куда-либо — нужно сесть, встать и только потом идти

Пример физических состояний человека, описанных в скрытой модели Маркова

1987 год. В США компания Worlds of Wonder начала продавать говорящую куклу Джулию, которая училась распознавать речь ребенка во время игры. В куклу был встроен процессор, который позволял ей реагировать и генерировать речь. Джули воспринимала восемь высказываний: «Джули», «да», «нет», «хорошо», «притворяйся», «голодна», «пой» и «молчи».

Голосовые помощники пассивно считывают все звуковые сигналы, и для активной работы им необходима активация при помощи кодовой фразы. Например, произнесите: «Окей, Google», потом можете задать свой вопрос или отдать команду без пауз.

Математик Ханна Фрай исследует, как работает программное обеспечение для распознавания голоса, используемое в в домашней технике.

В момент голосового запроса автоматическая система распознавания речи (ASR system) преобразовывает звуковой сигнал в текст. Это происходит в четыре этапа:

  • Фильтрация. Система убирает из звукового сигнала шумовой фон и помехи, возникающие при записи.
  • Оцифровывание. Звуковые волны преобразуются в понятный компьютеру цифровой вид. Параметры получаемого кода в том числе определяют качество записи.
  • Анализ. В сигнале выделяются участки, содержащие речь. Система оценивает ее параметры — к какой части речи относится слово, в какой оно форме, насколько вероятна связь между двумя словами.
  • Выявление шаблонов данных. Полученную информацию система включает в словарь — собирает разные варианты произношения одного и того же слова. Чтобы точнее распознавать новые запросы, ассистенты сравнивают слова в них с шаблонами.

Если после обработки запроса виртуальный помощник не понимает команду или не может найти ответ, он просит перефразировать вопрос. В некоторых случаях могут понадобиться дополнительные данные — например, при вызове такси ассистент может уточнить местоположение пассажира и пункт назначения.

Что собой представляет подобное приложение? Основная функция программы Siri на Андроид или другой ОС — это распознавание голосовых команд человека, их анализ и последующее выполнение. Со временем возможности всех голосовых помощников очень сильно расширяются. Недавно у них появилась способность понимать команды, заданные в привычном для человека разговорном стиле.

Основной функционал голосовых помощников довольно внушителен:

  1. Они могут как заводить для пользователя будильник, так и будить человека самостоятельно в установленное им время.
  2. Ассистенты предоставляют подробные и актуальные прогнозы погоды, состояние дорожного движения, информацию о пробках.
  3. Оповещение о важных событиях и новостях во всём мире и в указанном регионе — одна из основных способностей.
  4. Помощники расскажут об интересующих пользователя возможностях и настройках их смартфона.
  5. Напомнят о важных и запланированных событиях, датах, праздниках, встречах.
  6. Найдут максимально полную и интересную информацию в интернете по запросу пользователя.

Обзор бесплатных голосовых помощников для ПК на русском языке

И это только часть их функционала. Большинство помощников общаются с владельцами устройств при помощи голоса. Отдельно стоит отметить качество их звучания. Не наблюдается каких-либо помех, скрипа и неестественности во время разговора. Единственный недостаток — проблемы с произношением и ударениями, но это связано с тем, что многие программы реализуются для российского рынка силами иностранных разработчиков. Именно поэтому большинство людей стремятся найти отечественное приложение для распознавания и выполнения голосовых команд.

Программисты из России и СНГ стараются не уступать западным и восточным разработчикам софта для смартфонов и производить аналоги Сири для ОС Андроид на русском языке. Свою продукцию предоставили как крупные компании, так и независимые команды разработчиков, наработки которых смотрятся по-настоящему эффектно и сильно рядом с мировыми конкурентами.

Ассистент Дуся

Первая в списке русских голосовых помощников — недавно появившаяся на рынке приложений для смартфонов «Ассистент Дуся». Несмотря на недавний выпуск, аудитория пользователей, установивших и считающих приложение настоящим Siri на русском для Андроид, уже довольно большое и постоянно растёт.

Читать далее:  7 лучших лапшерезок

Функционал Дуси ничуть не уступает европейским приложениям:

  1. Дуся может отправлять СМС и сообщения в мессенджерах, осуществлять звонки и писать электронные письма.
  2. Она способна управлять навигацией, показывать уведомления на основе местоположения владельца, сообщать о пробках.
  3. Интеграция с популярными в России сервисами, например, с социальной сетью «ВКонтакте».
  4. Управление календарём, ежедневником, заметками и настройками смартфона.

Кроме этого, Дуся обладает несколькими важными особенностями. Во-первых, она может работать в режиме офлайн с небольшим ограничением своего функционала. Во-вторых, это приложение прекрасно распознаёт голосовые команды и качественно реагирует на них. Многие россияне уже отдали предпочтение этому постоянно развивающемуся помощнику.

Помощник Робин

Обзор бесплатных голосовых помощников для ПК на русском языке

Пожалуй, самый позитивный и общительный кандидат на место приложения-помощника на сегодняшний день. Робин отличается от своих конкурентов тем, что по-настоящему умеет рассказывать анекдоты. Если взглянуть на его «начинку», то она не покажется какой-то особенной для человека, знакомого с работой ассистентов для смартфонов. Функции поиска информации, совершения звонков, отправки сообщений и работы с органайзером — этого достаточно для повседневного использования.

Самое важное в Робине то, что работа с ним превращается в увлекательную и весёлую игру. Даже простые вещи он делает с юморком, чем, собственно, и завоевал сердца многих владельцев смартфонов. Несмотря на то, что это приложение разработано иностранными программистами, русское озвучивание в нём выполнено на невероятно качественном уровне, поэтому любой россиянин смело может пользоваться этим замечательным софтом.

Алиса от Яндекс

Самое крупное и успешное подобие Сири на сегодняшний день среди отечественных приложений. Алиса разработана сотрудниками компании Яндекс, которая уже давно развивается в области создания искусственного интеллекта. Продукт вышел невероятно качественным и функциональным, потому даже некоторые владельцы техники Apple поглядывают на него с завистью. Она умеет всё, что умеют другие, но главное — она создана именно для русскоговорящих пользователей.

Отличительные возможности Алисы:

  1. Она способна распознавать контекст в голосовых запросах человека. Список тем, типов поисковых запросов и объём словарного запаса этого помощника постоянно расширяются.
  2. В ней присутствует набор развлекательных функций. Она может петь, читать стихи и смешно шутить.
  3. Поиск информации с помощью Алисы вышел на новый уровень. Сначала предоставляются данные из самых надёжных и полных источников.

Существуют, конечно, некоторые проблемы с произношением, но учитывая, что это всё-таки русскоязычный помощник, они скоро исчезнут без следа.

 Загрузка …

работает.

Да, вашим мобильным разработчикам придется разобраться сразу с множеством технологий, чтобы интегрировать голосовой интерфейс. И это при том, что он является этаким приятным дополнением, а не основным функционалом… А именно: подключиться к системе распознавания речи, синтеза речи, к движку процессинга языка, запилить свой UI голосового ассистента, реализовать архитектуру и покрыть ее тестами.

Но есть open source решение, которое поможет сделать все это гораздо быстрее и эффективнее!

В итоге

Голосовые ассистенты — это, конечно, здорово. Но ощущение такое, что тот путь, по которому они сейчас идут, лишь уводят и пользователя, и бизнес от удобной технологии. И зачастую это связано в том числе и с тем, что разработчики пока не умеют создавать качественный голосовой UX. О том, как это исправить, мы тоже

В этой статье мы постарались кратко рассказать о совершенно новой концепции in-app ассистентов — то есть о голосовых помощниках как о внутренней функции мобильного приложения. В этом случае ценность голоса как дополнительного UI становится понятной как пользователю, так и разработчику.

Ok Google для ПК

Рейтинг
( Пока оценок нет )
Понравилась статья? Поделиться с друзьями:
ObzorTop
Adblock
detector