Игровые навыки у голосовых помощников / Блог компании Mail.ru Group / Хабр

Любая технология, ставшая популярной, чему-то этим обязана. Одной из причин популярности голосовых помощников стали так называемые игровые навыки — умение играть с пользователями. Давайте поговорим о современном состоянии этой отрасли, чем интересны голосовые навыки и как они могут развиваться в ближайшем будущем.

Развитие голосовых игр

Компьютерные игры многие десятилетия подталкивают развитие аппаратных и программных технологий, от сенсорных интерфейсов до видеокарт. Благодаря играм появляются и распространяются интерфейсные идеи и механики монетизации. Когда-то игры вроде «Сапёра» учили людей кликать правой и левой кнопкой мыши (да-да), «Косынка» — перетаскивать объекты на экране, «Angry Birds» — осваивать сенсорный интерфейс, Pockemon Go показала, что такое дополненная реальность.

Первые шаги в сфере голосового взаимодействия были сделаны в аудиоквестах и иммерсивных игровых спектаклях. Позднее появились игры, которые сейчас учат нас естественному взаимодействию с голосовым интерфейсом.

Развитие голосовых технологий началось примерно 40 лет назад. IBM выпустила компьютер IBM Shoeboox — первое в мире цифровое устройство, способное распознавать речь. Он мог распознавать 16 слов и цифры от 0 до 9. В 1970-х в Университете Карнеги Меллона создали программу Harpy, способную распознавать чуть больше 1000 слов. В 1987-м создали куклу Julie, которую можно было научить распознавать голос ребёнка:

Развитие технологий ускорялось, и понеслось как лавина — сегодня исследователи уже работают над более узкими задачами: как отличать детскую речь от взрослой, или как распознавать речь на разных диалектах и с разными акцентами.

Другим фактором, давшим импульс развитию голосовых игр, стали технологии синтеза речи. С помощью алгоритмов нейронных сетей исследователи научились генерировать речь, очень похожую на естественную. Причём прогресс в этой области был взрывным, за считанные годы.

Благодаря развитию технологий понимания и синтеза речи, в основе которых лежат алгоритмы определения семантической близости и нейронные сети, в последние несколько лет начался стремительный рост рынка голосовых помощников. И сегодня «Игры и викторины» — один из самых популярных разделов в каталогах навыков — специальных программ-плагинов для голосовых помощников. Спрос рождает предложение, поэтому игровые навыки не только чаще скачивают, но и больше разрабатывают.

Скажем, на российской платформе для создания ботов и голосовых навыков Aimylogic зарегистрированы более 50 тысяч разработчиков, и около 70 % навыков для голосовых помощников — это игровые и развлекательные. Даже Нолан Бушнелл, основатель Atari и пионер индустрии видеоигр, видит в голосовых интерактивных играх большой потенциал и лично участвует в разработке игры для ассистентов.

Летом 2019 году Mail.ru Group представила голосового помощника Марусю. Очень многие пользователи предпочитают играть с ней, это подтверждает и статистика: около 80 % всех навыков для Маруси, созданных сторонними разработчиками, — игровые. С момента выхода Маруси пользователи наиграли в неё около 75 тыс. часов. При этом у Маруси «из коробки» уже есть около 20 своих игр, в основном это викторины, игры-задания (например, фанты), и загадки. В загадки в мае сыграли почти 30 тыс. пользователей. В целом игры отличаются от других навыков большей продолжительностью сессий, в среднем около пяти минут, что довольно много. Полный список игровых навыков для Маруси можно посмотреть на официальном сайте. Кроме того, Маруся умеет запускать не только свои развлекательные навыки, но и игры из ВКонтакте. Например, вы можете попробовать свои силы в «Сокровищах пиратов», «Монеточках» и «Джампере».

В игровых навыках самое сложное — найти удачную идею. Затем нужно продумать логику сценария и создать понятный разговорный UX, это важно для даже для самых простых идей. Игры с голосовым управлением — это новая ниша, открытая для экспериментов, тут нет жестких правил и регламентов. Попробовать свои силы в этой сфере может кто угодно, даже без опыта программирования, только в этом случае нужен подходящий инструмент. Например, для Маруси есть конструктор Aimylogic от Just AI, который позволяет создавать голосовые навыки даже с минимальными навыками программирования. Попробуйте и вы, это совсем не сложно и по плечу всем — достаточно лишь зарегистрироваться на платформе. В Aimylogic можно конвертировать под Марусю любые навыки, созданные для других голосовых помощников.

Мы решили поговорить с разработчиком Аней из VoiceGame, которая создаёт навыки на платформе Aimylogic, и расспросить её о конструкторе и её опыте создания и конвертации голосовых навыков.

Работать в конструкторе очень удобно: в нём вы видите наглядную блок-схему, позволяющую легко и быстро менять логику сценария. Интуитивно-понятные узлы можно перемещать, менять и использовать насколько хватит фантазии без погружения в JavaScript, а работу облегчают подробные инструкции и классная документация. Сложность технологии разработки навыков связана с логикой проектирования, тестирования, попытками спрогнозировать поведение пользователей и придумать максимально удобные пути для игроков. Зато конструкторы экономят время при создании несложных сценариев.

Вот несколько примеров свежих навыков для Маруси: детская обучающая игра Пружинки, навык Вместе учим календарь и навык обучения этикету Вежливые загадки. Они помогут родителям маленьких детей научить тех абстрактным понятиям вроде дней недели, выражений из речевого этикета или названий профессий. Игры состоят из коротких стишков, персонажи которых моделируют ситуации для использования каких-либо категорий слов. Стихи созданы профессиональным педагогом-методистом по работе с дошкольниками. Мы старались сделать игры максимально полезными, разнообразными и нескучными. Например, в «Вежливых загадках» мало угадать одно из трех предложенных в рифму слов, нужно еще подобрать верное значение.

Эти три навыка мы адаптировали для Маруси поэтапно. Сначала с VUI-дизайнером спроектировали логику в mind-карте, и в результате полностью переработали механику у всех трёх игр: добавили дополнительные реакции голосового помощника на правильные и неправильные ответы, унифицировали форматы этих ответов, допилили must have-реакции вроде повтора реплик и прощания при выходе, рандомизацию. И в конце переработали TTS-разметку, чтобы стихотворное звучание было естественнее.

Я считаю, что будущее голосовых помощников будет зависеть от навыков, полезных как для бизнеса, так и для пользователей. И не факт, что это будут в первую очередь игры. Хотя если отталкиваться от схемы «хлеба и зрелищ», то голосовые помощники с игровыми навыками сюда отлично вписываются как флагманы развития индустрии. И игр будет всё больше, при условии возможности хорошей монетизации. Зарубежные и отечественные тренды намекают, что все будет двигаться в сторону мультимодальности, и вряд ли голосовые помощники останутся чисто голосовыми.

У меня нет универсального рецепта написания классного игрового навыка для голосового помощника. Как это делаю я: придумываю тематику игры, обсуждаю с коллегами. Затем на бумажке, а иногда в буквальном смысле на салфетке мы рисуем механику потребления контента, которую потом переносим в подробную блок-схему. И только после этого готовим наполнение. Тем, кто хочет начать писать навыки, хочу посоветовать: не бойтесь и экспериментируйте. Начните с чего-нибудь простого, чтобы точно получилось 🙂 Ошибаться — это нормально. Нет ни одной сферы технологий, где без ошибок можно было бы с нуля чему-нибудь научиться.

Почему игры для голосовых помощников вызывают такой интерес?

Подведём итоги. Во-первых, голосовые навыки позволяют их авторам легко войти в индустрию голосовых помощников. Игровые сценарии всем знакомы и понятны, их легче «переложить» на разговорный интерфейс: взять идею знакомой игры и адаптировать под голос. Например, русскоязычные помощники уже умеют играть в города, ассоциации, «Угадай мелодию», скраббл, и даже в прятки (пользователь отгадывает загадки, чтобы узнать, где «спрятался» голосовой помощник).

Во-вторых, создание игры — это творческий и захватывающий процесс. Голос обогащает игровой опыт, работает на вовлечение в сюжет.

В-третьих, вы можете прокачать свои навыки по созданию диалогового интерфейса и Voice UX. Одна из пользователей платформы Aimylogic попробовала создавать игровые сценарии, и теперь у нее своя компания по коммерческой разработке навыков для голосовых помощников.

В-четвёртых, на играх проще заработать. Если у помощника есть интеграция с платёжными системами, то в голосовых играх легко можно реализовать уже проверенные временем механики монетизации. Решения те же, что и в мобильных играх.

В-пятых, любому разработчику важно, чтобы у его навыка была аудитория, а игры привлекают пользователей. Умные колонки и помощник чаще всего используются именно для развлечений, поэтому у интересных игровых навыков выше трафик. Это учитывают и компании, которые хотят с помощью голосовых помощников продвигать товары и услуги. Игровые механики повышают конверсию, сильнее вовлекают пользователей, повышают лояльность к бренду.

Самые популярные жанры среди игровых навыков — викторины и различные казуальные игры с простыми механиками. Квесты и стратегии не так распространены, потому что требуют более глубокой проработки сценария и антуража, а порой и мультимодальности — для этого нужен опыт, а иногда и приличный бюджет. Пожалуй, самая популярная категория — детские игры: детям легко говорить с помощниками на естественном языке, им не нужны сложные сценарии, достаточно лишь заинтересовать и продумать понятную логику взаимодействия. Детские игры очень востребованы и родителями, потому что зачастую играют образовательную роль.

Source link

Добавить комментарий

Ваш адрес email не будет опубликован.