Мы расскажем, что такое сценарии для Алисы, чем они отличаются от команд и какие хорошие команды уже придумали пользователи. «Яндекс» представил апрельское обновление «Алисы» и своих умных устройств. К слову, Алиса теперь умеет вести "утренние шоу". В умных колонках с Алисой появилось персональное утреннее шоу: теперь можно слушать полезную информацию и музыку, подобранную специально для слушателя. Выбрать тематику новостей и подкастов можно в приложении «Яндекс», сказав «Алиса, открой настройки шоу» или «Алиса, открой настройки новостей».
Алиса запустила утреннее шоу с персональными рекомендациями
Как включить новости в Яндекс Браузере. Утреннее шоу Алисы теперь можно настроить на свой вкус. Для этого пользователь может сам выбрать тематику новостей и подкастов. «Яндекс» представил апрельское обновление «Алисы» и своих умных устройств. Голосовой помощник «Алиса» научили проводить утренние шоу, которые подстраиваются под определённого пользователя.
Топовые фишки Яндекс.Станции, о которых вы могли не знать
Обновление Алисы также включает в себя улучшенное утреннее шоу: теперь там не только новости и музыка, но и короткие подкасты, даты в истории, мудрости и комплименты. Добавьте в голосовой помощник Алису от Яндекса новые навыки на тему — Новости. Настроить Утреннее шоу Алиса. В последнее время я отказался от соцсетей и почти не читаю новостей о том, что происходит в мире, не считая спорта. «Утреннее шоу» и новости радиостанций доступны во всех умных колонках с поддержкой «Алисы». Помимо чтения актуальных новостей по утрам, «Алиса» также научилась отслеживать эфиры радиостанций. Утренние шоу впервые появились в апреле этого года.
Утреннее шоу от Алисы на Яндекс Станции
На колонках с Алисой появилась функция Утреннего шоу | Шоу и новости доступны в «и», «Станции Мини» и других умных колонках, где есть голосовой помощник «Алиса». |
«Алиса» научилась вести утренние шоу | Тогда, услышав запрос «Расскажи новости», Алиса будет всегда включать новости нужного издания. Кроме этого, их можно добавить в утреннее шоу Алисы. |
Что нового в апреле у Алисы и умных устройств | Шоу и новости доступны в «и», «Станции Мини» и других умных колонках, где есть голосовой помощник «Алиса». |
«Яндекс» научил «Алису» вести персональное утреннее шоу | Утреннее шоу представляет собой некий “винегрет” из интересных публикаций и новостей с различных сайтов, навыков Алисы и музыки. |
Умные колонки с "Алисой" научились вести персонализированные утренние шоу - ТАСС | Виртуальный ассистент Алиса поставит утреннее шоу: слушайте музыку, новости, подкасты и настраивайтесь на день. |
Топовые фишки Яндекс.Станции, о которых вы могли не знать
«Мы хотим, чтобы Алиса была не только помощником, но и другом, с которым приятно проводить время. Поэтому мы учим её следить за новостями, развлекать пользователей и создавать приятную атмосферу в доме, и утреннее шоу — первый шаг в этом направлении». Утреннее шоу Алисы поможет настроиться на день и не забыть о важном. Алиса расскажет о погоде, представит персональную подборку новостей, включит короткий подкаст, специально подобранный трек или плейлист. «Мы хотим, чтобы Алиса была не только помощником, но и другом, с которым приятно проводить время. Поэтому мы учим её следить за новостями, развлекать пользователей и создавать приятную атмосферу в доме, и утреннее шоу — первый шаг в этом направлении». Добавьте в голосовой помощник Алису от Яндекса новые навыки на тему — Новости. Шаг 3: Выберите раздел «Новости». Слушать утреннее шоу Алисы Утреннее шоу Алисы поможет настроиться на день и не забыть о важном. Обновление Алисы также включает в себя улучшенное утреннее шоу: теперь там не только новости и музыка, но и короткие подкасты, даты в истории, мудрости и комплименты.
Еще по теме
- Что умеет Яндекс-станция: 17 функций и навыков Алисы
- Утреннее шоу Алисы стало персональным
- Алиса запустила утреннее шоу с персональными рекомендациями
- «Алиса» научилась вести утренние шоу
Утреннее шоу Алисы стало персональным 😎
Утренняя Алиса. У голосового помощника Яндекса теперь своё шоу | «Алиса» научилась персонализировать «Утреннее шоу». Как настроить новости в Алисе Можно дать ей обычную команду «Алиса, настрой новости». |
«Яндекс» научил «Алису» вести персональное утреннее шоу | «Яндекс» добавил возможность персональной настройки утреннего шоу голосового помощника «Алиса». Функция появилась в ассистенте в апреле этого года. «Алиса» по-прежнему умеет зачитывать по утрам актуальные новости. |
Что умеет Яндекс-станция: 17 функций и навыков Алисы | так назвали программу, при которой Алиса будет ставить различные треки из плейлиста пользователя на , дополняя их различными комментариями во время пауз, а также сообщая новости на интересующую. |
Топовые фишки Яндекс.Станции, о которых вы могли не знать - | После работы можно послушать вечернее шоу — Алиса поделится новостями и погодой на следующий день и поставит расслабляющую музыку. |
Новые функции «Алисы» и «Яндекс Станций» за апрель 2024 года | Для настройки новостей на колонке Алиса Яндекс, найдите раздел «Новости» или «Информация» и выберите его. |
Алиса запустила утреннее шоу с персональными рекомендациями
Например, «Алиса, включи свет в гостиной». По расписаниюСценарий запускается в определенное время или по определенным дням недели. Например, «Включить кофеварку в 7 утра». По событиюСценарий запускается при срабатывании определенного датчика или устройства.
Например, «Включить свет в коридоре, если датчик движения обнаружит движение». По уведомлениюСценарий запускается, если на телефон пользователя приходит уведомление от системы. Например, «Включить камеру, если на датчик движения поступил сигнал».
По звукуСценарий запускается, если система распознает определенный звук. Например, «Включить музыку, если в доме слышен плач ребенка». Ранее мы рассказывали: Как усилить Wi-Fi сигнал в квартире или доме?
Примеры интересных сценариев для голосового помощника Алисы Интересные сценарии для Алисы могут быть разными.
Персонализация утреннего шоу Теперь пользователь может решать, каким будет ваше утреннее шоу. Например, можно выбрать, какой контент и в каком порядке будет воспроизводиться: подкасты на разные темы, прогноз погоды, конкретные навыки, музыкальные треки или новости из определённых источников. Афиша мероприятий и новости Анонсы интересных событий в городе будут отображаться на главном экране Станции Дуо Макс. Чтобы узнать о предстоящем событии больше, нужно нажать на кнопку «Подробнее», и Алиса покажет все детали во встроенном Браузере. Если во время прослушивания нужно перейти к новой рубрике, достаточно сказать Алисе «Дальше» — и она тут же перейдёт к следующему блоку.
Диалоги , предназначенную для публикации новых навыков и их подключения к Алисе. Уже к апрелю 2018 года на платформе Яндекс. Диалогов были опубликованы более 3 тысяч навыков, более 100 прошли модерацию [17]. Благодаря навыкам Алису обучили работе диктором: голосовая помощница Яндекса приняла участие в апрельской акции по проверке грамотности « Тотальный диктант » и прочитала диктант в Новосибирском государственном университете [18]. В конце мая на Yet Another Conference 2018 Яндекс сообщил, что благодаря навыкам Алиса научилась понимать, что изображено на фотографии, и распознает марку машины, породу кошки или собаки, незнакомое здание или памятник, способна назвать знаменитость или произведение искусства. Для товаров Алиса найдёт похожие варианты на Яндекс. Маркете или в поиске Яндекса [19]. В ноябре 2018 Яндекс обучил Алису заказывать товары на своём новом маркетплейсе «Беру» [20]. В октябре 2018, когда Алисе исполнился год, Яндекс запустил программу «Премия Алисы». В её рамках компания планировала ежемесячно награждать авторов лучших навыков и до конца года выплатить более миллиона рублей [21]. По данным компании, с марта по ноябрь 2018 года разработчики создали 33 тысячи навыков [12]. В начале ноября Яндекс дал возможность авторам навыков выбирать голос Алисы для озвучивания сообщений, добавив четыре новых варианта: Джейн, Эрмила, Захара и Эркана Явас [22]. В августе 2019 года Tele2 совместно с Яндекс запустила навык для Алисы, позволяющий абонентам любых операторов бесплатно найти потерянный дома или в офисе телефон. Пользователь может воспользоваться голосовой командой «Алиса, попроси Tele2 найти мой телефон» на любом гаджете, где есть Алиса, и Tele2 позвонит на номер, привязанный к устройству [23] [24]. Устройства с «Алисой» В середине апреля 2018 года газета « Коммерсантъ » опубликовала статью о находящейся в разработке аппаратной платформе Yandex. Список производителей, с которыми велись переговоры, компания не раскрывала [17]. Первой аппаратной разработкой на базе Yandex. Станция , которую компания представила в конце мая на конференции Yet another Conference 2018 в Москве [25]. В колонку встроено пять динамиков совокупной мощностью 50 Вт и семь микрофонов. Яндекс установил цену на «Станцию» в 9990 рублей [26]. В августе 2018 производитель носимой электроники Elari выпустил детские «умные» часы Elari KidPhone 3G со встроенной «Алисой». Часы стали первым устройством со встроенным голосовым помощником Яндекса, выпущенным сторонней компанией [27]. От Яндекс. Станции за 9990 рублей колонки отличаются втрое меньшей ценой 3290 рублей , менее мощным звуком у Irbis A только один динамик мощностью 2 Вт и два микрофона и меньшими размерами [26]. В его интерфейсе Алиса заняла центральное место.
Вы можете использовать навыки Алисы для покупки товаров или выполнения задач по дому, управления умными устройствами и воспроизведения музыки. Вы также можете использовать навыки Алисы для игры в игры и для доступа к другим приложениям. Вы можете посмотреть на доступные навыки Алисы, чтобы узнать больше о том, что вы можете сделать с помощью Алисы.
Утренняя Алиса. У голосового помощника Яндекса теперь своё шоу
Вот характерный пример работы синтеза: В этом главный недостаток метода unit selection: несмотря на все усилия, фрагменты речи не будут идеально соответствовать друг другу по эмоциям и стилю. Из-за этого сгенерированная речь Алисы постоянно «переключалась» между ними. На коротких фразах это не всегда заметно, но если хотите услышать произвольный ответ длиной хотя бы в пару предложений например, быстрый ответ из поиска , то недостатки подхода становятся очевидны. В общем, unit selection перестал нас устраивать и нужно было развиваться дальше. Иногда они возвращаются: опять параметрический синтез В результате мы вернулись к архитектуре из двух последовательных блоков: акустическая модель и вокодер. Правда, на более низком уровне обновилось примерно всё.
Акустическая модель В отличие от старой параметрики, новую модель мы построили на основе seq2seq-подхода с механизмом внимания. Помните проблему с потерей контекста в нашей ранней параметрике? Если нет нормального контекста, то нет и нормальной интонации в речи. Решение пришло из машинного перевода. Дело в том, что в машинном переводе как раз возникает проблема глобального контекста — смысл слов в разных языках может задаваться разным порядком или вообще разными структурами, поэтому порой для корректного перевода предложения нужно увидеть его целиком.
Для решения этой задачи исследователи предложили механизм внимания — идея в том, чтобы рассмотреть всё предложение разом, но сфокусироваться через softmax-слой на небольшом числе «важных» токенов. При генерации каждого нового выходного токена нейросеть смотрит на обработанные токены фонемы для речевого синтеза или символы языка для перевода входа и «решает», насколько каждый из них важен на этом шаге. Оценив важность, сеть учитывает её при агрегировании результатов и получает информацию для генерации очередного токена выхода. Таким образом нейросеть может заглянуть в любой элемент входа на любом шаге и при этом не перегружается информацией, поскольку фокусируется на небольшом количестве входных токенов. Для синтеза важна подобная глобальность, так как интонация сама по себе глобальна и нужно «видеть» всё предложение, чтобы правильно его проинтонировать.
На тот момент для синтеза была хорошая seq2seq-архитектура Tacotron 2 — она и легла в основу нашей акустической модели. Мел-спектрограмма Параметрическое пространство можно сжать разными способами. Более сжатые представления лучше работают с примитивными акустическими моделями и вокодерами — там меньше возможностей для ошибок. Более полные представления позволяют лучше восстановить wav, но их генерация — сложная задача для акустической модели. Кроме того, восстановление из таких представлений у детерминированных вокодеров не очень качественное из-за их нестабильности.
С появлением нейросетевых вокодеров сложность промежуточного пространства стала расти и сейчас в индустрии одним из стандартов стала мел-спектрограмма. Она отличается от обычного распределения частоты звука по времени тем, что частоты переводятся в особую мел-частоту звука. Другими словами, мел-спектрограмма — это спектрограмма, в которой частота звука выражена в мелах , а не герцах. Мелы пришли из музыкальной акустики, а их название — это просто сокращение слова «мелодия». Строение улитки уха из Википедии Эта шкала не линейная и основана на том, что человеческое ухо по-разному воспринимает звук различной частоты.
Вспомните строение улитки в ухе: это просто канал, закрученный по спирали. Высокочастотный звук не может «повернуть» по спирали, поэтому воспринимается достаточно короткой частью слуховых рецепторов. Низкочастотный же звук проходит вглубь. Поэтому люди хорошо различают низкочастотные звуки, но высокочастотные сливаются. Мел-спектрограмма как раз позволяет представить звук, акцентируясь на той части спектра, которая значимо различается слухом.
Это полезно, потому что мы генерируем звук именно для человека, а не для машины. Вот как выглядит мел-спектрограмма синтеза текста «Я — Алиса»: У мел-спектрограммы по одному измерению [X на рисунке выше] — время, по другому [Y] — частота, а значение [яркость на рисунке] — мощность сигнала на заданной частоте в определенный момент времени. Проще говоря, эта штуковина показывает, какое распределение по мощностям было у различных частот звука в конкретный момент. Мел-спектрограмма непрерывна, то есть с ней можно работать как с изображением. А так звучит результат синтеза: 3.
Новый вокодер Вероятно, вы уже догадались, что мы перешли к использованию нового нейросетевого вокодера. Именно он в реальном времени превращает мел-спектрограмму в голос. Наиболее близкий аналог нашего первого решения на основе нейросетей, которое вышло в 2018 году — модель WaveGlow. Архитектура WaveGlow основана на генеративных потоках — довольно изящном методе создания генеративных сетей, впервые предложенном в статье про генерацию лиц. Сеть обучается конвертировать случайный шум и мел-спектрограмму на входе в осмысленный wav-сэмпл.
За счёт случайного шума на входе обеспечивается выбор случайной wav-ки — одной из множества соответствующих мел-спектрограмме. Как я объяснил выше, в домене речи такой случайный выбор будет лучше детерминированного среднего по всем возможным wav-кам. В отличие от WaveNet, WaveGlow не авторегрессионен, то есть не требует для генерации нового wav-сэмпла знания предыдущих. Его параллельная свёрточная архитектура хорошо ложится на вычислительную модель видеокарты, позволяя за одну секунду работы генерировать несколько сотен секунд звука. Главное отличие, за счёт которого HiFi-GAN обеспечивает гораздо лучшее качество, заключается в наборе подсетей-дискриминаторов.
Они валидируют натуральность звука, смотря на сэмплы с различными периодами и на различном масштабе. Как и WaveGlow, HiFi-GAN не имеет авторегрессионной зависимости и хорошо параллелится, при этом новая сеть намного легковеснее, что позволило при реализации ещё больше повысить скорость синтеза. Кроме того, оказалось, что HiFi-GAN лучше работает на экспрессивной речи, что в дальнейшем позволило запустить эмоциональный синтез — об этом подробно расскажу чуть позже. Схема HiFi-GAN из статьи авторов модели Комбинация этих трёх компонентов позволила вернуться к параметрическому синтезу голоса, который звучал плавно и качественно, требовал меньше данных и давал больше возможностей в кастомизации и изменении стиля голоса. Параллельно мы работали над улучшением отдельных элементов синтеза: Летом 2019 года выкатили разрешатор омографов homograph resolver — он научил Алису правильно ставить ударения в парах «зАмок» и «замОк», «белкИ» и «бЕлки» и так далее.
Здесь мы нашли остроумное решение. В русском языке эти слова пишутся одинаково, но в английском написание отличается, например, castle и lock, proteins и squirrels. Из этого представления легко выделить информацию о том, как произносить омограф, ведь перевод должен различать формы для корректного подбора английского варианта. Буквально на 20 примерах можно выучить классификатор для нового омографа, чтобы по эмбеддингу перевода понимать, какую форму нужно произнести. Летом 2020 года допилили паузер для расстановки пауз внутри предложения.
Язык — хитрая штука.
Например, человек может выбрать новости спорта и подкасты про кино. Кроме того, в голосовом помощнике появились новости радиостанций. Утреннее шоу — это развлекательная программа, где «Алиса» выступает в роли ведущей. Она читает новости, ставит людям музыку и развлекает историями на разные темы — почти как настоящий диджей.
Чтобы она включала наиболее подходящий контент, нужно указать свои предпочтения в настройках.
Но будет и общая полезная информация — например, прогноз погоды на день, а сейчас — подборки актуальных материалов, которые могут быть полезными в режиме самоизоляции у себя дома. Руководитель проекта "Алиса" Андрей Законов отмечает, что данное нововведение было сделано с той целью, чтобы Алису стали воспринимать не только как умного помощника с голосовым «интерфейсом», а как некоего виртуального компаньона, который может не только быть полезным в конкретных задачах, но и помогать приятно провести время в своей компании, тем более, в условиях сокращения социальных контактов. Станция включая версию Мини и других «умных колонках», поддерживающих Алису.
Новый формат контента в утреннем шоу Алисы Новый формат контента в утреннем шоу Алисы: истории от навыков 19 Июня, 2021 Автор: Яндекс Теперь навыки смогут отправлять короткий регулярный контент в утреннее шоу Алисы. Чтобы услышать историю в шоу, пользователь должен зайти в мобильное приложение Яндекса и выбрать в настройках шоу в разделе Навыки те, от которых хотел бы получать обновления. Если на момент запуска шоу у навыка есть новая история, которую пользователь еще не слышал, она будет рассказана вместе с другими интересующими его темами например, музыкой или новостями. Ключевые особенности: Участвовать в утреннем шоу могут все навыки общего типа.
«Яндекс» научил «Алису» вести персональное утреннее шоу
Особенностью Алисы стала личность, разработанная коллективом Яндекса вместе с журналистом и бывшим руководителем группы маркетинга компании Владимиром Гуриевым. Помимо чтения актуальных новостей по утрам, «Алиса» также научилась отслеживать эфиры радиостанций. Теперь голосовой помощник может запускать новостные блоки с девяти станций, включая «Хит ФМ» и «Коммерсантъ FM». Утренние шоу впервые появились в апреле этого года. Кроме того, в голосовом помощнике появились новости радиостанций. Утреннее шоу — это развлекательная программа, где «Алиса» выступает в роли ведущей.
Артём Баусов
- Читает ли Алиса последние новости? Настраиваем её на телефоне и на компьютере
- Вышло апрельское обновление Алисы и умных устройств Яндекса
- Примечание
- Слушать утреннее и вечернее шоу Алисы на Яндекс Станции — Справка
- Вышло апрельское обновление «Алисы» и умных устройств «Яндекса» / Хабр