Русская Википедия:Yandex SpeechKit
Шаблон:ОШаблон:Карточка программы
Yandex SpeechKit (произносится как Яндекс СпичКит) — технология распознавания речи и синтеза речи от российской компании Яндекс[1].
Краткие сведения
Разработками в области обработки естественной речи компания «Яндекс» занимается с 2012 года[2].
SpeechKit[3] был представлен 2 октября 2013 года на ежегодной технологической конференции Яндекса YaC[1].
Мобильный голосовой поиск на основе этой платформы доступен для смартфонов под управлением iOS, «Андроид» и Windows Phone 8[1] и понимает запросы на русском и турецком языках[4]. Поддерживаются две темы запросов: «общая» (обычные запросы) и «гео» (адреса и названия организаций), причём, по словам разработчиков, точность распознавания составляет 84 % и 94 % соответственно[5]. Скорость распознавания — 1,1 секунды[5].
SpeechKit[3] используется в приложениях «Яндекс Браузер», «Яндекс Город», «Яндекс Карты», «Яндекс Навигатор» и ещё около 400 приложениях[4].
4 августа 2014 годы был представлен облачный сервис SpeechKit Cloud SDK (произносится как СпичКит Клауд, СДК)[4]. Разработка предназначена для встраивания в игры, развлекательные и навигационные сервисы[4]. Первый месяц использования СДК бесплатный, далее стоимость будет рассчитываться, исходя из количества запросов[4].
Возможности
Голосовая активация
Система распознавания речи в миниатюре — возможность привязывать к любому слову или фразе любую команду для устройства; не требует доступа в интернет, для запуска не нужно нажимать какие-либо кнопки: программа постоянно работает в фоне[6].
Выделение смысловых объектов
Способность извлекать из слов смысл и анализировать контекст: к примеру, система поймёт, что во фразе «Позвони Владимиру» имеется в виду человек, а во фразе «Поехали во Владимир» — город[6].
Синтез речи
Преобразование текста в речь на базе скрытых марковских моделей[6].
Применение технологии
Комплекс речевых технологий Яндекса успешно применяется в различных направлениях[7]:
- Персональный помощник «Алиса»[8];
- Мультимедийная система голосового управления автомобилем, являющаяся конкурентом Car Play и Android Auto (подписаны контракты с «КАМАЗом», «Toyota» и «Honda»)[9];
- Перевод денежных средств голосом у Бинбанка[10];
- Автоматическое тегирование звонков впервые внедренное c Calltouch[11];
- Автоозвучка текстов (на сайте газеты «Известия»)[12].
Примечания
См. также
Ссылки
- Распознавание речи от Яндекса. Под капотом у Yandex.SpeechKit // Хабрахабр
- Официальное сообщество СпичКита
- Почему роботы разговаривают с нами только в кино // Журнал «Афиша»
- ↑ 1,0 1,1 1,2 Шаблон:Cite web
- ↑ Технологии распознавания речи. Денис Филиппов, руководитель речевых технологий Яндекса Шаблон:Wayback // радио Эхо Москвы
- ↑ 3,0 3,1 Шаблон:Cite web
- ↑ 4,0 4,1 4,2 4,3 4,4 Шаблон:Cite web
- ↑ 5,0 5,1 Шаблон:Cite web
- ↑ 6,0 6,1 6,2 Шаблон:Cite web
- ↑ Шаблон:Cite web
- ↑ Шаблон:Cite web
- ↑ Шаблон:Cite web
- ↑ Шаблон:Cite web
- ↑ Шаблон:Cite web
- ↑ Шаблон:Cite web
- Русская Википедия
- Страницы с неработающими файловыми ссылками
- Сервисы и инструменты «Яндекса»
- Распознавание речи
- Программное обеспечение, разработанное в 2013 году
- Единый реестр российского ПО
- Страницы, где используется шаблон "Навигационная таблица/Телепорт"
- Страницы с телепортом
- Википедия
- Статья из Википедии
- Статья из Русской Википедии