Доклады о будущих и современных технологиях
ГОЛОСОВОЕ УПРАВЛЕНИЕ УСТРОЙСТВАМИ
С. Н. Воробьева, Н. В. Ёлкина
Научный руководитель - Н. В. Ёлкина, ст. преподаватель
Ярославский государственный технический университет
Данное сообщение подготовлено по материалам статьи «Говорите со своими устройствами» (Talk to your gadgets) Стефана Касса (Stephen Cass), опубликованной в журнале «Discover» 26 ноября 2012 г. Статья посвящена одной из функций современных электронных устройств - распознаванию голоса. Сначала автор затрагивает проблему небольших по размеру устройств, обладающих больШиМ функциональным набором. Автор приводит примеры такого взаимодействия: многофункциональные кнопки сотовых телефонов, сенсорные экраны планшетных компьютеров и их умение распознавать жесты. Принципиально новое решение предлагает телекоммуникационная компания AT&T, и заключается оно в том, что теперь можно будет разговаривать с электронным устройством, давать ему команды. Стефан Касс подробно останавливается на системе голосового управления Watson, разработанной компанией AT&T: программное
Обеспечение такой системы располагается на сервере, к которому и обращается (через Интернет или телефонную сеть) устройство после распознавания голосового запроса; затем Watson анализирует речь и посылает пользователю ответ в виде цифрового сигнала, который может быть переведен устройством в команды. Демонстрируя данный принцип, исследователи AT&T создали голосоуправляемый телевизионный пульт, с помощью которого можно узнать множество различной информации на удаленном расстоянии от источника, например, все комедии, которые сейчас идут по телевизору. Стоит отметить, что Watson не только распознает отдельные слова, но также может извлекать некоторый смысл из простых предложений, осуществляется это посредством выполнения инструкций, способных преобразовывать сказанные пользователем предложения в стандартизированный текст, который может быть переведен программным обеспечением устройства в машинные команды. Наконец, приводятся в пример два конкретных представителя такой системы голосового распознавания Magellan Maestro 4250 и Dragon NaturallySpeaking 10. Первый - это навигатор, понимающий небольшой набор общих вопросов, таких как «Где я?», «Ближайшая заправка», в соединении с телефоном - очень удобное устройство для тех, кому тяжело пользоваться малой клавиатурой (например, для пожилых людей). Второй представитель - для тех, кто нуждается в создании большого количества текстов без клавиатуры; работает таким образом: переводит речь в печатные слова на настольных и портативных компьютерах.