Области применения
Наиболее общий подход к определению возможных сфер применения средств генерации речи состоит в выборе некоторой человеко-машинной системы в качестве претендента на использование речевых сообщений и в последующем моделировании варианта системы, где применяются речевые устройства. Обычно изучение вопроса о применении речевых режимов вместо визуальных инициируется возникновением таких проблем, как высокая нагрузка на органы зрения человека или низкая производительность. Эксперимент осуществляется в условиях действующей системы с использованием различных критериев эффективности для определения относительных достоинств визуального и речевого вывода применительно к рассматриваемой задаче. Результаты таких исследований обычно подтверждают предположения о полезности речевого вывода информации для данного применения, но их трудно бывает распространить на другие применения. Однайо, используя эти результаты, можно указать области для проведения более общих исследований и глубоко изучить вопросы влияния субъективных факторов на проектирование средств вывода речевых сообщений. Ниже будут кратко описаны три примера применения средств речевого отображения информации.
Пример 1: система SYNCALL
Модельные исследования задач управления летательными аппаратами (сближения, захода на посадку) субсидировались совместно Национальным управлением по аэронавтике и исследованию космического пространства в Эймсе и Американской авиационной академией їй были направлены на оценку систем обеспечения захода «а посадку с применением синтезированных речевых сообщений при выполнении летных задач [70]. Это исследование проводилось на тренажере с привлечением высококвалифицированных экипажей. Половина заходов на посадку осуществлялась с применением современной автоматической системы и с использованием ответных сигналов «постороннего» пилота. Последние содержали речевые сообщения о высоте и отклонении от курса, сделанные неопытным пилотом. Заходы на посадку изменялись но степени сложности. Для менее трудных вариантов характеристики качества выполнения полета не различались настолько, чтобы это могло быть обусловлено системой SYNCALL. Однако при больших визуальной, мануальной и умственной нагрузках при заходе на посадку эти характеристики в случае применения синтезированной речи были лучше, чем при использовании процедуры подачи ответных сигналов «посторонними» нилотами. Были сделаны и другие многочисленные наблюдения. Для одного из заходов на посадку, когда система SYNCALL (в соответствии с планом эксперимента) неуклонно подавала ложные ответные сигналы, качество полета было значительно снижено по сравнению с выполнением того же захода на посадку при правильных ответных сигналах (это оказалось настоящим бедствием для некоторых из них и выражалось в сильной изменчивости характеристик качества от пилота к пилоту). В целом пилоты оценивали систему SYNCALL в аспекте речевого взаимодействия как менее информативную, менее полезную, менее координированную в сравнении с существующей; однако она была оценена как более информативная, более полезная, более согласованная и более надежная по сравнению с используемой в кабине пилота системой информирования о высоте полета, называемой системой оповещения о сближении с землей. В результате этого исследования, продемонстрировавшего принципы построения системы автоматического захода на посадку с синтезированными ответными речевыми сигналами, был составлен большой список рекомендованных пилотами уточнений по проекту системы. При этом была подчеркнута важность исключения передачи ложной информации по каналу ответных сигналов. Для уменьшения количества различных речевых сообщений рекомендовано согласовать систему оповещения о сближении с землей с ответными сигналами системы SYNCALL.
Пример 2: режимы ввода — вывода по каналу передачи данных сиетемы управления полетом самолета
Серия экспериментов была проведена с имитаторами GAT-1 и GAT-2, моделирующими, в частности, канал передачи данных системы управления полетом самолета с целыо оценки различных режимов работы устройств ввода — вывода, установленных в кабине пилота [32]. Пилоты самолетов выполняли задачу управления самолетом на тренажере по информации, обеспечиваемой визуальными дисплеями, речевыми сообщениями и печатающими устройствами. Для всех сообщений, кроме предупреждающих, они избирали визуальный способ отображения. Для предупреждающих сообщений предпочтение отдавалось использованию синтезированной речи. В части отображения текущей информации о курсе, высоте и скорости полета преимущество принадлежало информационным табло на светоизлуча - ющих диодах с большим размером букв. С помощью печатающих устройств предпочитали выводить менее критичную ко времени информацию, которая, кроме того, должна была использоваться по истечении какого-то периода времени после ее получения. К этой информации относятся сведения по управлению воздушным движением и информация о погодных условиях.
Пример 3: электронная речевая интерактивная система предупреждения
Рассматриваемая функциональная модель полета вертолета на предельно малой высоте включает в себя экспериментальную радиолокационную систему обнаружения объектов, представляющих угрозу для безопасности, в которой для оповещения о степени опасности и направлений расположения различных типов объектов радиолокационного наблюдения используются синтезированная речь и визуальные представления [91]. Одной из важных особенностей этого системного проекта является использование логического узла интеграции речевых сообщений и визуальных отображений, предназначенного для определения приоритетов сообщений при появлении множественных опасностей. Все семь пилотов вертолетов, участвовавших в экспериментах, оценили экспериментальную систему обнаружения и обхода опасных объектов как лучшую и более легкую в использовании по сравнению с существующими системами. В современных системах используется тональное кодирование и аналоговое отображение сигналов опасности. Все пилоты выеказа- ли мнение, что речевая и визуальная системы должны хорошо стыковаться друг с другом.
В качестве основного переменного фактора в этом исследовании выступал тип голоса [78]. Сравнению подвергались представленная в цифровой форме женская и мужская речь и некоторый вариант синтезированной речи в той же форме. Хотя не было отмечено никаких различий в качестве выполнения до - лета в зависимости от использованного типа голоса, пилоты отдали предпочтение характерному, как бы механически звучащему голосу. Они выразили крайнее неудовлетворение медлительностью произнесения сообщений при всех трех тицах голосов, обусловленной артикуляционными паузами, которые были введены в метод соединения слов, используемый при генерации сообщений. Непосредственно синтезируемая речь с более естественной просодией была оценена теми же пилотами как более предпочтительная по сравнению с оцифрованной синтезированной или оцифрованной естественной речью в случае женского голоса. В результате исследования был сделан вывод о том, что для некоторого типа интерактивных систем оповещения должна использоваться непосредственно синтезируемая речь. Впоследствии эти средства визуального отображения и речевого вывода вместе с логикой их интегрирования были включены в рабочий экспериментальный образец системы, предназначенный для эксплуатационных испытаний.
Общие тенденции в использовании речевого вывода информации
Несмотря на ограниченную степень общности самих результатов узкоспециальных исследований в области применения речевых систем, существуют общие рекомендации по отбору подходящих для этого функций. В какой-то мере они основаны на экспериментальных данных, но большей частью — на комбинации дедуктивных и индуктивных рассуждений. Например, в работе [19] приведены общие рекомендации по выбору сначала между слуховым и визуальным восприятием, а затем — по выбору между речевым и неречевым звуковым представлением сигналов. Использование звукового (речевого и неречевого) представления, а не визуального (экранного) предпочтительно в следующих случаях:
1. Для подачі предупреждающих сигналов, благодаря мно - гонаправленности слухового восприятия.
2 При наличии чрезмерного количества визуальных отображений.
3. Когда информация должна восприниматься независимо от поворота головы или положения тела.
4. Когда пределы видимости ограничиваются темнотой.
5. В условиях кислородного голодания из-за меньшего снижения чувствительности слухового тракта по сравнению со зрительным.
При этом автор приводит доводы в пользу применения именно речевой системы, а не каких-то других способов отебра - жения:
1. Обеспечивается высокая гибкость системы.
2. Возможна идентификация источника сообщения.
3. От пользователя не требуется знания кодированных сигналов.
4. Обеспечивается решение задач, требующих быстрого двустороннего обмена информацией.
5. Возможно оповещение о будущих действиях, требующих предварительной подготовки.
6. При стрессовых ситуациях отсутствует риск забывания оператором смысла кодированных сигналов.
К сожалению, современное состояние теоретических основ отбора речевых функций не продвинулось далее подобных философский рассуждений.
Авторы работ [72] и [97] независимЬ друг от друга добавили по два одинаковых пункта к сделанным до них выводам:
1. Речевая информация должна быть высоконадежной.
2. Получаемая речевая информация должна использоваться как можно быстрее вследствие ее плохого запоминания человеком.
К этим двум пунктам следует добавить еще вывод Детрид- жа [19]:
3. Использование речевых сообщений минимизирует требования к обработке информации их адресатом, так как исключает необходимость декодирования сигналов.