Выбор испытательных средств
Выбор испытательных средств и методов для оценки технологии создания речевых систем до сих пор не систематизирован. Тем не менее прикладные исследования стали весьма полезным инструментом идентификации характеристик соответствующих применений, изучения проблем человеко-машинного взаимодействия, требуемых функциональных возможностей систем и оценки необходимости реализации систем распознавания речи в рамках прикладных систем. Следующие ниже примеры применения, заимствованные из работы [47], дают представление о практическом применении технологии распознавания речи.
Пример 1: интегрированная система отображения информации
Главный командный центр военно-морского флота имеет доступ к текущей информации относительно местоположения в оперативной зоне кораблей дружественных стран или известных кораблей противника. Большая часть этой информации автоматически корректируется в соответствии с данными, передаваемыми непосредственно кораблями США (сведения о текущей дееспособности, местоположении и предполагаемом перемещении), или с данными, поступающими от других автоматических «интеллектуальных» датчиков. Эта информация принимается, обрабатывается вручную и отображается в табличной или графической форме с помощью интегрированной системы отображения информации.
Оборудование для систем распознавания речи прошло начальную фазу испытаний в интегрированной системе отображения информации [59]. Руководство военно-морского флота рассматривает указанную систему как средство, позволяющее сократить время подготовки новых или нечасто работающих пользователей. Опытным пользователям это дает возможность решать более сложные задачи (например, корреляционного анализа) и гарантировать корректность информации в системе.
Во время проведения испытаний как пользователи, так и руководители с энтузиазмом отнеслись к появлению системы распознавания, однако спустя некоторое время потеряли к ней интерес. Это объясняется неадекватным размером словаря и проблемами аппаратного интерфейса, которые явились помехой для полномасштабной реализации управления работой терминального оборудования с помощью речевых команд. Возможности испытываемых средств ограничивались примерно 250 рече - выми выражениями, в то время как для полной реализации нужных операций необходимо свыше 1000 речевых фрагментов. Пример 2: технологический интегратор для перспективного истребителя F-16
ВВС, ВМФ и НАСА США субсидировали программу летных испытаний интерактивных речевых систем, разработанных специально для тяжелых летных условий современного истребителя ВВС. Программа включала проведение обширных автономных и комплексных испытаний систем распознавания речи до начала летных испытаний. Значительные улучшения в оценке точности распознавания были отмечены на этих этапах программы. Субъ - •ектозависимая система распознавания со словарем небольшого объема (35 слов) была предназначена для летных испытаний, а подмножество этого словаря из 10 слов было испытано в «активном» режиме для фактического управления некоторыми системами ВВС.
Опыт, полученный в ходе реализации этой программы, будет использован при оценке операционной эффективности системы. В ходе испытаний было обнаружено, что собственное отношение пилота к интерактивным речевым устройствам тоже влияет на работу системы. Повышение точности распознавания способствовало одобрению системы пилотом во время летных испытаний.
Пример 3: тренажерная система с РЛС для обеспечения точного захода самолетов на посадку и тренажер для операторов ВВС.
Центр тренажерного оборудования ВМС субсидировал разработку двух экспериментальных тренажерных систем: для операторов РЛС в системе управления течного захода на посадку и для операторов систем перехвата [5, 28]. Обе экспериментальные системы продемонстрировали возможность отказа от использования человека в таких системах в роли «псевдопилота» и возможность исключения автоматических команд и измерения характеристик в случае реализации вербальных задач, что уменьшает рабочую нагрузку оператора. Задачи операторов системы управления воздушным движением хорошо подходят для реализации средств автоматического распознавания речи, поскольку в данном случае от обучаемого требуется овладение высокоструктурированной профессиональной речью.
Эти тренажерные системы с самого начала проектировались в расчете на речевую технологию, а не приспосабливались к возможностям распознавания речи «задним числом». Точность распознавания в таких системах значительно важнее обеспечения комфортного взаимодействия обучаемого с системой. В первой системе используется распознаватель дискретных фрагмеи - тов речи, во второй — распознаватель слитной речи. Обе системы достаточно хорошо приспособлены к изменчивости речи обучаемых под влиянием моделируемых эксплуатационных условий. Обучаемые, в частности, были в невыгодном положении при использовании системы распознавания речи, поскольку не имели большого опыта в речевой связи и требовалось обучать их как новой работе, так и методам речевого управления.
В работе [41] отмечено, что, к сожалению, программа разработки системы была изначально претенциозна: в ней предусматривались и автоматические команды, и автоматическое измерение рабочих характеристик, и адаптивное изменение программы обучения, и моделирование поведения пилота, и воспроизведение окружающих условий. Все эти подсистемы непосредственно взаимодействовали с подсистемами распознавания речи, а следовательно, и любые ошибки в распознавании речи усиливались последующими операциями системы [40, 41].
Тем не менее экспериментальные тренажерные системы продемонстрировали возможность речевого взаимодействия при моделировании систем реального времени в сочетании с разнообразными автоматическими средствами распознавания. Системные расчеты показали, что незначительное увеличение точности распознавания должно вести к существенно более эффективному обучению.
Выводы по примерам прикладных систем
Анализ рассмотренных здесь и других примеров применения, заимствованных из доклада [47], позволяет сделать некоторые выводы относительно технологии распознавания речи и ее реализации в различных системах:
1. Точность распознавания является одним из главных ограничений.
2. Изменчивость человеческой речи в стрессовых условиях делает характеристики системы неприемлемыми.
3. Успех интерактивных речевых систем в большинстве применений является результатом их интеграции с другими процедурами или автоматическими системами.
4. Более успешно реализуются проекты, на начальной стадии разработки которых сразу предусматривается интерактивная речевая система, а не добавляется потом к уже существующей.
5. Сильносвязанные системы, которые зависят от точности распознавания вводимых данных, имеют тенденцию к усилению влияния последствий ошибок распознавания.
6. Поэтапный процесс разработки интерактивной речевой системы, включающий периодические проверки и испытания ее пользователями, приводит к более качественной системе.
7. Регистрация речевых характеристик диктора (в субъек - тозависимых системах) обычно более эффективна тогда, когда проводится в ходе выполнения оперативного задания.
8. Другие функции речевого общения в рамках задачи регистрации субъектов иногда создают помехи решению задачи распознавания речевых сигналов.
9. Для задач, темп решения которых задается извне, синхронизация последовательности выполняемых действий нарушается вследствие либо большого времени распознавания, либо ошибок в распознавании.
10. Отсутствие механизма обратной связи при длительных ожиданиях в системах распознавания приводит к возникновению беспокойства операторов по поводу работоспособности системы.
Прикладные области, в которых можно ожидать высокой эффективности системы распознавания речи, разделяются по функциональному признаку. Так, военные применения классифицируются по следующим категориям: 1) системы управления базами данных; 2) командно-контрольные системы; 3) обучающие системы [47]. Как следует из табл. 3.3 [47], характеристики систем распознавания речи, требующиеся для этих трех видов применений, различны. Приведенные здесь функциональные категории были установлены применительно к системам военного назначения, однако их можно использовать и в более широком диапазоне. Например, характеристики систем управления базами данных и функциональные категории тренажерных систем применимы также в промышленности и медицине для задач распознавания речи. А характеристики военных командно-контрольных систем могут быть использованы при проектировании систем речевого управления техническими средствами, предназначенных для людей, страдающих физическими недостатками. Например, речевое управление инвалидной коляской должно отличаться высокой надежностью и малым временем реакции, работать при умеренном н высоком уровнях нагрузки инвалида-оператора и удовлетворять жестким физическим ограничениям.