Исследования в области систем генерации речи
Надлежащим образом спроектированные средства автоматической генерации речевых сигналов в принципе могут ослаблять нагрузку на органы зрения пользователя при выполнении задач, требующих визуального восприятия информации. Примеры таких задач — это выполнение технического обслуживания и ручных ремонтных операций, наблюдения с помощью микроскопа или других визуальных систем; чтение топографических карт во время полета в «тесном» воздушном пространстве; контроль многочисленных визуальных сообщений, выдаваемых на дисплей для управления работой АЭС; одновременное управление манипулятором и множеством телекамер, расположенных на космических станциях или подводных аппаратах; наблюдения разнообразной отображаемой информации о состоянии организма человека во время хирургической операции; редактирование текста на экране дисплея. В таких ситуациях пользователь не просто связан с визуальным восприятием информации, но и должен быть способен сохранять внимание, что сильно влияет на эффективность выполнения задачи. Поэтому речевые сообщения, несущие определенную информацию, могут оказаться более результативными для эффективного выполнения конкретной задачи, чем визуальное отображение информации.
Стратегия эффективного использования средств генерации речи подобно стратегии ее распознавания имеет три аспекта, в соответствии с которыми необходимо разработать методологии: 1) идентификации возможных областей применения, 2) выбора подходящих алгоритмов и системных характеристик и 3) реализации подсистем генерации речи в рамках проектов речевых интерактивных систем.
Выбор задачи
Оцените преимущества в скорости и точности выполнения задачи с использованием речевых устройств по сравнению с обычными в сложиых задачах ввода ииформации, которые должны выполняться одновремеино с другими задачами с визуальным представлением и ручными операциями. Выберите режим распознавания речи на основе анализа специфических требований конкретного применения.
Проектирование сообщений
Изучите взаимосвязи размера словаря, времени распознавания (которое обычно возрастает с увеличением объема словаря) и словарных единиц системы распознавания (букв, слов, фраз).
Избегайте включения в словарь системы элементов с подобным звучанием Старайтесь использовать в словаре терминологию системы распознаваиия, которая хорошо знакома пользователям, а в случае субъектозавнсимых систем давайте возможность пользователям самостоятельно выбирать нужные им слова для реализации системных функций, управляемых голосом. Включайте в систему распознавания синтаксическую информацию для ограничения числа альтернативных эталонов (которые сравниваются с речевым фрагментом говорящего субъекта) лишь теми из них, которые допустимы из условия, что данное речевое выражение ранее уже распознавалось.
Измерение рабочих характеристик
Для прогнозирования эффективности функционирования системы определите качество распознавания прн фактических нлн смоделированных рабочих условиях.
Проанализируйте ошибки распознавания по тнпу (подмена, непризнание, ложная вставка, ложное исключение) с целью более правильной оценки словарей прикладных систем.
Для оценки точности распознавания сообщения на основании показателей точности распознавания слов возьмите частоту ошибок распознавания слов н возведите ее в степень, равную числу слов в типичном сообщении. Оцениваемая точность распознавания сообщения будет равна разности между единицей и частотой ошибок распознавания сообщения. Заметим, что эта формула не учитывает аспектов синтаксического ветвления, обусловленных допустимыми вариантами синтаксической структуры сообщения Определите рабочие характеристики человеко-машинной системы с учетом критериев ее работоспособности, времени и точности реакции и приемлемости для пользователя
Обучение пользователей
Обеспечьте профессиональную подготовку пользователей системы распознавания речи для лучшего согласования особенностей их произношения и рабочих характеристик используемого микрофона.
Принимайте решения в предположении плохой согласованности этих характеристик примерно у 25% людей. Обеспечьте необходимое время практической работы пользователя с системой в качестве подготовительно™ мероприятия.
Регистрация речи пользователя распознавателе г
Д Ія субъектозависимых систем, которые должны использоваться при уровне шма ~85 дБ (SPL) нли при наличии больших ускорений, предусмотрите регистрацию и адаптивное расиознаванне речи пользователей в реальной рабочей среде.
Продолжение
Представьте элементы регистрационного словаря в случайном порядке, с тем чтобы обеспечить более надежную исходную регистрацию и последующее обновление эталонов.
В процессе регистрации речевых эталонов используйте визуальный, а не речевой канал для выдачи наводящих сообщений оператору.
Системное проектирование
С самого начала работы над проектом учитывайте наличие в системе речевых устройств.
Так как тяжесть последствий ошибок распознавания изменяется в зависимости от особенностей прикладной области, оцените относительную опасность различных типов ошибок в конкретной прикладной системе. Всегда, когда это возможно, включайте в систему адаптивные алгоритмы распознавания. Во всяком случае обеспечивайте возможность изменения эталонов в процессе работы оператора с системой.
Рассмотрите потенциальные конфликты между речевыми сообщениями, предназначенными для распознавателя, и другими речевыми взаимодействиями между людьми в рабочей обстановке.
Примите также во внимание возможные противоречия между необходимостью двустороннего речевого взаимодействия оператора с системой распознавания н речевого общения с другими людьми, которых он должен выслушивать.
В системах, не имеющих синтаксических и прагматических ограничений, минимизируйте длину сообщений, если это возможно, для увеличения скорости Нх распознавания (см. оценку точности раепознавания сообщений в разделе «Измерения рабочих характеристик»).
Обеспечьте обратную связь системы с оператором по состоянию и по результатам распознавания. Чем оперативиее будет эта обратная связь, тем меньше ошибок сделает оператор в рабочей обстановке. Сделайте представляемые по каналу обратной связи сообщения совместимыми с требованиями к прикладной системе путем выбора соответствующего режима обратной связи и обеспечения ее лаконичности.
Предоставьте пользователю возможность исправления ошибок распознавания. Обеспечьте системную проверку для выявления недопустимых речевых команд.