ЧЕЛОВЕЧЕСКИЙ ФАКТОР

Перспективы исследований по распознаванию речи Моделирование

Методы моделирования необходимы для обеспечения управляе­мого изменения таких характеристик распознающих систем, как скорость распознавания и обратная связь, уровень точности распознавания и типы ошибок распознавания. Кроме того, должны быть разработаны какие-то меры для оценки рабочих характеристик системы, учитывающие одновременно характе­ристики распознающего устройства, характеристики человека, рабочую нагрузку, обусловленную задачей, полезность системы и ее оценку пользователем.

Наиболее важными являются следующие аспекты этой проб­лемы [47]:

1) требования к скорости и точности для различных приме­нений;

2) критичность к ошибкам в зависимости от их типа;

3) способы исправления ошибок;

4) необходимость обеспечения субъектонезависимости;

5) необходимость связной или слитной речи;

6) влияние большого размера словаря;

7) способность человека ограничивать речь в плане лексики, синтаксиса и разговорных выражений.

Результаты моделирования могут быть положены в основу определения подходящих задач для речевого ввода — вывода и необходимого качества распознавания речи, что требуется для успешного использования баз данных с речевым вводом. Моде­лирование может обеспечить образцы речи при разных услови­ях задачи, таких, как шум, умственная нагрузка, стресс и раз­личные уровни ошибок распознавания. Наконец, моделирование должно обеспечить условия для исследований, направленных на развитие общих принципов реализации речевого ввода дан­ных в рамках прикладных систем, работающих в разных ус­ловиях.

Методы регистрации и обучение пользователей

Для субъектозависимых систем необходимы более совершенные методы регистрации речевых эталонов. Эти методы должны га­рантировать работоспособность систем распознавания в более суровых условиях, чем те, в которых осуществляется регистра­ция голосов пользователей. Это должно снизить затраты на ре­гистрацию в части специальных режимов работы оборудования, отвлечение оператора от основной работы, стрессовые ситуации и усталость. Кроме того, если технические средства могут быть приспособлены к автоматическому обновлению эталонов речи в ходе нормальной эксплуатации прикладной системы, то распо­знающая система будет лучше улавливать медленные измене­ния в голосе пользователя, обусловленные, например, устало­стью.

Усовершенствованные методы нужны и для предсказания характеристик системы распознавания речи на основе речевых характеристик пользователя. Например, диалект пользователя может влиять на эффективность распознавания. Поэтому необ­ходимы исследования в области методов прогнозирования «ма - лоперспективиых» пользователей и требуемых в связи с этим корректирующих воздействий. Обучение пользователей умению изменять свою «эталонную» речь крайне сложно, поскольку ре­чевой акт — это трудно изменяемый, жестко усвоенный стерео­тип поведенческого поведения. Степень, в которой обучение мо­жет надежно изменять усвоенный стиль речи, особенно в стрес­совых условиях, еще предстоит установить. Это важный вопрос исследований, особенно для военных применений.

Измерения рабочих характеристик

Усовершенствование способов измерений рабочих характеристик жизненно необходимо для получения достоверных данных, обес­печивающих принятие верных решений относительно разработ­ки системы и оценки ее эффективности. Более подробный ана­лиз ошибок алгоритма распознавания позволит лучше понять влияние различных характеристик пользователя, факторов внешней среды и факторов, связанных с задачей, на точность распознавания. При этом ошибки должны отображаться в фор­ме матрицы неточностей на разных уровнях детализации (зада­ча, фрагмент речи и фонема). Даже сверхточная высококачест­венная регистрация речевых фрагментов в распознающем уст­ройстве с помощью самой лучшей техники звукозаписи при известных управляемых экспериментальных условиях должна выполняться по строгому регламенту, а затем анализироваться с целью обнаружения изменяющихся характеристик речи, кото­рые влияют на качество распознавания.

Качество распознавания речи должно измеряться в рамках реального сценария выполнения задачи как в лабораторных, так и в рабочих условиях, включая самые неблагоприятные. Сравнительные лабораторные испытания с использованием стандартных словарей, опытных пользователей и управляемых условий эксперимента полезны для сопоставления различных устройств распознавания, но недостаточны для предсказания фактических рабочих характеристик действующих систем. Не­обходимо создать адекватные методы измерения рабочих харак­теристик человека-оператора и системы распознавания в реаль­ных условиях. Важность быстрой реакции по сравнению с точ­ностью будет изменяться в зависимости от конкретных условий применения. Скорость ввода команд не всегда является главным критерием эффективности, если пользователь одновременно выполняет какие-то мануальные задачи. Например, эффектив­ность выполнения исходной основной задачи можно повысить, если использовать речевой ввод — вывод в рамках параллельной задачи, даже если эта вторая задача в результате будет решать­ся медленнее, чем первая, но все же с приемлемой скоростью Необходимо также разработать общие критерии, которые долж­ны быть применимы и к событиям внутри задачи, и к выпол­няемому заданию в целом.

Рабочая нагрузка оператора — это тоже важный критерий, так как он может использоваться для сравнения альтернативных проектных решений. В настоящее время пока нет какого-то единственного надежного способа оценки нагрузки человека при выполнении разных задач [95]. Хотя в этой области уже проводится целый ряд исследований, детальное рассмотрение данного вопроса было бы полезно не только для более широко­Го применения систем распознавания речи, но и для решения многих других задач проектирования человеко-машинного ин­терфейса. В гл. 5 тома 4 проблема рабочей нагрузки обсужда­ется подробно.

Так как современный уровень понимания субъективных фак­торов и проблем эргономики в проектировании систем распо­знавания остается по своей природе качественным, в этой главе предлагается ряд количественных оценок. В табл. 3 4 даны ре­комендации по проектированию систем распознавания, которые были извлечены из рассмотренного в этом разделе исследования по распознаванию речи.

ЧЕЛОВЕЧЕСКИЙ ФАКТОР

Этапы проектирования программного обеспечения интерфейса человек — ЭВМ

Проектирование качественного программного обеспечения ин­терфейса человек —ЭВМ не является жестким, статическим процессом. Характер и содержание каждого интерфейса варьи­руются в соответствии с конкретной областью его использова­ния, и в группах разработчиков часто …

Оценка эффективности человеко-машинных систем

Существует целый ряд общих методов оценки эффективности для различных уровней характеристик человеко-машинных сис­тем, однако оценка эффективности распознавания речи в слож­ней задаче управления, связанной с отображением информации, представляется задачей более трудной …

Потребность в документации

Соответствующая документация необходима для обеспечения эффективных и экономичных процедур разработки, использо­вания и сопровождения программных систем в целях организа­ции систематического обмена информацией между управленчес­ким персоналом, разработчиками системы и пользователями на всех …

Как с нами связаться:

Украина:
г.Александрия
тел./факс +38 05235  77193 Бухгалтерия
+38 050 512 11 94 — гл. инженер-менеджер (продажи всего оборудования)

+38 050 457 13 30 — Рашид - продажи новинок
e-mail: msd@msd.com.ua
Схема проезда к производственному офису:
Схема проезда к МСД

Оперативная связь

Укажите свой телефон или адрес эл. почты — наш менеджер перезвонит Вам в удобное для Вас время.