ЧЕЛОВЕЧЕСКИЙ ФАКТОР

Проблемы человеческого фактора

Хотя специальная литература по проблемам поведенческого фак­тора содержит результаты исследований, которые отображают определенные принципы проектирования речевых систем, на­копленные знания все еще не сформулированы в виде конкрет­ных рекомендаций. Методология учета субъективных факторов уже разработана в достаточной мере, чтобы проводить экспе­риментальное сравнение речевых систем, применяемых в рамках, определенных задач, однако пока еще нет инструментальных средств, которые требуются для определения общих принципов - проектирования универсальных речевых систем. В ближайшее время широкие функциональные возможности моделирования речевых систем в сочетании с новыми критериями оценки рабо­чих характеристик усовершенствованных систем должны стать основой необходимой методологии.

Алгоритмы генерации речи выглядят сегодня более совер­шенными по сравнению с алгоритмами распознавания речи. Выпускаемые промышленностью системы довольно внятно вос­производят текст на английском языке. Противоположная зада­ча распознавания речи и представления ее в текстовой форме, т. е. машинного преобразования речи человека в грамматически и синтаксически корректный текст, не будет решена на уровне систем промышленного изготовления в прогнозируемом буду­щем. Ее реализация в значительной степени ограничивается лабораторными системами, которые работают с фрагментами речи, составленными из элементов ограниченного словаря при определенном синтаксисе, и ориентированы на небольшое число известных системе дикторов. Суть интерпретации такого боль­шого различия в решении двух, казалось бы, похожих задач состоит в том, что оно лишний раз подтверждает большое пре­имущество человека перед машинными алгоритмами, когда ра­бота выполняется в условиях изменчивости речевого сигнала. Люди быстро осваиваются с незнакомым акцентом машинной речи, тем самым компенсируя недостатки, свойственные машин­ному алгоритму. В то же время, когда люди взаимодействуют с современными машинами посредством речевого ввода инфор­мации, они должны (насколько это возможно) предотвращать обычную для их речи изменчивость, чтобы алгоритм распозна­вания работал в условиях минимально возможного разнообра­зия входного сигнала. На рис. 3.5 схематически показан про­цесс, который можно назвать «оперативным распознаванием». Легко заметить, что данная схема получена из рис. 3.4, иллюст­рирующего понятие операционной разборчивости.

В настоящее время «оперативное распознавание» реализо­вано лишь на рудиментарном уровне использования прагмати-
веского и лингвистического контекстов. По мере накопления. знаний и углубления понимания систематических лингвистиче­ских и прагматических изменений речи человека и по мере того, как полученные результаты будут использоваться в алгоритмах машинных речевых систем, можно ожидать, что алгоритмы рас­познавания станут работать в значительно более широком диапазоне речевых контекстов, а алгоритмы генерации смогут обеспечить такое звучание искусственной речи, которое будет нести в себе дополнительные характерные признаки, существен­ные для воспринимающего речевой сигнал человека. Такие тех-

Факторы, способствующие оперативному распознаванию речи


Характерис­тики других сигналов

Характе - ристики шума

I Разборчивость основных Фонем

Характерис­тики физи Чесного сигнала

IПрагматический. 1 1 контекст 1

Лингвистическиил контекст 1

Щг

Фильтрация ",слушателем " на основе зна - Ний реального мира

Фильтрация "слушателем" на основе Лин г - биотических знаний

«

*

Оперативное распознавание речи

Рис. 3.5. Факторы, способствующие оперативному распознаванию в рабочих условиях ([44] согласно Симпсону).

Нологические достижения расширят область пересечения задач, подходящих для речевого режима, и речевых систем, характе­ристики которых отвечают требованиям конкретной задачи. Однако рассмотренные в данной главе основные проблемы про­ектирования будут актуальны независимо от состояния техно­логии речевых систем.

В ближайшее время современные алгоритмы распознавания смогут использоваться в рабочей среде, характеризуемой низ­ким или средним уровнем шума (до 85 дБ), для применений, в которых требуются небольшие словари и которые не связаны с возникновением стрессовых ситуаций для пользователя. Усо­вершенствование методов распознавания речевых сигналов в условиях фонового шума сокращает воздействие этого источни­
ка изменчивости на фрагменты речи, подлежащие распознава­нию. Однако в случае изменчивости, связанной со стрессами, достижимая точность распознавания и допустимые пределы из­менения рабочих характеристик распознающего алгоритма, когда пользователь находится в стрессовой ситуации, не из­вестны. Следовательно, при использовании современной техно­логии распознавания речи должна проявляться особая осторож­ность в случае применений, связанных со стрессовой обста­новкой.

В то же время современные алгоритмы генерации речи хо­рошо зарекомендовали себя в условиях сильного шума и высо­кого уровня рабочей нагрузки. Они вполне пригодны для прак­тического применения при надлежащем учете обсуждавшихся здесь аспектов интеграции субъективных факторов.

Технологии распознавания и генерации речи в ближайшее время смогут совместно использоваться в отдельных приклад­ных системах. Критичные аспекты такого ближайшего приме­нения связаны главным образом с учетом субъективных факто­ров. В перспективе потребуются существенные усилия как в разработке алгоритмов, так и в исследовании субъективных факторов для того, чтобы расширить границы допустимой из­менчивости речи, приемлемые для систем распознавания и ге­нерации, и, следовательно, сделать более широким диапазон возможных применений речевой технологии.

ЧЕЛОВЕЧЕСКИЙ ФАКТОР

Этапы проектирования программного обеспечения интерфейса человек — ЭВМ

Проектирование качественного программного обеспечения ин­терфейса человек —ЭВМ не является жестким, статическим процессом. Характер и содержание каждого интерфейса варьи­руются в соответствии с конкретной областью его использова­ния, и в группах разработчиков часто …

Оценка эффективности человеко-машинных систем

Существует целый ряд общих методов оценки эффективности для различных уровней характеристик человеко-машинных сис­тем, однако оценка эффективности распознавания речи в слож­ней задаче управления, связанной с отображением информации, представляется задачей более трудной …

Потребность в документации

Соответствующая документация необходима для обеспечения эффективных и экономичных процедур разработки, использо­вания и сопровождения программных систем в целях организа­ции систематического обмена информацией между управленчес­ким персоналом, разработчиками системы и пользователями на всех …

Как с нами связаться:

Украина:
г.Александрия
тел./факс +38 05235  77193 Бухгалтерия
+38 050 512 11 94 — гл. инженер-менеджер (продажи всего оборудования)

+38 050 457 13 30 — Рашид - продажи новинок
e-mail: msd@msd.com.ua
Схема проезда к производственному офису:
Схема проезда к МСД

Оперативная связь

Укажите свой телефон или адрес эл. почты — наш менеджер перезвонит Вам в удобное для Вас время.