ЧЕЛОВЕЧЕСКИЙ ФАКТОР

Выбор задачи распознавания речи

Один из убедительных доводов в пользу включения средств рас­познавания речи в системы — это возможность понижения ви­зуально-мануальной нагрузки на человека. Однако вывод о необходимости использования речевых сигналов для решения определенной задачи требует согласования характеристик рече­вой системы с характеристикой задачи [74] и анализа преиму­ществ и ограничений «ручного» режима в сравнении с исполь­зованием речевых устройств в контексте выполняемых задач. [48].

Таблица 33 Характеристики типичных интерактивных речевых Систем в различных приложениях [47]


Характеристика

Системы управле ния базами данных

Командно конт­рольные системы

Интерактивные обу­чающие системы

Объем словаря

Рас-

Тип системы познавания

Диктора

Время регистрации пользователей Типичный уровень помех

Типичная нагрузка оператора Эксплуатационные требования1' Время реакции Потребности в реализации систе­мы

Физические огра­ничения (размер, масса, мощность, охлаждение)

Большой, 1000—

5ООО слов

Зависимость от Отсутствует Неприемлемое Очень низкий

Для слитной речи

От низкой до уме ренной

<5% ошибок <5 с

Умеренные

Минимальные

Переменное

От умеренного

Высокого

От умеренной

Высокой

< 1 % ошибок

<1 С

Критические

Жесткие

Маленький, Средний, 50—

<100 слов 500 слов

Дискретная (со Дискретная (со связью между сим- связью между сим­волами) воламн) Имеется Имеется

Менее 5 % общего времени обучения до Очень низкий

До

До От умеренной высокой <3% ошибок

<2 с Высокие

Минимальные


') Вполне определенные требования к обеспечению надежности н жнвучестн диктуют необходимость минимально возможного уровня ошибок для всех частей словаря

Исследования по выбору задач проводились в двух основ­ных направлениях. Некоторые исследователи пытались разра­ботать и применить различные методологии отбора подходящих задач [48] и выяснения пользовательских предпочтений в отно­шении устройств распознавания и генерации речи [7, 18, 35, 96]. Изучались и характеристики ввода данных человеческой речи, когда рассматривались одновременно задачи вербального и руч­ного характера [94].

В работе [93] установлено, что использование речевого вво­да полезно главным образом для решения сложных задач, тре­бующих умственного и психического напряжения, в то время как простые задачи, связанные с передачей числовых данных, выполняются быстрее и точнее при вводе с помощью клавиа­туры. Ряд исследований в рамках смешанной задач" отслежи­вания трассы и одновременного ввода данных [15, 76], прове­денных в условиях шума винта на летящем вертолете, подтвер­дил, что при всех условиях шума и движения показатели точности отслеживания курса ухудшались при использовании
речевого ввода данных намного больше, чем при их вводе с кла­виатуры. В этих экспериментах точность слеження за курсом вертолета и точность ввода с помощью клавиатуры в статиче­ских условиях при отсутствии шума была равна 99%. При на­личии шума и движения точность отслеживания курса незна­чительно снижалась, тогда как при вводе с помощью клавиату­ры она оставалась прежней. Другое исследование подтверждает,, что прн параллельном решении вербальной задачи речевой ввод данных ведет к меньшей потере точности слежения, чем ввод данных с помощью клавиатуры [30]. Согласно этому исследова­нию, процент ошибок распознавания может возрастать до 39% при наличии параллельной задачи слежения, свидетельствуя о том, что умственное напряжение, связанное с решением задачи, оказывает существенное влияние на характер человеческой ре­чи и снижает точность ее распознавания системой [2].

Исследование, в рамках которого сопоставлялись скорость и точность речевого и клавишного ввода данных, дало противо­речивые результаты, зависящие от типа процедур ввода (бук­венно-цифровая или функциональная клавиатура) и других переменных, определяющих задачу. Например, в работе по ис­пользованию речевого ввода в компьютерной военной игре [43] сделан вывод, что ручной метод ввода — более быстрый, чем речевой. Результаты другой работы той же лаборатории — по оценке использования методов распознавания речи для управ­ления функционированием распределенной сетевой системы — показали преимущество речевого ввода по сравнению с ручным как по скорости, так и по точности. Считалось, что различные требования задачи явились основной причиной полученных раз­ных результатов, поскольку большинство других факторов (состав групп пользователей, их профессиональный уровень, характеристики оборудования и среды) не изменялось. Резуль­таты этих исследований наводят на мысль, что польза от при­менения речевого ввода и вывода сильно зависит от специфики задачи и среды, в которой эта задача решается.

Итак, отбор потенциальных задач для применения систем распознавания речи должен быть основан на конкретных усло­виях задачи. Использование речевого ввода вместо ручного не представляется целесообразным, если какие-то задачи уже ус­пешно выполняются с помощью ручного ввода данных [93]. Речевой ввод может увеличивать пропускную способность сис­темы лишь в сложных задачах, с которыми связана высокая мыслительная, визуальная и мануальная нагрузка на человека. Такие ограничения, лимитирующие применение речевого вво­да— вывода, вероятно, существуют независимо от каких-либо улучшений технологии — просто из-за специфических характе­ристик самого речевого сигнала. Эти характеристики и связан­ные с ними проблемы будут детально обсуждены в разделе, посвященном интеграции систем. Ясно одно: необходимо про­должать исследования, чтобы лучше понять сложное взаимо­влияние характера речи, технологии распознавания голоса, действий пользователя и специфики выполняемой задачи.

Для идентификации задач, в которых может оказаться це­лесообразным применение устройств распознавания речи, необ­ходимы создание специальных методов и определение основных принципов. Интервьюирование и анкетирование весьма полезны, но возможности каких-то предсказаний на их основе ограниче­ны, поскольку потенциальные пользователи, хорошо знакомые со своей работой, совсем не разбираются в том, что касается возможностей и ограничений речевой технологии.

Наконец, никакие аналитические процедуры отбора «речевых задач», вероятно, не будут настолько точными, чтобы дать по­дробную спецификацию требований к системе распознавания речи. Поэтому необходимо продолжать работу по методам мо­делирования с целью выработки технических требований к ре­чевой системе уже на ранних этапах процесса проектирования. Этот вопрос будет обсуждаться в следующем разделе, посвя­щенном выбору характеристик системы распознавания речи.

ЧЕЛОВЕЧЕСКИЙ ФАКТОР

Этапы проектирования программного обеспечения интерфейса человек — ЭВМ

Проектирование качественного программного обеспечения ин­терфейса человек —ЭВМ не является жестким, статическим процессом. Характер и содержание каждого интерфейса варьи­руются в соответствии с конкретной областью его использова­ния, и в группах разработчиков часто …

Оценка эффективности человеко-машинных систем

Существует целый ряд общих методов оценки эффективности для различных уровней характеристик человеко-машинных сис­тем, однако оценка эффективности распознавания речи в слож­ней задаче управления, связанной с отображением информации, представляется задачей более трудной …

Потребность в документации

Соответствующая документация необходима для обеспечения эффективных и экономичных процедур разработки, использо­вания и сопровождения программных систем в целях организа­ции систематического обмена информацией между управленчес­ким персоналом, разработчиками системы и пользователями на всех …

Как с нами связаться:

Украина:
г.Александрия
тел./факс +38 05235  77193 Бухгалтерия
+38 050 512 11 94 — гл. инженер-менеджер (продажи всего оборудования)

+38 050 457 13 30 — Рашид - продажи новинок
e-mail: msd@msd.com.ua
Схема проезда к производственному офису:
Схема проезда к МСД

Оперативная связь

Укажите свой телефон или адрес эл. почты — наш менеджер перезвонит Вам в удобное для Вас время.