ЧЕЛОВЕЧЕСКИЙ ФАКТОР

Системная интеграция

Вопросы системной интеграции, образующие третье направле­ние исследований в области речевых систем, должны преду­сматривать выработку требований к технологиям распознавания и генерации речи в их синергическом единстве. Визуальные и мануальные возможности человека часто ассоциируются соот­ветственно с перцептуальными и моторными (типа вход — вы­ход) характеристиками. Подобным же образом речевые возмож­ности характеризуются идентифицируемыми параметрами про­цессов восприятия и воспроизведения человеческой речи, которые должны стать (либо естественным образом, либо через проектные решения) базисом для формулирования требований к интерфейсам речевых систем ввода — вывода.

Выбор задачи

Если речевые системы используются в пилотской кабиие, то применение неожиданных для летчика сообщений ограничивается только предупрежде­ниями о наиболее критичных ко времени ситуациях. Любые другие функции речевого вывода следует ограничить выводом информации по запросу пило­та. Отметим, что пнлот может запросить информацию (обратиться за сове­том) по определенным операциям, характеристикам конкретного полета или параметрам системы. Следует рассмотреть вопрос об использовании речевого вывода информации, когда пользователь настолько загружен визуальной ин­формацией, что всякие дополнительные визуальные команды при определен­ном уровне зрительной нагрузки оказываются недопустимыми. Отнесение тех или иных дополнительных команд к неприемлемым зависит от решаемой конкретной задачи. Речевой режим следует использовать для выдачи сооб­щений о дискретных событиях, а не для считывания непрерывно изменяю­щихся показаний аналоговых приборов. Не следует прибегать к речевому режиму н для выдачи длинных подробных сообщений или запоминаемой информации, речевое представление которой не дает пользователю никакого выигрыша по сравнению со средствами визуального отображения

Подготовка пользователей

Следует обеспечить обучение пользователей восприятию особенностей применяемых речевых сообщений

Характеристики речи

Необходимо выбирать подходящий тип голоса соответственно источнику речевых сообщений: для машинных сообщений, адресуемых оператору, сле­дует использовать «механический» голос; когда же моделируется речь чело­века, должен использоваться голос естественного звучания. При моделирова­нии человеческой речи может оказаться желательной имитация речи с уче­том местного акцента, пола и возраста говорящего. Независимо от типа Імлоса необходимо использовать по возможности лучшие аппроксимации < стественных просодии. Для предупреждающих сообщений рекомендуемая скорость речи составляет примерно 150 слово/мин. Меньшая скорость может быть желательна для обучения лнц, которые незнакомы с речевым акцентом, или для реализации других функций, не связанных с оповещением. Пока не будут получены результаты новых исследований, наилучшая скорость речи лля конкретного применения должна определяться экспериментально. Если искусственный «машинный» голос используется исключительно для преду­преждений, то не следует подавать какие-либо предварительные привлекаю­щие внимание неречевые звуки. Если же машинный голос служит не только для предупреждающих сообщений, но и для реализации других функций (на­пример, для выдачи советов, ответов на запросы пользователей и др.), то в речевые предупреждения должны включаться предваряющие сигналы, при­влекающие внимание. Такими упреждающими сигналами могут быть голос более высокого тона, взволнованный голос и неречевые сигналы нлн какие-то иные признаки, которые идентифицируют предупреждающие сообщения, делая их легкоразличимыми, и могут способствовать повышению качества распо­знавания без сопутствующего увеличения времени реакции человеко-машин­ной системы

Конструирование сообщений

Чтобы обеспечить лингвистический Контекст, достаточный для понимания предупреждающего сообщения с началом его Звучання, такое сообщение лолжно состоять как минимум из четырех слогов. Необходимо, чтобы сооб­щение соответствовало характеру задачи и в нем использовалась знакомая

Продолжение

Пользователям терминология. Следует избегать многословности выдаваемых подсказок и ответов, ограничивая их согласно требованиям со стороны зада­чи ко времени реакции и допустимой частоте ошибок

Измерение рабочих характеристик

Следует оценивать разборчивость сообщений в рабочей обстановке и. ч» в моделируемых условиях Подходящими характеристиками человеко-маши-і - иых систем являются меры их операционной релевантности: времн реакшш системы, точность реакции и приемлемость для пользователя

Проектирование системы

Не следует использовать в речевых системах ненадежную информацию Надо рассмотреть возможные конфликтные ситуации, обусловленные боль­шим числом речевых сообщений, а также необходимостью одновременною восприятия одних и произнесения других сообщений. Если речевым способом передается критичная ко времени информация (например, предупреждение), то необходимо использовать какую-то систему предпочтений для упорядоче­ния одновременно появляющихся речевых сообщений таким образом, чтоСы первым поступило наиболее важное из них. Для предупреждающих сообще­ний следует обеспечить пользователя возможностью их отмены по мере и* восприятия Повторять предупредительную информацию через какое-то Опре деленное время (см. следующую рекомендацию) необходимо только в том случае, если условие, породившее это предупреждение, сохраняется. Для пре­дупреждающих сообщений время ожидания повторной передачи зависит от серьезности последствий для пользователя, не справившегося с задачей. В речевом меню, не дублируемом визуальным отображением, должно бьгь не более трех позиций

Критическими для интеграции субъективных факторов явля­ются вопросы проектирования соответствующих рабочих опера­ций с учетом возможностей речевых систем и проблемы проек­тирования человеко-машинных диалогов.

Проектирование рабочих операций

Системы, в которых используется речевой ввод — вывод, должны проектироваться с учетом характеристик речевых сиг­налов. Определенные уникальные свойства речевого режима затрудняют однозначное отображение индивидуальных органов ручного управления на методы речевого управления и визуаль­ных элементов представления информации на речевые сообще­ния [17, 74, 97].

Речь — это дискретная, одноканальная, всенаправленная, сложная система кодирования передаваемой информации с хо­рошо известной семантической структурой. Она всегда привле­кает внимание пользователя и не должна нести ему ложную ин­формацию. Использование речевых сигналов для управления различными системами при правильной реализации может ис­ключить необходимость изучения специальных языков, подоб - ных языкам программирования для ЭВМ, и стать альтернати­вой системам ручного ввода.

На передачу информации затрачивается какое-то время, и «слушатель» (человек или машина) может неправильно по­нять адресованное ему сообщение на фоне других речевых со­общений, звуковых сигналов или шума. Обусловленные речевым режимом ограничения (время на передачу и единственный ка­нал) должны рассматриваться при любой реализации речевого вывода и управления. Кроме того, определенные свойства речи ограничивают способ ее использования в человеко-машинных системах. Речевой канал не всегда обеспечивает наиболее быст­рый способ взаимодействия с системой. Время, затрачиваемое оператором на выполнение речевой команды, сильно зависит от таких параметров, как состав словаря, синтаксические ограни­чения и особенно от схемы организации диалога.

Получатель некоторого сообщения, будь то человек или ма­шина, испытывает большие затруднения при обработке одно­временно нескольких сообщений. Это является результатом то­го, что речь представляет собой «одноканальный код», так как, во-первых, ни люди, ни современные машины не могут одно­временно говорить и слушать, не допуская ошибок, и, во-вторых, те и другие способны эффективно работать одновременно толь­ко с одним речевым сообщением. Следствием этого ограничения является недопустимость наложения речевых команд на другие речевые сообщения или посторонних разговоров.

Речевое сообщение существует мимолетно, если только его не записывают с целью последующего воспроизведения. Огра­ниченность памяти человека может явиться причиной затрудне­ний оператора при определении места речевых сообщений в структуре команд системы распознавания, если не установлена надлежащая обратная связь и нет подсказок. Условия, при ко­торых это утверждение справедливо, требуют дальнейших ис­следований, базирующихся на предыдущих результатах [46].

Вообще современная технология распознавания обусловли­вает использование словаря, состоящего из акустически разли­чимых слов. Словарный состав и синтаксис должны быть огра­ничены. В будущем эти ограничения могут быть постепенно уст­ранены, но нельзя рассчитывать на это без большого продвиже­ния в фундаментальном понимании изменчивости речи человека и использовании полученных знаний в алгоритмах распозна­вания.

Однако независимо от успехов технологии распознавания ограниченные характеристики производительности и пропуск­ной способности человека будут определять словарные и син­таксические ограничения для речевых систем. Чтобы сделать "минимальными умственную нагрузку человека и время, затрачи­ваемое на выдачу речевых команд, каждая команда должна со­стоять из небольшого числа слов. Требуется дополнительная информация относительно свойств памяти человека при ограни­ченном вербальном материале и влияния вводимых ограниче­ний на характеристики системы. Особый интерес представляет информация о влиянии тяжелых условий внешней среды и стрессов на вербальную память (в сравнении с моторной) и на характеристики системы. Исследования в этой области приведут к выработке рекомендаций по определению целесообразного словарного состава, который должен быть гибким, легко запо­минаемым, уменьшающим число ошибок акустического восприя­тия и сводящим к минимуму неудачную речевую стилизацию. Подобные рекомендации необходимы и для разработки фор­мальных грамматических правил, чтобы облегчить распознава­ние без установления излишних ограничений, которым должен подчиняться пользователь.

Проектирование человеко-машинного диалога

Тщательное проектирование всех видов взаимного обмена ин­формацией между человеком и системой (а не только речевого обмена) будет оказывать основное благоприятное влияние на рабочие характеристики системы в целом. Существует по край­ней мере два уровня проектируемых диалогов: диалог между пользователем и речевой системой и диалог между пользовате­лем и всеми подсистемами под его управлением.

Человеко-машинное взаимодействие (диалог) необходимо проектировать с учетом всей совокупности возможностей управ­ления и отображения информации для всех подсистем. Сцена­рии различных действий и задач должны анализироваться в аспекте речевой и других нагрузок и вероятности взаимного влияния речевых сообщений. Должны быть определены харак­теристики функций, пригодных для реализации речевого управ­ления, а также приоритеты всех речевых сообщений в рамках системы. Речевые команды и сообщения следует использовать так, чтобы они дополняли, а не мешали получению информации от других средств управления и отображения. Новые исследо­вания и разработки должны быть направлены на решение этих вопросов.

Для увеличения пропускной способности речевой системы важно проектировать диалог таким образом, чтобы способство­вать быстрому обмену информацией между человеком и маши­ной. При проектировании диалога должны быть также миними­зированы возможность появления ошибок и время, требуемое на исправление их пользователем. Тщательной проработке под­лежат не только речевые команды, но и элементы диалога, та­кие, как подсказки, системная обратная связь и ответы на за­просы. Необходимо также оценивать временные характеристики полного диалога. Желаемый тип и степень лингвистической из­быточности для конкретного применения определяются экспери­ментально. Разработка синтаксиса должна рассматриваться как неотъемлемая часть процесса проектирования речевой сис­теми, а не просто как метод повышения эффективности уже.- созданной системы распознавания или генерации речи.

Частота ошибок, свойственная современным системам, навер­няка сможет быть уменьшена, если проектировщик обеспечит для пользователя удобные вспомогательные средства, например тональные предупреждения с изменением частоты, меню допус­тимых входных сообщений, согласованную обратную связь и удобные команды коррекции ошибок. В дальнейших исследова­ниях должен быть определен наилучший формат для этих эле­ментов диалога.

Необходимы новые методы для эффективного использования семантических и синтаксических ограничений диалога. Эти ме­тоды могли бы улучшить автоматическое обнаружение и кор­рекцию ошибок, увеличив тем самым точность распознавания и уменьшив пользовательские затраты времени на обнаружение и исправление ошибок.

На верхнем уровне проектирования диалога речевой ввод —■ вывод должен быть тщательно состыкован со всей системой уп­равления и отображения для того, чтобы предотвратить пере­грузку речевого канала восприятия [74]. Информация опреде­ленного типа может быть обработана лучше, если она пред­ставлена именно в речевой форме; для информации другого ти­па могут потребоваться графическая, текстовая или простран­ственная формы представления. Основательное исследование [94] было посвящено проблеме совместимости способа пред­ставления информации с характером решаемой задачи и послу­жило доказательством того, что для задач некоторых типов речь является лучшим способом взаимодействия по сравнению с ручным вводом и визуальным выводом. Если человек выпол­няет две задачи одновременно: одну — пространственную, дру­гую — вербальную, то пространственная задача будет выпол­няться лучше, когда в рамках вербальной задачи используются средства генерации и распознавания речи, чем в случае, когда обе задачи реализуются с использованием ручного и визуаль­ного каналов.

Это фундаментальное исследование, однако, не затронуло вопросов организации речевого диалога. Необходимо провести дополнительную работу по изучению совместимости различных каналов взаимодействия на примере реальных задач, чтобы облегчить выбор подходящих сфер использования интерактив­ных речевых систем в целях сокращения рабочей нагрузки оператора. Однако успешность функционирования речевых сис­тем при решении какой-то конкретной практической задачи не гарантирует эффективности функционирования всей прикладной системы в целом. Базовые ограничения, свойственные челове­ческой памяти и способности человека к переработке информа­ции, должны обязательно учитываться при проектировании че­ловеко-машинного интерфейса и особенно при использовании речевого режима.

Применительно к оператору многие задачи, связанные с современными сложными системами управления и отображения, могут быть решены путем лучшего проектирования на уровне всей системы. Речевое управление и отображение могут сыграть свою роль в таких ситуациях, но решение об их применении может быть принято только после всестороннего анализа или моделирования с целью сравнения речевого режима управления и отображения с альтернативными.

ЧЕЛОВЕЧЕСКИЙ ФАКТОР

Этапы проектирования программного обеспечения интерфейса человек — ЭВМ

Проектирование качественного программного обеспечения ин­терфейса человек —ЭВМ не является жестким, статическим процессом. Характер и содержание каждого интерфейса варьи­руются в соответствии с конкретной областью его использова­ния, и в группах разработчиков часто …

Оценка эффективности человеко-машинных систем

Существует целый ряд общих методов оценки эффективности для различных уровней характеристик человеко-машинных сис­тем, однако оценка эффективности распознавания речи в слож­ней задаче управления, связанной с отображением информации, представляется задачей более трудной …

Потребность в документации

Соответствующая документация необходима для обеспечения эффективных и экономичных процедур разработки, использо­вания и сопровождения программных систем в целях организа­ции систематического обмена информацией между управленчес­ким персоналом, разработчиками системы и пользователями на всех …

Как с нами связаться:

Украина:
г.Александрия
тел./факс +38 05235  77193 Бухгалтерия

+38 050 457 13 30 — Рашид - продажи новинок
e-mail: msd@msd.com.ua
Схема проезда к производственному офису:
Схема проезда к МСД

Партнеры МСД

Контакты для заказов оборудования:

Внимание! На этом сайте большинство материалов - техническая литература в помощь предпринимателю. Так же большинство производственного оборудования сегодня не актуально. Уточнить можно по почте: Эл. почта: msd@msd.com.ua

+38 050 512 1194 Александр
- телефон для консультаций и заказов спец.оборудования, дробилок, уловителей, дражираторов, гереторных насосов и инженерных решений.