ЧЕЛОВЕЧЕСКИЙ ФАКТОР

Модели восприятия речи

Модели восприятия речи человеком могут обеспечить полезную основу для оценки характеристик человека, используемых в ал­горитмах генерации речи. Они также могут лечь в основу ме­тодов повышения эффективности алгоритмов распознавания

Уровень

Таблица 32 Уровни лингвистической структуры

Элементы


Диалог или беседа

Кодирование на уровне предложений

Или выражений

Кодирование на уровне морфем Кодирование на уровне фонем Кодирование на уровне контекстно зависимых звукосочетаний

Идеи, информация, намерения Упорядоченные слова

Упорядоченные корни, аффиксы Отличительные свойства Частотные компоненты, амплитуды, длительность, периодичность, шум» паузы, скорость изменения звукосоче­таний


Речи. Большинство современных моделей восприятия речи че­ловеком основывается на концепции аналитического синтеза [86]. Согласно этой модели, люди декодируют речь посредством умозрительного синтеза альтернативных интерпретаций и срав­нения их с поступающими речевыми сигналами, чтобы опреде­лить степень соответствия. Уровень лингвистической структуры, на котором применима такая модель, является предметом серь­езных дискуссий. Некоторые ограничивают область применения этой модели уровнем распознавания отличительных свойств от­дельных фонем, когда алгоритм отличает одну фонему от дру­гой или обнаруживает ее отсутствие либо различает длительно­сти фонем. В противоположность такому подходу могут исполь­зоваться эталоны естественного языка в предположении, что модель аналитического синтеза способна работать на уровне связного разговора в пределах нескольких предложений.

Основная идея, состоящая в том, что люди при декодирова­нии речи используют свои знания лингвистической структуры соответствующего языка, вполне приемлема. В табл. 3.2 пред­ставлены различные уровни лингвистической структуры и со­ставляющие их элементы.

На каждом лингвистическом уровне существуют ограниче­ния на возможные комбинации и упорядочение элементов. Се­мантические ограничения на уровне беседы и высказывания определяются теми допустимыми понятиями и словами, которые имеют смысл в контексте других понятий и слов. Обычно праг­матические ограничения применяются также для сужения круга возможных интерпретаций воспринимаемого предложения в ус­ловиях реальной действительности в соответствии с уровнем знания слушателем текущего состояния реального мира. Син­таксические ограничения определяют возможный порядок слов в предложении. В английском языке прилагательные предшест­вуют существительным, которые они определяют. Во француз­ском языке прилагательные обычно следуют за существитель­
ными. Морфемы — это наименьшие значимые языковые единицы. К ним относятся корни и аффиксы (приставки и суффиксы). Английское слово faithfully состоит из трех морфем: корня faith, суффикса ful со значением «иметь свойство» и суффикса 1у, указывающего, что это слово представляет собой наречие, образованное от глагола. Фонологические ограничения опре­деляют порядок расположения фонем в словах. Английский язык содержит слова, которые оканчиваются фонемой. Так, в конце слова sing, записанного с использованием международ­ной фонетической транскрипции (Международная фонетическая ассоциация, 1949 г.), стоит символ |ті|. В английском языке также есть слова, оканчивающиеся фонемой |п|, например сло­во sin. Однако, в то время как фонема |п| может встречаться и в начале слова, фонема |ті| в начале слов не употребляется.

Фонетические ограничения определяют акустические и ар­тикуляционные детали конкретных фонем в конкретной фонети­ческой среде, в результате чего данная фонема не является акустически инвариантной, несмотря на наше инвариантное осознанное ее восприятие. Например, фонема |к| по-разному реализуется в каждом из следующих слов: keep, kill, kelp, cat, cool, coal, call. Тем не менее говорящий по-английски будет утверждать, что все эти слова начинаются со звука "кау". Этим постулируется, что говорящий по-английски человек ис­пользует знание таких «вариационных» правил, которые по­зволяют ему мысленно синтезировать акустически детализиро­ванные представления о возможных словах и затем сопостав­лять их с входными речевыми сигналами. (Более подробное введение в теорию и модели восприятия речи см. в работе [12].)

Поскольку в алгоритмах распознавания речи не использу­ются знания лингвистической структуры в той степени, в какой это делает человек, характеристики алгоритмов распознавания, свойственных людям, качественно и количественно отличаются от характеристик алгоритмов генерации искусственной речи, воспринимаемой слушателем-человеком. В оставшейся части этой главы будут рассмотрены отдельные исследования по рас­познаванию речи, генерации речи и интеграции систем распоз­навания и генерации речи в интерактивные речевые системы.

ЧЕЛОВЕЧЕСКИЙ ФАКТОР

Этапы проектирования программного обеспечения интерфейса человек — ЭВМ

Проектирование качественного программного обеспечения ин­терфейса человек —ЭВМ не является жестким, статическим процессом. Характер и содержание каждого интерфейса варьи­руются в соответствии с конкретной областью его использова­ния, и в группах разработчиков часто …

Оценка эффективности человеко-машинных систем

Существует целый ряд общих методов оценки эффективности для различных уровней характеристик человеко-машинных сис­тем, однако оценка эффективности распознавания речи в слож­ней задаче управления, связанной с отображением информации, представляется задачей более трудной …

Потребность в документации

Соответствующая документация необходима для обеспечения эффективных и экономичных процедур разработки, использо­вания и сопровождения программных систем в целях организа­ции систематического обмена информацией между управленчес­ким персоналом, разработчиками системы и пользователями на всех …

Как с нами связаться:

Украина:
г.Александрия
тел./факс +38 05235  77193 Бухгалтерия
+38 050 512 11 94 — гл. инженер-менеджер (продажи всего оборудования)

+38 050 457 13 30 — Рашид - продажи новинок
e-mail: msd@msd.com.ua
Схема проезда к производственному офису:
Схема проезда к МСД

Оперативная связь

Укажите свой телефон или адрес эл. почты — наш менеджер перезвонит Вам в удобное для Вас время.