Моделирование систем распознавания речи
При моделировании устройств распознавания речи различные уровни функциональных возможностей распознавания речи могут анализироваться и оцениваться экспериментально. Первые исследования, основанные на моделировании речевого управления и отображения, начались с изучения того, как взаимодействуют люди при решении возникающих проблем [10]. Наиболее быстро проблемы решались тогда, когда люди использовали речевое общение. Другие возможные способы общения людей — это телеграфная связь и обычное письмо. Поскольку рассматриваемое исследование не предполагало ограничения речевого канала общения определенным размером словаря, заданной синтаксической структурой или допустимым темпом речи, соответствие его результатов современным возможностям автоматического распознавания речи нельзя считать полным; однако эти результаты иллюстрируют всю мощь речевого канала взаимодействия при решении проблем, подчеркивают важность дальнейшего развития технологии автоматического распознавания речи и показывают, что моделирование процессов распознавания речи — это ценная методология исследований в данной области.
После проведения первых исследований было сделано несколько попыток изучения характеристик системы и возможностей ее применения в случаях, когда на речевой канал налагаются различные ограничения с целью моделирования процесса использования устройств распознавания речи. Была смоделирована пишущая машинка с речевым вводом, где речь ограничивалась либо размером словаря, либо требованием речевых пауз [26]. К числу недостатков метода моделирования следует отнести большое время реакции, невозможность имитации ошибок типа неправильного распознавания и неверного отбрасывания, а также неестественное требование раздельного произнесения слов, когда по слогам произносятся новые слова, отсутствующие в словаре. Тем не менее работы по моделированию способствуют развитию средств имитации процессов распознавания речи в целях изучения роли субъективных факторов.
В работе [58] показаны трудности реализации успешного моделирования процессов распознавания речи и сделана попытка оценить реакцию пользователя на различные уровни точности распознавания. Поскольку в этом эксперименте субъекты читали слова в заданном порядке, было трудно управлять соответствующей обратной связью, когда человек неправильно Произносил слово или создавал заметный шум. Кроме того, хотя испытуемые не имели реальной задачи для выполнения, часто им не удавалось прочитать предоставленную с помощью обратной связи визуальную информацию и они не знали об ошибках. В результате все достигнутые путем моделирования уровни точности распознавания речи были признаны ими приемлемыми; вероятно, это указывает на то, что концепция речевого ввода получила одобрение. Решение указанных здесь и других проблем в будущих разработках в области моделирования представляется довольно сложным, и здесь вряд ли удастся избежать серьезных трудностей.
Совсем недавно [99] был продемонстрирован еще один способ моделирования, который вполне удовлетворил испытуемых. Он дает обнадеживающие результаты применительно к ограничениям, накладываемым на синтаксическую структуру и размер словаря пользователей, когда те имеют дело с распознающей системой. Субъекты, «разговаривающие» с ЭВМ, не были лимитированы употреблением строго определенного синтаксиса или словаря. Однако смоделированная экспериментатором машина «отвечала», используя ограниченные словарь и синтаксис. Субъекты подражали машине и постепенно в ходе эксперимента усвоили ее словарь и синтаксис.