СЛУХ И РЕЧЬ РОБОТОВ
15.1. УСТРОЙСТВА РАСПОЗНАВАНИЯ РЕЧИ [20—22, 24—26, 28—33, 36, 37, 41]
О природе речи известно достаточно много, и, может быть, поэтому считают, что не будет сложно сконструировать устройство для распознавания отдельных слов. В этом направлении велось много работ, и тем не менее успех, по-видимому, столь же неуловим, как и прежде. В то время как оказалось возможным создание устройств, которые могли использоваться человеком для распознавания слов, произносившихся раздельно диктором, было доказано, что построение подобным образом устройства распознавания множества слов независимо от диктора и особенностей его речи является гораздо более сложной задачей.
Попытки разработки устройств распознавания речи широко освещались автором в другой работе [27]. Использовавшиеся методы в основном базировались на известной структуре уха человека и, следовательно, на некоторых типах частотных анализаторов. Однако очевидно, что аппарат частотного анализа сам по себе недостаточен даже для распознавания слов с постоянными временными характеристиками, но с изменяющимся энергосодержанием на различных частотах. Следовательно, этот путь ведет к попытке распознавания частотно-временной структуры — фактически группы информационных элементов Габора [43, 44]. К сожалению, структура частотно-временных элементов речи разных дикторов различается, и возможно, что для учета фильтрующего воздействия центральной нервной системы на информацию от органа слуха потребуются другие подходы и особое значение частотного анализа будет утрачено.
Хотя нам представляется, что до распознавания непрерывной речи еще далеко, некоторый прогресс в этом направлении достигнут. Однако вероятно, что создать устройство для распознавания речи, подобное естественному, не удастся до тех пор, пока не удастся построить машины, которые на основе заложенных в них элементов информации могли бы обучаться связывать речевые образы с другими явлениями. Нет сомнения в том, что, когда такие машины будут изобретены, они помогут нам узнать о лучших способах конструирования устройств, поддающихся обучению распознаванию речи.
Важно отметить, что для человека, слушающего либо речь с незнакомым акцентом, либо незнакомый голос, либо просто находящегося в каких-нибудь новых обстоятельствах, необходимо в течение некоторого времени привыкать к этой речи, к ее звукам, прежде чем станет возможно ее адекватное распознавание.
Сегодняшняя ситуация такова, что в то время как распознавание ограниченного набора речевых образов вполне возможно и демонстрировалось многими, мы все еще ожидаем важного открытия в этой области. По всей вероятности, его может совершить тот, кто, игнорируя необъятные проблемы, очевидные для любого исследователя, потратившего изрядное время на ознакомление с имеющимися трудностями, решит испробовать простейший способ, совершенно не обязательно основанный на общеизвестных знаниях о речи и слухе.
Во всем мире в этом направлении велось много работ, и далее будут описаны некоторые основные исследования, проведенные в Астоне. Главная их цель — разработка методов распознавания речи, которые могли бы использоваться в сочетаний с соответствующими устройствами, подобными машине «Астра», так чго конечной целью является скорее самообучение, чем просто конструирование устройств распознавания.
15.2. ВОКОДЕР С ПАССИВНЫМИ ФИЛЬТРАМИ
Первые исследования в Астонской кибернетической лаборатории по использованию вокодеров для обеспечения ввода речевых сигналов в ассоциативные устройства были проведены А. Макмилланом и JI. Д. J1. Соутером [45].
В ранних работах в качестве избирательных элементов использовались выпускавшиеся промышленностью LC-фильтры. В це-
Принципиальная схема фильтров с выпрямителями
лях ограничения стоимости работ применялись серийные устройства, предназначавшиеся первоначально для фильтрации сигналов в телеграфных системах на речевых частотах.
В идеале полосовые фильтры, применявшиеся в вокодерах в экспериментальных целях, должны были бы иметь прямоугольную полосу пропускания. Однако это требование практически невыполнимо, и характеристика фильтра складывалась из суммы двух более простых характеристик фильтров для каждого диапазона.
Для того чтобы избежать трудностей, связанных с фазированием, сигналы с фильтров перед смешиванием выпрямлялись (рис. 15.1). В данном случае это вполне допустимо, так как единственное требование к выходному сигналу — включать или выключать некоторую схему в зависимости от уровня энергии в соответствующем волновом диапазоне во входном сигнале звуковой частоты.
Фильтрующее устройство подключено к усилителю постоянного тока, который управляет выходным ключом. В некоторых из переключающих устройств использовались тиристоры.
Такие устройства довольно успешно применялись на первом этапе расследований, но их использование выявило необходимость уменьшения конструкции до приемлемых размеров.