Способы представления знаний
Для качественного проектирования адаптивных интерфейсов и применения методов эффективной организации диалога, рассмотренных в предыдущем разделе, требуются способы точного представления всей имеющейся информации о пользователях, решаемых ими задачах и вычислительных системах. Не-
Таблица 2.6. Способы представления информации для адаптивных интерфейсов человек — ЭВМ
Представление информации по типу модели «классная доска» [45] Разработка систем логического вывода, основанных иа продукционных правилах [24, 87, 130]
Использование семантических сетей [62] •Составление сценариев [31, 125] Планирование действий [32, 152] Дифференциальные способы представления [19] Проведение дискримннантного анализа [115] Построение функциональных разрезов [41, 42, 56, 84]
Обходимость этого еще более возрастает, когда речь идет о проектировании систем для опытных пользователей, так как последние должны быть обеспечены удобным информационным интерфейсом. Решение данной задачи в настоящее время значительно упрощено благодаря наличию множества различных способов представления знаний, многие из которых уже реализованы в конкретных системах. В табл. 2.6 приводится неполный перечень способов представления информации, которые наилучшим образом подходят для построения адаптивных диалогов, обучающих систем и автоматизированных консультативных систем. За основу этих моделей, как правило, принимаются образцы, разработанные для решения проблем искусственного интеллекта [9], а также системы, используемые в различных технических дисциплинах [120]. (Более подробное описание методов построения систем искусственного интеллекта изложено в гл. 2 тома 3.)
Подмножество методов, представленных в табл. 2.6, объединяют некоторые общие черты. Анализируя способы представления информации, можно выделить пять направлений, по которым определяются модели для адаптивных интерфейсов. Все они условно отображены в табл. 2.7 как множество, состоящее из пяти пар методик. Такой способ их представления рассматривается соответственно с их фактическими моделями, указанными в табл. 2.6, и коммуникационными методами адаптивных систем, перечисленными в табл. 2.5. Авторы надеются, что представленный на рассмотрение читателя анализ ряда основных положений, связанных с данной проблемой, позволит проектировщику лучше реализовать системный подход к выбору способа представления информации.
Символические и количественные модели представления информации
Прежде всего необходимо отметить, что в некоторых случаях бывает практически невозможно отличить символическую мо-
Таблица 2.7. Пространство моделей способов представления информации
Символические модели Функциональные разрезы «Профессиональные» модели Статические модели Одноуровневые модели
Количественные модели Когнитивные модели «Непрофессиональные» модели Динамические модели Многоаспектные модели
Дель от количественной. Очевидно, что любая количественная модель одновременно является и символической. Поэтому проведем следующее разграничение этих понятий: будем считать модель количественной, если она основана главным образом на числовых данных (например, частотах, статистическом материале и разного рода математических построениях). В противоположность этому термин «символическая модель» будем употреблять по отношению к системам, обрабатывающим информацию, представленную символами более высокого порядка (например, текстовыми, пространственными и речевыми конструкциями). Если пользоваться этими определениями, то можно считать, что символические модели в табл. 2.6 представлены системами логического вывода, основанными на продукционных правилах, семантическими сетями, сценариями и планами, а количественные — дискриминантным анализом и обработкой протоколов выполнения. Что же касается моделей типа «классной доски» и дифференциальных моделей представления информации, то они могут быть как символическими, так и количественными или же совмещать в себе свойства обоих классов.
В качестве примера, позволяющего наглядно представить себе проведенное выше разграничение двух типов моделей, рассмотрим символическую модель семантических сетей [62]. Данная модель создавалась с целью оснащения системы текстового редактирования NLS-SCHOLAR программами предоставления пользователям консультативной помощи и демонстрации конкретных примеров. Используемая системой информация включает в себя определения понятий, описания команд и указания относительно последовательности их выполнения. В отличие от семантических сетей информационная система на основе модели «функционального разреза» [41, 42] содержит только данные о частоте употребления команд, что позволяет выдавать пользователю советы по выбору оптимального способа поиска. Очевидно, что каждая из двух предложенных моделей имеет как сильные, так и слабые стороны. Результаты работы с системами NLS-SCHOLAR и CADHELP [31] показывают, что преимуществом символических моделей является возможность предоставления с их помощью разного рода пояснений. В то же время сила количественных моделей состоит в их предсказательной способности. Например, проектирование диалога с неявной формой взаимодействия [115] основывалось на предсказаниях машиной действий оператора при решении контрольной задачи.
Таким образом, выбор между символическими и количественными моделями определяется «степенью профессионализма» модели. В экспертных системах, реализующих достаточно понятный принцип «прозрачного ящика», часто используются символические модели; наоборот, экспертная система, с менее явным алгоритмом типа «черного ящика», часто работает с количественными моделями. Системы первого типа в основном базируются на методике решения задач, сходной с применяемой человеком, а в системах с более эффективным методом «черного ящика» этого ограничения нет [19]. Таким образом, при использовании количественной модели типа «черного ящика» может потребоваться тщательная разработка специальных стратегий ведения диалога, подобных графическим методикам, используемым в системе STEAMER [71], для разъяснения представляемой информации неопытным пользователям. Короче говоря, для построения высококачественных адаптивных интерфейсов необходимо взвешивать преимущества как символических, так и количественных моделей, заключающиеся для первых в возможности предоставления с их помощью разного рода пояснений, а для вторых — наделения системы предсказательной способностью.
Модели функционального разреза и когнитивные модели
Вторая сторона моделирования систем представления информации, отмеченная в табл. 2.7, свидетельствует о большом значении, которое при проектировании адаптивных интерфейсов придается выбору источников знаний. Для целей проектирования возможно использование двух таких источников: во-первых, разного рода протоколов фактического выполнения пользователями заданий и, во-вторых, результатов подробных опросов - и анкетирования пользователей.
Метод анализа выполняемых операций был использован авторами работ [84, 40—42] совместно с разработанной ими же моделью типа функционального разреза. Результаты исследования показывают, что применения этой модели более чем достаточно для представления информации неопытному пользователю. Более того, конструируются такие модели достаточно быстро и эффективно, и для построения требуются лишь данные, получаемые путем регистрации действий пользователя и их статистической обработки. Поэтому разработка моделей подобной стратегии представления информации может проводиться во время сеансов работы пользователя с ЭВМ; при этом не требуется обязательное участие высококвалифицированных специалистов по системам.
Тем не менее модели, основанные на анализе выполняемых операций, не всегда в состоянии достаточно полно представить и описать все разнообразие сложных задач и многочисленных аспектов поведения человека. Так, в работах [56, 41] отмечено, что неопытные пользователи, как правило, испытывают затруднения, применяя рекомендации, полученные от систем, в основе которых лежит подобная модель представления, и вероятная причина тому — количественный характер получаемой пользователем информации. Поэтому при разработке адаптивных интерфейсов, ориентированных, на неопытных пользователей, в некоторых случаях может оказаться необходимым предоставление пользователю подробных пояснений относительно полученной логическим путем новой информации, поскольку такие объяснения не могут быть выявлены в рамках модели типа функционального разреза. В подобных ситуациях часто целесообразно привлекать к разработке адаптивных систем высококвалифицированных специалистов в той области знаний, для которой предназначается система. Этим обеспечиваются более глубокое понимание разработчиками когнитивных процессов, сопровождающих решение задач, и требуемая детализация соответствующих процедур.
Рассмотрение нескольких вариантов моделей представления информации, указанных в табл. 2.6, позволяет лучше понять когнитивный подход к моделированию. При создании системы автоматического проектирования, описанной Каллингфордом и др. [31], был использован метод сценариев (описания действий пользователя) с несколькими уровнями наглядного объяснения. Полученные результаты позволяют продемонстрировать, насколько детально должна быть представлена информация, предназначенная для использования в адаптивных интерфейсах. Составление сценариев можно даже назвать идеальным способом представления информации, так как они дают наиболее полное описание последовательности процедур, выполнение которых необходимо для решения поставленных задач [125]. Другими примерами использования когнитивного подхода являются экспертная система MYCIN, основанная на продукционных правилах [130], и интеллектуальные интерфейсы обучающих систем [24]. Экспертные системы позволяют имитировать процессы и процедуры логического вывода на определенном уровне абстрагирования, что облегчает работу с системой мало знакомых с вычислительной техникой специалистов. Подобным образом и разработка интеллектуальных автоматизированных обучающих систем должна обеспечивать полное понимание пользователем используемых экспертных процедур, что является обязательным условием эффективности обучения.
Однако при создании когнитивных моделей разработчики сталкиваются с определенными проблемами. Во-первых, построение таких моделей, как правило, основывается на анализе протоколов устных опросов пользователей [44]. Проведение анализа таких данных представляет собой достаточно сложную и емкую по времени операцию; кроме того, может оказаться, что его результаты непригодны к использованию. Во-вторых, адаптивные интерфейсы на основе когнитивных моделей представления информации не могут рассматриваться как достаточно надежные, так как не могут работать лучше, чем участвовавшие в их создании эксперты.
«гПрофессиональные» и «непрофессиональные» модели
При разработке адаптивных интерфейсов часто используются протоколы выполнения и решения различных задач квалифицированными пользователями. Исследования Клэнси [24] по автоматизированному обучению с применением систем продукционных правил, работы Дарлингтона и др. [32], связанные с моделями планирования активной помощи пользователю, и даже принцип функционального разреза (84, 41, 42] основаны на предположении, что поведение неопытных пользователей может быть спрогнозировано с помощью моделей, в основе которых лежат механизмы поведения высококвалифицированных пользователей. По существу это дифференциальные модели [19], в которых возможности неопытных пользователей оцениваются в сравнении с результатами моделирования поведения квалифицированных пользователей.
Между тем дифференциальные модели, позволяя без особого труда описывать наличие или отсутствие требуемой квалификации, могут не принимать во внимание ошибочные или некорректные действия пользователя-новичка, являющиеся следствием недостаточного знакомства с системой, что весьма характерно для человеко-машинных систем. Модели неквалифицированных действий пользователей присутствуют в системе CADHELP [31] для объяснения допускаемых ошибок; эти модели предложены как расширение планирующих моделей представления информации в системе UNIX Consultant [152].
Принцип использования «непрофессиональных» моделей может быть полезным при разработке адаптивных интерфейсов, ориентированных на неопытных пользователей, так как позволяют быстро и конкретно выявлять трудности, возникающие при работе с интерфейсом, а не объяснять их просто отсутствием должной квалификации. С применением этих методов может быть создан, например, каталог альтернативных или «неквалифицированных» способов ведения диалога. Если машина обнаружит, что пользователь выбрал «неквалифицированный» путь решения проблемы, то по такому каталогу она сможет отыскать избранный человеком метод, проанализировать его и затем при необходимости прервать работу пользователя для выдачи ему инструкции или справочной информации. Однако представление всего перечня альтернативных или «неквалифицированных» приемов ведения диалога обычно является сложной и трудоемкой операцией, занимающей много времени.
Статические и динамические модели
Большинство моделей, представленных в табл. 2.6, являются статическими. Модели, основанные на продукционных правилах, семантические сети, сценарии, дифференциальные модели и модели типа функционального разреза в основном представляют информацию о поведении человека в статической форме. Интересно, что способность интерфейса, основанного на статических представлениях, подстраиваться к пользователю может быть достигнута только при наличии большой и всеобъемлющей базы знаний. Отсюда следует, что экспертные системы [130] можно считать адаптивными, так как они обеспечивают пользователю при его работе с интерфейсом доступ к большим объемам информации. И вообще во многих диалоговых системах средством обеспечения их статической настройки может служить имеющийся в них значительный запас информации.
Тем не менее мнение о достаточности статических моделей нельзя считать обоснованным. Разработка динамических моделей для адаптивных интерфейсов вызвана желанием избавиться от присущих статическим системам ограничений и позволит учесть тот факт, что само поведение пользователя при работе на ЭВМ изменяется по мере освоения им системы. Вполне очевидно, что в разных методах обучения могут браться за основу как количественные, так и символические модели представления информации. Для построения динамических моделей рекомендуется [41, 42] использование методов, основанных на анализе функционального разреза, а также предлагается [32] применение разного рода механизмов планирования. К сожалению, разработка обучающих программ сталкивается со значительными трудностями и требует широких исследований. В частности, для проектирования программ динамической настройки интерфейса на пользователя необходимы соответствующие модели представления информации, способные к быстрой подстройке к каждому конкретному человеку. В то же время медленно реагирующие на происходящие изменения или, наоборот, неустойчивые динамические модели мало пригодны для применения.
Одноуровневые и многоаспектные модели
Все модели, представленные в табл. 2.6, позволяют рассматривать имеющуюся информацию о пользователе, решаемой им задаче и используемой для этого ЭВМ только в каком-либо одном аспекте. Исключение составляет лишь модель, условно называемая «классная доска» [45]. Модели типа «классной доски» прежде не описывались в литературе по проектированию, однако потребность в их разработке появилась в связи с необходимостью оснащения систем с естественноязыковым интерфейсом и автоматическим распознаванием речи большими базами данных, в которых используется многоуровневое представление необходимых знаний (например, на акустическом, фонемном, морфемном, просодическом, синтаксическом, семантическом и прагматическом уровнях).
Представление информации, основанное на принципе классной доски в системе автоматического распознавания речи HEARSAY-II, позволяет обеспечить работу этой системы с несколькими «независимыми» источниками информации. Схематично функционирование HEARSAY-II сводится к следующему: іипотеза о воспринимаемом речевом сигнале заносится в базу данных, представленную в виде «классной доски», на которую записывается поступающая информация. После этого для извлечения дополнительных сведений о сигнале «выписанные на доске» сведения могут обрабатываться другими источниками знаний. А это означает, что информационная структура типа «классной доски» позволяет системе анализировать речевой сигнал одновременно на нескольких уровнях.
При использовании этого метода для систем автоматического распознавания речи разработчикам далеко не всегда удавалось достичь всех поставленных при проектировании целей. Тем не менее такой подход к представлению информации оказывается наиболее подходящим для построения адаптивных интерфейсов человек — ЭВМ, которым требуются самые разнообразные сведения о пользователях. По существу применение этого метода может способствовать автоматическому формированию согласованной структурированной системной модели для пользователя, работающего с адаптивным интерфейсом, т. е. заключение, сделанное на основе некоторого конкретного источника информации, либо подтверждается на материале рассмотрения других ее аспектов, либо соответственно видоизменяется. Требуется продолжать и дальше исследования в области много - аспектного представления информации как для систем автоматического распознавания речи, так и для других адаптивных диалоговых систем.