Язык и метаданные
Даже если структура безупречно отражает то, как пользователи представляют себе тематику вашего сайта, они не смогут ориентироваться в архитектуре, если не будут понимать вашу классификационную номенклатуру - описания, заголовки и прочую терминологию, используемую на сайте. Вот почему необходимо говорить на языке пользователей, причем употреблять его правильно. Средство, используемое для этой цели, называется словарем нормативной лексики.
Словари нормативной лексики помогут вам добиться непротиворечивости в организации контента. Независимо от того, сидят ли люди, ответственные за контент сайта, за соседними рабочими столами или находятся в офисах на разных континентах, словарь нормативной лексики послужит регламентирующим ресурсом, который гарантирует, что все они говорят на языке пользователей.
Более сложным подходом к нормализации лексикона является создание тезауруса. В отличие от простого списка одобренных терминов, тезаурус документирует также и альтернативные термины, имеющие широкое употребление, но не применяемые на сайте. Имея тезаурус, вы можете описать соответствие между одобренными терминами с одной стороны и профессиональным жаргоном, сокращениями, сленговыми терминами и аббревиатурами - с другой. Тезаурус
Может содержать и другие взаимосвязи между терминами, указывая более широкие, узкие или близкие термины. Документирование этих взаимосвязей дает вам полную картину всего спектра понятий, задействованных в контенте сайта, а это, в свою очередь, может подсказать вам новые подходы к построению архитектуры.
Предположим, мы имеем дело со статьей о том, как последняя модель вашего продукта используется в пожарных частях. Метаданные об этой статье могут быть такими:
• Фамилия автора
• Дата размещения статьи
• Тип текста (например, статья или практическое исследование)
• Название продукта
• Тип продукта
• Сфера деятельности клиента (например, пожарная часть)
• Прочая информация (например, муниципальная организация или служба спасения)
Имея эту информацию, мы сможем рассмотреть целый спектр архитектурных подходов, что было бы затруднительно (а то и вовсе невозможно) в противном случае. Короче говоря, чем более подробной информацией о контенте сайта вы располагаете, тем большая гибкость предоставлена вам в плане структурирования этого контента. Если вдруг окажется, что служба спасения является прибыльным сектором рынка, в который могла бы устремиться ваша компания, наличие метаданных позволит вам на основе уже имеющегося контента быстро создать новый раздел сайта для удовлетворения потребностей этих пользователей.
Впрочем, создание технических систем для сбора и отслеживания этих метаданных будет бесполезным, если сами данные слабо согласованы. Вот здесь и приходит на помощь словарь нормативной лексики. Используя строго один термин для каждого самостоятельного понятия в составе контента, вы можете положиться на автоматические инструменты при определении взаимосвязей между элементами контента. Ваш сайт сможет динамически объединять страницы по конкретной теме, и все, что для этого необходимо, - просто быть последовательным в применении терминов в метаданных.
Кроме того, хорошие метаданные могут предоставить пользователю более быстрый и надежный способ поиска информации, чем тот, который обеспечивается элементарным полнотекстовым поиском. Поисковые машины могут быть весьма мощными, но при этом они, вообще говоря, очень и очень глупые: вы даете им строку символов - и они всего лишь ищут в точности такую же строку. Они не понимают ее смысла.
Можно сделать поисковую машину умнее, связав ее с тезаурусом и снабдив контент метаданными. При поиске непринятого на сайте термина она с помощью тезауруса сможет поставить в соответствие этому термину одобренный вариант; затем она проверит метаданные на наличие в них одобренного термина. Вместо сообщения о том, что строка не найдена, пользователь получит релевантные, хорошо сфокусированные результаты и, возможно, рекомендации по потенциально интересным смежным темам.