Управление эффективностью бизнеса
Хранилища данных
Напомним определение Билла Инмона: «хранилища данных — это предметно-ориентированные, интегрированные, стабильные, поддерживающие хронологию наборы данных, организованные для целей поддержки управления, призванные выступать в роли "единого и единственного источника истины", обеспечивающего менеджеров и аналитиков достоверной информацией, необходимой для оперативного анализа и принятия решений».
Данные попадают в хранилище из оперативных (транзакционных) систем, а также из внешних источников. По аналогии с «материальными» хранилищами хранилища данных предусматривают такие операции, как сбор данных («приход материалов на склад»), хранение данных («складской запас»), перемещение в витрины данных («отгрузка товаров в розничную сеть»).
С экономической точки зрения хранилище данных приносит долгосрочный эффект тогда, когда оно становится надежным механизмом доставки данных, существенных для анализа и принятия решений. При этом не следует забывать и о затратной части, ведь информация может считаться действительно полезной лишь тогда, когда экономические выгоды от ее использования превышают затраты, связанные с ее приобретением. Построение хранилища данных — достаточно сложный проект, и обеспечить его окупаемость в краткосрочной перспективе бывает непросто.
Высокая стоимость проектов по хранению данных объясняется прежде всего необходимостью сбора, преобразования и обобщения данных из различных источников. Эта работа необходима, но в то же время трудоемка и отнимает много времени. Подсчитано, что стоимость извлечения, преобразования и обобщения данных составляет от 60% до 80% от общей стоимости обычного проекта по созданию хранилища данных. Неоправданных затрат можно избежать на этапе проектирования хранилища — за счет определения состава и структуры загружаемых в хранилище данных. Следует помнить, что предназначение хранилища вовсе не заключается в функциях гигантского электронного архива, хранящего все, что только можно. К сожалению, распространенной ошибкой является недостаточное внимание, уделяемое качеству данных, а также превалирование технологических соображений над экономическими.
Но добиться сбалансированной структуры хранилища не так просто. Самое сложное — определить, какие данные полезны для аналитика и менеджера, а какие нет. Также важен способ размещения данных в хранилище и процессы идентификации, анализа и преобразования данных перед их загрузкой в хранилище.
В качестве основы хранилища данных рекомендуется использование реляционной, нормализованной модели, что существенно облегчит дальнейшее развитие такого хранилища. Впрочем, имеет место и другой путь — применение оптимизированных структур, например многомерных (по этому пути пошли разработчики компании SAP в своем продукте SAP BW). Однако, по мнению ряда исследователей (например, Билла Инмона[24]), такой
Подход имеет целый ряд недостатков, не являясь достаточно гибким и универсальным. И действительно, если данные из хранилища поступают лишь в ограниченное количество витрин данных и аналитических приложений, то от хранилища вовсе не требуется возможность поддержания специализированных запросов. В этом отношении использование реляционных баз данных экономичнее (без потери функциональности), а следовательно, предпочтительнее.
После того как хранилище построено, встает вопрос об использовании данных конечными пользователями. При этом могут применяться различные средства (от специализированных средств создания пользовательских запросов и отчетов до привычных электронных таблиц), в зависимости от решаемых задач, предпочтений и опыта пользователей. И все же существует целый спектр задач, которые предъявляют к информационным системам особые требования: это задачи, требующие оперативной (то есть в режиме реального времени) обработки достаточно больших объемов данных в разных аналитических разрезах. Вообще экономический анализ, как правило, бывает многомерным: информация может быть сгруппирована и консолидирована по разным признакам, причем разные группы пользователей информации заинтересованы в разных способах группировки.
Таким образом, превращение разрозненных данных в структурированную информацию, описанную в экономических терминах и позволяющую принимать обоснованные управленческие решения, можно считать одной из самых актуальных задач, стоящих перед компаниями. Причем обработка данных и принятие решений должны быть настолько оперативными, насколько этого требуют интересы бизнеса. Именно для этого предназначены специальные системы аналитической обработки данных в режиме реального времени — О LAP, а примером программного продукта такого класса может служить Hyperion Essbase.