Управление эффективностью бизнеса
Разновидности многомерного хранения данных
Обсуждая тему OLAP, следует упомянуть и о разновидностях многомерного хранения данных. Дело в том, что информационные массивы, логически упорядоченные по аналитическим направлениям и, таким образом, являющиеся многомерными с точки зрения конечных пользователей, вовсе не обязательно являются многомерными с точки зрения технологической реализации. Как правило, выделяют три разновидности хранения данных:
— многомерный OLAP {multidimensional OLAP, MOLAP) представляет собой «OLAP в чистом виде», то есть технологию, основанную на хранении данных под управлением специализированных многомерных СУБД;
— реляционный OLAP (relational OLAP, ROLAP) — технология, основанная на хранении многомерной информации в реляционных базах данных, на основе одной или нескольких схем типа «звезда» или «снежинка»;
— гибридный OLAP (hybrid OLAP, HO LAP) — технология, при которой одна часть данных хранится в многомерной базе, а другая часть — в реляционной. При этом инструментальные средства, поддерживающие эту технологию, обеспечивают прозрачность данных для пользователя, который на логическом уровне всегда работает с многомерными данными.
Одной из причин, которые объясняют необходимость различных подходов к хранению данных, является то, что в многомерных структурах хранятся довольно большие объемы агрегированных данных (например, данные продаж могут агрегироваться по временным интервалам, категориям товаров или регионам продаж). Эти данные очень важны, поскольку в большинстве случаев аналитика интересуют именно агрегированные, а не детальные цифры. Любые данные (как исходные, так и агрегированные) могут храниться либо в реляционных, либо в многомерных структурах, в зависимости от применяемой технологии. Например, MOLAP подразумевает хранение всей информации в многомерной базе данных. Это позволяет манипулировать данными как многомерным массивом, но в этом случае многомерная база данных оказывается избыточной, поскольку и агрегированные показатели, и лежащие в их основе исходные данные хранятся вместе. При технологии ROLAP исходные данные остаются в той же реляционной базе, где они изначально и находились, а агрегированные данные помещаются в специальные служебные таблицы в той же базе данных. Наконец, при гибридной технологии (HOLAP) исходные данные остаются в реляционной базе данных, а агрегированные показатели хранятся в многомерной базе данных.
Выбор способа хранения зависит от нескольких факторов, таких как объем и структура данных, скорость выполнения запросов, частота обновления OLAP-кубов.