ИНФОРМАЦИОННЫЕ СИСТЕМЫ И ТЕХНОЛОГИИ В СТРОИТЕЛЬСТВЕ

OLAP — ИНСТРУМЕНТ АНАЛИЗА ДАННЫХ

 

Централизация и удобное структурирование — это далеко не все, что нужно аналитику. Ему требуется инструмент для просмотра, визуализации информа­ции. Традиционные отчеты, даже построенные на основе единого хранилища, лишены одного — гибкости. Их нельзя «покрутить», «развернуть» или «свер­нуть», чтобы получить желаемое представление данных. Аналитик может про­верить за день не более двух-трех идей. А ему может потребоваться проверять по нескольку идей в час. И чем больше «срезов» и «разрезов» данных аналитик видит, тем больше у него идей, которые, в свою очередь, для проверки требуют все новых и новых «срезов». Ему нужен такой инструмент, который позволил бы разворачивать и сворачивать данные просто и удобно. В качестве такого инструмента и выступает OLAP.

OLAP не представляет собой необходимый атрибут хранилища данных, но он все чаще применяется для анализа накопленных в хранилище сведений.

Оперативные данные собираются из различных источников, очищаются, интегрируются и складываются в реляционное хранилище. При этом они уже доступны для анализа при помощи различных средств построения отчетов. За­тем данные подготавливаются для OLAP-анализа. Они могут быть загружены в специальную БД OLAP или оставлены в реляционном хранилище. Важней­шим его элементом являются метаданные, т.е. информация о структуре, раз­мещении и трансформации данных. Благодаря им обеспечивается эффективное взаимодействие различных компонентов хранилища. То есть можно определить OLAP как совокупность средств многомерного анализа данных, накопленных в хранилище.

OLAP предоставляет удобные быстродействующие средства доступа, про­смотра и анализа деловой информации. Пользователь получает естественную, интуитивно понятную модель данных, организуя их в виде многомерных кубов (Cubes). Осями многомерной системы координат служат основные атрибуты анализируемого бизнес-процесса. Например, для продаж это могут быть товар, регион, тип покупателя. В качестве одного из измерений используется время. На пересечениях осей — измерений (Dimensions) — находятся данные, коли­чественно характеризующие процесс — меры (Measures). Это могут быть объ­емы продаж в штуках или в денежном выражении, остатки на складе, издерж­ки и т.п. Пользователь, анализирующий информацию, может «разрезать» куб по разным направлениям, получать сводные (например по годам) или, наобо­рот, детальные (по неделям) сведения и осуществлять прочие манипуляции, которые ему придут в голову в процессе анализа.

Многомерность в OLAP-приложениях может быть разделена на три уровня:

  • Многомерное представление данных — средства конечного пользователя, обеспечивающие многомерную визуализацию и манипулирование данными; слой многомерного представления абстрагирован от физической структуры данных и воспринимает данные как многомерные.
  • Многомерная обработка—средство (язык) формулирования многомерных запросов (традиционный реляционный язык SQL здесь оказывается непри­годным) и процессор, умеющий обработать и выполнить такой запрос.
  • Многомерное хранение — средства физической организации данных, обе­спечивающие эффективное выполнение многомерных запросов.

Первые два уровня в обязательном порядке присутствуют во всех OLAP- средствах. Третий уровень не обязателен, так как данные для многомерного представления могут извлекаться и из обычных реляционных структур; про­цессор многомерных запросов в этом случае транслирует многомерные запро­сы в SQL-запросы, которые выполняются реляционной СУБД.

Конкретные OLAP-продукты, как правило, представляют собой либо сред­ство многомерного представления данных — OLAP-клиент, либо многомерную серверную СУБД — OLAP-сервер.

Слой многомерной обработки обычно бывает встроен в OLAP-клиент и/ или в OLAP-сервер, но может быть выделен в чистом виде, как, например, компонент Pivot Table Service фирмы Microsoft.

Средства OLAP-анализа могут извлекать данные и непосредственно из ре­ляционных систем. Сегодня и Oracle, и Informix, и Microsoft предлагают полно­ценные OLAP-серверы.

OLAP-серверы, или серверы многомерных БД, могут хранить свои много­мерные данные по-разному. В любом хранилище данных (и в обычном, и в многомерном) наряду с детальными данными, извлекаемыми из оперативных систем, хранятся и суммарные показатели (агрегированные показатели, агре­гаты), такие, как суммы объемов продаж по месяцам, по категориям товаров и т.п. Агрегаты хранятся в явном виде с единственной целью — ускорить выпол­нение запросов. Так как с одной стороны, в хранилище накапливается, как правило, очень большой объем данных, ас другой, — аналитиков в большинстве случаев интересуют не детальные, а обобщенные показатели. И если каждый раз для вычисления суммы продаж за год пришлось бы суммировать миллионы индивидуальных продаж, скорость, скорее всего, была бы неприемлемой. По­этому при загрузке данных в многомерную БД вычисляются и сохраняются все суммарные показатели или их часть.

В связи с этим, за скорость обработки запросов к суммарным данным при­ходится платить увеличением объемов данных и времени на их загрузку. При­чем увеличение объема может стать гигантским. Степень увеличения данных при вычислении агрегатов зависит от количества измерений куба и структуры этих измерений. Для решения проблемы хранения агрегатов применяются слож­ные схемы, позволяющие при вычислении далеко не всех возможных агрегатов достигать значительного повышения производительности выполнения запросов.

Как детальные данные, так и агрегаты могут храниться либо в реляционных, либо в многомерных структурах. Многомерное хранение позволяет обращать­ся с данными как с многомерным массивом, благодаря чему обеспечиваются одинаково быстрые вычисления суммарных показателей и различные много­мерные преобразования по любому из измерений. Некоторое время назад OIAP-продукты поддерживали либо реляционное, либо многомерное хранение. Сегодня, как правило, один и тот же продукт обеспечивает оба этих вида хра­нения, а также третий вид — смешанный.

Добавить комментарий

ИНФОРМАЦИОННЫЕ СИСТЕМЫ И ТЕХНОЛОГИИ В СТРОИТЕЛЬСТВЕ

Какие новые информационные технологии появятся в будущем?

В будущем ожидается появление новых инновационных информационных технологий, которые позволят улучшить качество жизни людей. Одним из таких прогрессивных направлений является интеллектуальная автоматизация, которая позволит автоматизировать процессы в бизнесе или домашнем …

Синергетическое моделирование сложных систем

  Основная идея системного анализа сложных систем состоит в применении общих принципов декомпозиции системы на отдельные элементы и установ­лении связей между ними, в определении цели исследования и этапов для до­стижения …

Морфологическое описание и моделирование сложных систем

Системы управления строительством относятся к сложным или большим, или системам со сложной структурой. Сложные системы состоят из большого числа взаимосвязанных подсистем, в связи с чем для их описания требуется большой …

Как с нами связаться:

Украина:
г.Александрия
тел./факс +38 05235  77193 Бухгалтерия

+38 050 457 13 30 — Рашид - продажи новинок
e-mail: msd@msd.com.ua
Схема проезда к производственному офису:
Схема проезда к МСД

Партнеры МСД

Контакты для заказов оборудования:

Внимание! На этом сайте большинство материалов - техническая литература в помощь предпринимателю. Так же большинство производственного оборудования сегодня не актуально. Уточнить можно по почте: Эл. почта: msd@msd.com.ua

+38 050 512 1194 Александр
- телефон для консультаций и заказов спец.оборудования, дробилок, уловителей, дражираторов, гереторных насосов и инженерных решений.