Управление эффективностью бизнеса

ETL-системы

Весьма важным представляется вопрос о взаимодействии систем, нахо­дящихся на разных уровнях аналитической пирамиды, и в этой связи нельзя не упомянуть программные продукты еще одного класса — ETL.

Под термином ETL (extraction, transformation, loading — извлечение, преобразование, загрузка) понимают три основных процесса, используе­мых при переносе данных из одной системы в другую. Программные средства этой категории извлекают исходную информацию из опреде­ленного источника, преобразуют ее в формат, поддерживаемый базой данных назначения, а затем загружают в базу назначения уже преобра­зованную информацию.

В части извлечения данных (extraction) ETL-системы могут использо­ваться без необходимости писать код для открытия файлов или чтения записей, хотя и требуют весьма трудоемкой настройки (как показывает практика, настройка ETL может составлять до 80% затрат на создание хранилища данных). Более того, некоторые ETL-системы включают в себя предварительно созданные процедуры извлечения данных из наиболее популярных транзакционных систем (впрочем, функциональность таких стандартных процедур часто оказывается довольно ограниченной).

По завершении извлечения данных требуется их преобразование (trans­formation) — подготовка к размещению в новой базе данных. Есть не­сколько способов преобразования, к которым относятся очистка, агре­гирование, перевод значений и создание полей.

Очистка (cleaning) применяется для того, чтобы отсеять неточные или неоправданно повторяющиеся данные из других систем. При очистке можно проверить корректность диапазонов числовых значений, прием­лемость дат и т. д. Процедуры очистки используются и тогда, когда одно и то же значение представлено в разных формах (например, разные по форме варианты названия компании — «Hyperion», «Hyperion Solutions Corp.», «корпорация Hyperion» — могут быть заменены на какое-то од­но). Очистка также может применяться для согласования атрибутов полей (чтобы они соответствовали единой нормативно-справочной ин­формации).

В процессе агрегирования (aggregation) многочисленные детальные записи заменяются относительно небольшим количеством обобщен­ных записей. В результате удается избежать излишней детализации и представить управленческую информацию в более удобном для анализа виде.

Перевод значений (value translation) — еще одна распространенная про­цедура преобразования, ее необходимость вызвана тем, что во многих системах данные часто хранятся в закодированном виде (например, персональный код сотрудника вместо его фамилии). Перевод значений предусматривает замену закодированных данных на более понятные описания, такие преобразования производятся на основе нормативно - справочной информации.

Создание полей (field derivation) применяется в том случае, если для конечных пользователей создается какая-либо новая информация. На­пример, если в исходной базе данных есть поле цены товара и поле объема продаж, то на их основе можно создать третье поле — выручки от реализации. Современные ETL-системы позволяют программистам использовать для создания новых полей математические операции, статистические функции, возможности работы со строками, арифмети­ческие действия и условную логику.

После того как все процедуры преобразования завершены, данные счи­таются готовыми к размещению в базе данных назначения. Для этого используются процедуры загрузки (loading). Здесь важно определить режим переноса: будет ли он происходить периодически (ежедневно, еженедельно или ежемесячно) или в постоянном (оперативном) режи­ме. Постоянное тиражирование предъявляет значительно более высокие требования к каналам связи, поэтому решение о постоянном режиме зависит от того, насколько пользователям необходима именно оператив­ная (а не периодическая) информация. Большинство современных ETL-систем поддерживают и постоянную, и периодическую загрузки данных. Некоторые продукты также позволяют переносить не все дан­ные, а только те, которые претерпели изменения.

При загрузке применяются разные схемы: при pull-тиражировании при­ложение назначения «вытягивает» данные по мере необходимости, а при push-тиражировании система «проталкивает» преобразованные данные в базу данных назначения. Возможен и смешанный подход, когда данные поступают в промежуточную базу, где преобразовываются, а затем по мере необходимости извлекаются приложением назначения. Впрочем, возникает серьезный вопрос о применимости push-тиражирования на данном этапе развития технологий, поскольку для этого система должна обладать полной информацией о базе данных назначения, а это — боль­шая редкость.

Для организации корректного переноса данных из одной системы в дру­гую важно хорошо представлять процессы ETL, а также структуру ис­точника данных и приложения назначения.

Управление эффективностью бизнеса

Знайомство з ITFin: інтегрована система управління для вашого бізнесу

ІТ-індустрія постійно зростає і розвивається, створюючи виклики для компаній управляти своїми ресурсами та проєктами ефективно. Якщо ви керуєте ІТ-компанією або працюєте в галузі IT-послуг, ви знаєте, наскільки важливо мати систему, …

ИТ аутстаффинг: все, что нужно знать

ИТ аутстаффинг – это популярная практика, при которой компании используют услуги сторонних ИТ специалистов для выполнения задач, связанных с информационными технологиями. Эта услуга может быть очень полезна для компаний, которые …

Енергоефективність — запорука енергонезалежності громад

Енергоефективність - це не просто зменшене споживання енергоресурсів, це досить складна система максимально ефективного використання наявних ресурсів. Це питання стає з кожним роком все актуальнішим, оскільки вартість ресурсів постійно зростає. …

Как с нами связаться:

Украина:
г.Александрия
тел./факс +38 05235  77193 Бухгалтерия

+38 050 457 13 30 — Рашид - продажи новинок
e-mail: msd@msd.com.ua
Схема проезда к производственному офису:
Схема проезда к МСД

Партнеры МСД

Контакты для заказов оборудования:

Внимание! На этом сайте большинство материалов - техническая литература в помощь предпринимателю. Так же большинство производственного оборудования сегодня не актуально. Уточнить можно по почте: Эл. почта: msd@msd.com.ua

+38 050 512 1194 Александр
- телефон для консультаций и заказов спец.оборудования, дробилок, уловителей, дражираторов, гереторных насосов и инженерных решений.