РАСШИРЕНИЕ АНАЛИТИЧЕСКИХ ВОЗМОЖНОСТЕЙ ЧЕЛОВЕКА
Программное обеспечение электронного анализа, избавляющее людей от рутинной работы и позволяющее им сконцентрироваться лишь на исключительных ситуациях (наподобие того, что применяет компания Marks & Spenser), меняет саму природу их деятельности. Это настолько мощный инструментарий, что некоторые Из сотрудников Marks & Spenser поначалу даже опасались, не вытеснит ли компьютер их совсем. В них говорило естественное нежелание человека отказываться от какой-либо доли участия в принятии решений и тем более передавать эту функцию машине. Однако когда массив данных достигает определенных размеров и уровня сложности, выполнение начального поиска и сортировки компьютером оказывается гораздо эффективнее. Люди просто не способны замечать закономерности в больших объемах данных. А объемы эти - не только в базах данных, но и в файловых системах, в системах передачи сообщений и на веб-сайтах - растут сегодня экспоненциально. Единственная возможность реализовать их потенциал в полной мере - это использовать для выделения полезной информации компьютерные средства.
Применение программных алгоритмов для поиска полезных закономерностей в больших объемах данных называется Интеллектуальным анализом данных. Первым серьезным шагом в этом направлении стало создание систем оперативной аналитической обработки (OLAP), которые существенно повышают эффективность обслуживания многих видов запросов. Благодаря им данные, собиравшиеся ранее только в целях бухгалтерского и финансового учета, стало возможным использовать в моделировании, прогнозировании и принятии решений. Для удовлетворения этих новых потребностей компании начали создавать корпоративные Хранилища данных. Подмножество такого хранилища, отражающее какой-либо один аспект функционирования предприятия или охватывающее деятельность одного из его подразделений, часто называют Киоском данных.
Издательская компания HarperCollins использует OLAP-систему на базе ПК для контроля за ходом книжной торговли в реальном масштабе времени. Это позволяет ей печатать ровно столько экземпляров, сколько требуется дистрибьюторам. Таким образом удается избежать образования в канале сбыта больших товарных остатков, которые пришлось бы потом принимать обратно. После всего лишь года эксплуатации новой системы возврат непроданных экземпляров наиболее популярных изданий HarperCollins сократился с более чем 30% приблизительно до 10%, а за каждым из этих процентов стоят миллионы долларов экономии.
Кроме того, OLAP-система HarperCollins позволяет специалистам компании получать ответы на вопросы типа: какова была прибыльность сбыта такого-то издания за такую-то неделю через такого-то дистрибьютора? Обратите внимание, что даже в этом случае невозможно обойтись без человека, который бы задавал вопросы; а кроме того, ни традиционная база данных, ни OLAP-система не способны находить ответы на такие более расплывчатые, но от этого не менее важные для бизнеса вопросы, как: "Какой из клиентов, вероятно, предпочтет продукт А продукту Б? Что отличает клиентов, которых наши продукты и услуги удовлетворяют, от клиентов, которых они не удовлетворяют? Какие из клиентов в моей базе данных "сходны" друг с другом?" При попытке обработать подобный неконкретный запрос на пользователя OLAP-системы обрушилась бы лавина данных, которые ему бы вряд ли для чего-нибудь пригодились. Для сложных видов интеллектуального анализа данных требуется особое ПО, предназначенное для ориентирования в богатых информацией средах. И оно должно быть способно помочь своим пользователям в поиске ответов на вопросы, не требуя от них глубоких познаний в таких специальных областях, как статистика, анализ или работа с базами данных.
В числе сложных задач, справляться с которыми помогает интеллектуальный анализ данных, - прогнозирование вероятности покупки клиентом определенного товара на основании его возраста, пола, демографических характеристик и других признаков; выделение групп клиентов, характеризующихся сходным поведением при просмотре информации в сети; выявление предпочтений конкретного клиента с целью предоставления ему индивидуализированного обслуживания; определение времени суток и дней недели, когда наиболее часто посещаются те или иные страницы или наиболее часто поступают обращения по телефону; идентификация товаров, которые часто приобретаются вместе. Последнее очень ценно для выявления закономерностей покупательского поведения, однако известен случай, когда найденная корреляция между двумя кодами счетов за одну и ту же лечебную процедуру позволила австралийской компании, специализирующейся на медицинских услугах, вскрыть мошенничество с двойным выставлением счетов на общую сумму более 10 млн долларов.
Средства интеллектуального анализа данных могут также быть очень полезны в плане прогнозирования сбыта и ознакомления партнеров и клиентов с полученными результатами. Эта технология применяется в производственных отраслях, в банковском деле, телекоммуникациях, планетарной геологии (для обработки данных дистанционного зондирования поверхности планет) и для управления интерактивными электронными магазинами. Например, ПО Microsoft Site Server Commerce 3.0 способно распознавать закономерности в покупательском поведении посетителей веб-сайта, прогнозировать их интерес к различным продуктам и услугам и индивидуализировать общение с ними. В частности, электронный магазин может предлагать каждому конкретному покупателю рассчитанные именно на него рекламные объявления, специальные предложения.