«Хвост», который машет всем остальным
Ситуацию можно рассмотреть и при помощи следующего графика. Когда «хвост» удлиняется, отношение «сигнал-шум» ухудшается. Единственной способ постоянно получать хороший сигнал — увеличение мощности фильтров (рис. 13).
Почему отношение «сигнал-шум» падает при движении по «хвосту»? Там слишком много всего, и то, что вы ищете, теряется среди того, что вам не нужно. В «хвосте» находится подавляющее большинство существующих продуктов в мире.
Живя в культуре, основанной на хитах, мы предполагаем, что хиты занимают большую долю рынка, чем это происходит в действительности. Они — редкое исключение. Нассим Талеб (Nassim Taleb) называет это «проблемой черного лебедя».
Выражение принадлежит Дэвиду Юму, шотландскому философу XVIII века, который привел его в качестве примера трудностей, которые возникают при формулировании общих правил на основе наблюдений. В «задаче индукции Юма» он спрашивает, сколько белых лебедей нужно наблюдать, чтобы сделать вывод, что все лебеди — белые, а черных не существует. Сотни? Тысячи? Неизвестно. («Черный лебедь» — это не просто метафора. До открытия Cygnus atratus в Австралии считалось, что все лебеди — белые.)
Нам сложно рассматривать редкие события в контексте. Среди населения любого региона будет группа чрезвычайно богатых людей. Некоторые из них умны, некоторым повезло. В действительности, мы не можем определить, кто их них кто. В книге «Одураченные случайностью» (Fooled by Randomness) Талеб высмеивает бестселлер «Миллионер по соседству» (Millionaire Next Door) , посвященный описанию инвестиционных стратегий и приемов работы миллионеров, чтобы дать читателю возможность перенять их и самому стать богатым. Талеб отмечает, что случайные факторы с такой же долей вероятности ответственны за миллионы вашего соседа, как и инвестиционные стратегии.
Он определяет «черного лебедя» так:
Случайное событие, удовлетворяющее трем следующим критериям: глубокое влияние, невычислимая вероятность, эффект неожиданности. Во-первых, такое событие оказывает диспропорционально глубокое воздействие. Во-вторых, вероятность такого события мала и невычислима на основе доступной информации до его наступления. В-третьих, коварство «черного лебедя» в эффекте неожиданности: наблюдая, нельзя предположить повышение вероятности его наступления.
Очень похоже на описание хита.
Реальность такова, что подавляющее большинство контента (от музыки до фильмов) — не хиты. Большинство произведений настолько далеки от хитов, насколько возможно, их аудитория исчисляется сотнями, а не миллионами. Иногда это происходит по причине низкого качества. Иногда виноват плохой маркетинг или отсутствие нужных связей. А иногда — причина в некоем случайном событии, которое помешало. Вероятность такого события такая же, что и случайного события, превратившего в блокбастер что-нибудь из самых неубедительных произведений (сразу вспоминается «Who Let the Dogs Out»).
Это естественное следствие экспоненциального распределения, кривой, на которой небольшое число событий происходит с высокой амплитудой (то есть продажи), а большое число — с невысокой амплитудой. Мало продуктов продается хорошо, и много продуктов— плохо. (Кривая имеет форму графика функции f(x)=1/x, что равнозначно x-1.)
Поскольку большинство продуктов продается плохо, то объем доступного материала и, естественно, объем того, чего вы не хотите, растет по мере падения «длинного хвоста». Вот информация по книгам, показывающая количество наименований в каждой из категорий в 2004 году.
Итак, что бы вы ни искали, того, что вам Не нужно , всегда больше, чем дальше вы идете по «хвосту». Именно поэтому отношение «сигнал-шум» падает, несмотря на то, что часто вам с большей долей вероятности (применяя поиск и хорошие фильтры) удается найти искомое в «хвосте». Звучит как парадокс, но не является им: это проблема, которую решают фильтры.