Книга: Хакни рутину. Как алгоритмы помогают справляться с беспорядком, не тупить в супермаркете и жить проще

6 Стань крутым

закрыть рекламу

6

Стань крутым


Фой недавно переехал в Эшленд. Несмотря на ухоженную бородку-эспаньолку и непременный атрибут при выходе в свет – последний номер журнала «New Yorker» (он носит его под мышкой и никогда не читает, но любит небрежно бросить перед собой на столик в кафе или ресторане); несмотря на все это, он остается аутсайдером на новом месте. Его неизменный ответ на любой серьезный вопрос «Милтон бы не пришел в восторг от этого, поверьте мне», очень скоро начинает звучать банально и претенциозно. «Что вы думаете о новой книге Карла Ова Кнаусгарда?» – Милтон бы не пришел в восторг от этого, поверьте мне». «Вам понравился новый сингл Адели, Фой?» – «Милтон бы не пришел в восторг от этого, поверьте мне».

Переживая за свой имидж, Фой стремится стать настоящим знатоком культуры и искусства. Для начала он решил ознакомиться с наиболее известными представителями музыкального мира и купаться в их славе. Но, оказавшись перед огромным выбором дисков в музыкальных магазинах Эшленда, он растерян и не знает, что делать.

ЦЕЛЬ: ИЗУЧИТЬ ПОПУЛЯРНУЮ МУЗЫКУ.[28]

МЕТОД 1: ВЫБРАТЬ ПОПУЛЯРНОГО ИСПОЛНИТЕЛЯ ИЛИ ИСПОЛНИТЕЛЬНИЦУ И ПОЗНАКОМИТЬСЯ С ЕГО ИЛИ ЕЕ ПЕСНЯМИ, ПОТОМ НАЙТИ ЕЩЕ ОДНОГО И ИЗУЧИТЬ ЕГО ТВОРЧЕСТВО И ТАК ДАЛЕЕ.

МЕТОД 2: ПОЙТИ В МУЗЫКАЛЬНЫЙ МАГАЗИН, ВЫБРАТЬ КУЧУ ПЕСЕН И ПРОСЛУШАТЬ ИХ.

Давайте начнем со способов приобретения новых знаний о музыке.

Можно выбрать метод 1, исходя из того, что веб-сайты то и дело подсовывают нам рекомендации, основанные на анализе наших предпочтений. Этот подход известен как анализ связей и гласит: если имеется набор предметов, содержащих что-то общее, будь то песни, фильмы, люди или запчасти для машины, то, анализируя отношения между этими элементами – их связи, мы можем ответить на вопрос «Какой из этих элементов наиболее важен?». Именно в этом мы сейчас заинтересованы больше всего.

Самый простой пример – цитаты. Частое цитирование и большое количество публикаций, упоминающих некую работу, считаются хорошим показателем, подтверждающим ее важность. Этот подход приписывания более высокой значимости участникам, на которых ссылаются другие, помог Google вырваться на передовые позиции. Их результаты на первой странице выглядят для пользователей более значимыми, чем те, что следуют за ними.

Мы изучим два типа связей: степень, с которой вещи связаны друг с другом, и насколько похожи друг на друга эти связанные элементы.

Степень: допустим, у нас есть богатая коллекция, сборник всех песен мира, и мы можем выделить те пары песен, где автор одной повлиял на другого. Мы посмотрим, кто из них творил раньше или обратимся к информации, опубликованной в открытом доступе. Наша схема будет первоначально иметь такой вид:


Если мы сделаем это со всеми песнями, то в конечном итоге у нас получится много кругов и связей или целая сеть. Но в этой сети не хватает важной части, а именно – непрямых ссылок. Если Боб Марли повлиял на Эрика Клэптона, а тот оказал влияние на Пола Маккартни, то резонно предположить, что влияние Боба Марли распространяется также и на Пола Маккартни. Чтобы отследить эти непрямые ссылки, выполним процедуру, известную под названием умножение матриц. Мы размещаем всех исполнителей на квадратной матрице, ставим точку каждый раз, когда артист слева повлиял на артиста в верхней строке и потом поднимаем матрицу каждого по мере роста его влияния, постоянно отслеживая более давний набор ссылок. Когда мы уже не можем идти дальше (это называется достижением транзитивного замыкания матрицы), мы суммируем все данные и получаем что-то похожее на такую схему.


Посчитав количество точек в ряду каждого исполнителя, мы узнаем имена тех, кто сильнее повлиял на других, и сможем выстроить список самых влиятельных артистов и их песен.

Нельзя применить ту же последовательность шагов к деталям машины. Здесь точка может означать техническую зависимость: колесо зависит от оси, а ось – от шасси. Однако метод анализа связей поможет ответить на вопрос типа: «Поступает много жалоб. Мы думаем, что все дело в сложности этой модели. Можете ли вы сделать список наиболее тесно соединенных между собой частей?» Колесо связано с двумя другими частями прямо или опосредованно. Связаны ли они с четырьмя другими узлами, или пятью, или десятью? Большое число связей для певца отражает его значимость. Но для узлов машины много связей – это плохой показатель, так как он может указывать на потенциальную склонность машины к поломкам.

Все вышесказанное может послужить в качестве отправной точки. Переходя из одного жанра в другой, мы движемся от наиболее влиятельного исполнителя ко второму по значимости и так далее. Если на каком-то этапе мы захотим сравнивать песни, то нужно будет изменить подход.

Один из способов определить, какие песни похожи на конкретную мелодию – послушать, что пели до того, как она была написана. Один из способов определить, какие исполнители похожи, скажем, на Боба Марли, – изучить аудиторию: сколько людей, которые слушают Эрика Клэптона, также слушают и Боба Марли? Сколько людей, которые слушают Стиви Уандера, также слушают и Боба Марли? И так далее. Если мы рассмотрим таким образом каждого артиста и ранжируем результаты от большего к меньшему, то у нас появится представление, кто из певцов больше всех похож на Марли. В этом процессе много тонкостей, и его можно усовершенствовать более продвинутыми методами. Например, применяя так называемый коэффициент Жаккара, а не просто считая певцов, мы избежим искажения результатов из-за исполнителей, у которых слишком много поклонников.


Вы видите результат анализа, полученного данным методом, каждый раз, когда ищете что-нибудь в поисковике. То же самое происходит, если вам вешают лапшу на уши в новостях на сайтах социальных сетей, рекомендуют «вещи, которые вы можете захотеть купить» на коммерческом ресурсе, или предлагают общаться «с людьми, которые могут вас заинтересовать» на профессиональном сайте. Газеты тоже занимаются чем-то подобным, составляя статью в стиле, используемом людьми, для которых она предназначена, и затем сравнивая, насколько эта статья похожа на другие. Все сервисы, предоставляющие услуги по просмотру видео, построены на прогнозировании и отборе роликов, которые могут понравиться подписчику, и на контенте, похожем на его любимые ролики. Недавно компания Netflix сообщила в своем блоге, что факторы, принимаемые во внимание при рекомендации фильмов и телешоу, включают в себя не только определенный тип контента (например, «Вы смотрите передачи по научной фантастике, вам может понравиться и другая такая же передача»), но также регион, в котором живет зритель («Вы смотрите кулинарное шоу, но вы находитесь в Индии, так что вам могут понравиться болливудские фильмы»). Подсчитано, что 80 % роликов, просмотренных на сайте Netflix, – это результат рекомендаций пользователям. Как мы видели в главе 4, соединение таких связей с правильным анализом могут породить открытие.[29]


Метод 2 предполагает случайную выборку. В музыкальном магазине вы подходите к коробке и вытаскиваете оттуда сразу несколько дисков. Как и при любой случайной выборке, вы не можете узнать, насколько близки выбранные диски к разделу музыки, который вам нужен. Даже если вы сразу наткнетесь на популярную музыку, вы не сможете это понять. Работая с результатами анализа связей, мы уже не должны полагаться на случайные догадки о том, с чего начать поиск.

Если бы Фою были доступны эти технологические преимущества, мы могли бы представить два метода на примере следующих графиков. Метод 1 требует в худшем случае линейного времени, а на метод 2 уйдет постоянное количество времени. Метод 2 – линейный (в худшем случае), так как Фою придется теоретически прослушать все песни в мире, прежде чем он найдет ту, которая ему нужна. Метод 1 – постоянный, потому что независимо от количества песен в мире Фой начинает свой путь с наиболее популярных произведений.


Чтобы увидеть, насколько универсален прикладной метод решения задачи Фоя, давайте рассмотрим пример из абсолютно другой сферы – политики. Вплоть до XIX века американская политическая система выглядела совершенно иначе. Во время выборов улицы были заполнены мужчинами (женщины не обладали правом голоса до 1920 года), которые проводили демонстрации, выпивали – и голосовали. Но позже голосование стало менее публичным актом, и политикам пришлось самим искать себе избирателей. В 1890 году Уильям Дженнингс Брайан придумал способ, который можно, вероятно, назвать первым примером рассылки, – что-то вроде базы данных своих сторонников. В ХХ веке такие базы распространились повсеместно, а к XXI их уже освоили все партии, поскольку они помогают воздействовать на людей, исходя из их потребительских привычек.

Эта многовековая тенденция доказывает: для политических партий, если они хотят эффективно вербовать избирателей и в конечном счете экономить деньги и время, важно знать, где искать свой электорат. Вместо того чтобы распространять агитацию на всю страну, более эффективно адресовать ее тем людям, которые с большей вероятностью поддержат их программу.

Этот подход применяется в самых разных сферах, где существует проблема охвата аудитории и влияет сегодня практически на всех пользователей популярных веб-сайтов и сервисов.

Что все это значит для Фоя? Повысил ли он свой культурный уровень, к чему так стремится? Мы не знаем этого, так как нашей задачей было помочь ему начать путешествие, а не достичь цели.

Одна из ловушек, подстерегающая того, кто вознамерился научиться чему-то новому, заключается в том, что он рискует не с того начать. Это может привести к неудачам, разочарованию в предмете интереса или же к прекращению начатого дела. Результат анализа связей, инновации, поддерживаемые Интернетом и в скором будущем, вероятно, электронными приборами, которые смогут общаться между собой, – это один из способов для любопытных людей вроде Фоя обрести новые знания. В случае с Фоем технология, которая проанализирует миллионы песен, поможет ему приобщиться к миру культурных и просвещенных людей гораздо быстрее, чем если бы он ею не пользовался. Он уже подписался на рассылку встреч местных клубов любителей музыки, поэтому все выглядит обнадеживающе.


ОСВАИВАЙ ВСЕ ЭТО, ФОЙ. ПУТИ ЖИЗНИ, КАК СКАЗАЛ БЫ УСАТЫЙ НЕМЕЦКИЙ ФИЛОСОФ, РЕДКО БЫВАЮТ ПРОСТЫМИ. НО ЗА ТРУДНОСТЯМИ СЛЕДУЕТ ВОЗНАГРАЖДЕНИЕ.

Оглавление книги

Реклама
· Аллергии · Холестерин · Глаза, Зрение · Депрессия · Мужское Здоровье
· Артрит · Диета, Похудение · Головная боль · Печень · Женское Здоровье
· Диабет · Простуда и Грипп · Сердце · Язва · Менопауза

Генерация: 1.324. Запросов К БД/Cache: 3 / 1
Меню Вверх Вниз