Добавить в цитаты Настройки чтения

Страница 17 из 116

1.3.1.2. Что рекомендателям следует оценивать в музыке?

Для производства такого рода рекомендаций требуется база потребительских оценок. Очевидно, что наиболее удобна численная/балльная система кодирования оценок. Но каким образом баллы должны характеризовать музыку? Как ни странно, они вообще не должны ее объективно характеризовать. Потребительские оценки должны отражать исключительно личное впечатление. Ни в коем случае речь не идет об искусствоведческой оценке или профессиональной экспертизе. Любители на нее не способны. Фокус в том, что для решения данной задачи вообще не требуются суждения об «истинном» качестве продукта. Интересуют только индивидуальные ощущения. Они зависят от многого: вкуса, художественной компетентности, общекультурного уровня, настроения и установок, антуража, социального окружения, влияния друзей и, разумеется, от музыки. Разложить все это по полкам практически невозможно, зато каждый может сказать, пришлась та или иная мелодия ему по душе или нет. То, в какой мере впечатление связано именно с музыкой, а не с привходящими обстоятельствами – не имеет никакого значения. Мелодия создает (или не создает) некие желанные состояния – именно в этом ключе ее и следует оценивать в рамках рекомендательной системы. Важно одно: слушатель достоверно знает, понравилась ему музыка или нет, а если формулировать точнее, понравился ли он сам себе в присутствии этой музыки. Именно он и только он – наилучший детектор «для-себя ценности». Оцениваться должно не произведение искусства как таковое (это компетенция искусствоведов), а порождаемые им субъективные эффекты – вот в чем потребитель культуры априори компетентен. Такая оценка субъективна, но в том-то и вся соль: для пользы дела она и должна быть субъективной.

Чьи оценки подлежат сбору? Да всех добровольцев без исключения. Система не нуждается в искусственно набранных референтных группах.

1.3.2. Изобретение, которого не было

1.3.2.1. Коллаборативная фильтрация – фундаментальное решение проблемы навигации

Подобный подход к проблеме выбора может показаться фантастическим, но это не так. Он не только не нов, но применяется на практике более десяти лет. Прототип механизма потребительской селекции был создан в 1992 году. Идея автоматически вычленять вкусовые сообщества и предоставлять их членам возможность обмениваться суждениями была предложена Дейвом Голдбергом (Dave Goldberg) и его коллегами из исследовательского центра Xerox PARC в Пало-Альто, Калифорния. Именно они ввели термин «коллаборативная фильтрация»[127].

В последующие годы первоначальную «сырую» идею коллаборативной (кооперативной) фильтрации довели до ума и сегодня рекомендации даются исходя из сходства предпочтений человека и других пользователей. Для этого клиенту нужно оценить несколько объектов, на основании чего вырисовывается его персональный профиль. В соответствии с ним подбираются советчики, затем их мнения о произведениях, еще не знакомых клиенту, доводятся до его сведения. Эта изящная схема начала активно разрабатываться с 1994 года[128], однако ее судьба оказалась тернистой. В методе изначально присутствовала одна недоработка, которая со временем привела к проблемам. В чем была эта загвоздка и как ее устранить, изложено ниже, после анализа первого опыта внедрения коллаборативной фильтрации.

1.3.2.2. Механизм коллаборативной фильтрации

Поскольку персональные рекомендации генерируются в результате анализа и сравнения оценок конкретного пользователя и других людей, вся соль коллаборативной фильтрации в способе нахождения этих других людей. В общем виде процедура выглядит так[129]:

− регистрируются предпочтения большой группы людей, на их основе строится профиль каждого пользователя;

− выделяется подгруппа людей, чьи суждения схожи с суждениями человека, желающего получить совет/рекомендацию [130];

− на основании отзывов, поступивших от этой подгруппы, выводится некая оценка – именно она и выдается клиенту в качестве прогноза.

Этот метод использовался для характеристики книг, музыкальных CD или фильмов. Но в общем он может практиковаться для облегчения выбора продуктов или услуг любого типа. С конца 90-х годов в интернете стали появляться сайты, построенные на основе коллаборативной фильтрации. Первым (или в числе первых) был Ringo.

1.3.2.3. Ringo – первая в мире рекомендательная система по музыке: ее история и опыт[131]

Сервис Ringo был создан профессором Патти Маес (Patti Maes) и тремя ее студентами в 1994 году. Разработчики этой системы искали решение проблемы взрывного роста объема информации. Массивы книг, фильмов, CD, новостей и онлайновой информации значительно превосходят те, которые реально может пропустить через себя человек. Создатели Ringo применили коллаборативную фильтрацию для музыки, выбрав следующую шкалу оценок:

– Невыносимо

– Терпимо с трудом

– Не моя вещь

– Не заводит, не трогает

– Хорошая вещь

– Мощно





– Одна из моих любимых, не могу жить без нее!

По мере того как абонент наращивает число оценок, его профиль уточняется. Система сравнивает профили пользователей, выявляет людей с похожими вкусами и предсказывает, насколько человеку понравится незнакомый альбом/артист.

Ringo появился в интернете 1 июля 1994 года. После «инкубационного периода» о сервисе пошла молва, и менее чем за месяц число пользователей достигло тысячной отметки, а к исходу второго – приблизилось к двухтысячной. Параллельно росла база данных. Первоначально система включала в себя 575 артистов, но скоро в ней стало 3000 исполнителей (9000 альбомов). Обрабатывалось почти 500 сообщений в день[132]. Те, кто впервые обращались к Ringo, получали список из 125 артистов и, согласно инструкции, присваивали им рейтинг. Оценивать артистов полагалось без детализации (избегая суждений об оригинальности, о вокальных данных и т. д.), а лишь исходя из того, насколько их приятно слушать.

Обретя таким образом персональный профиль, человек мог обратиться к Ringo со следующим запросом: 1) порекомендовать новых артистов/альбомы; 2) перечислить артистов/альбомы, на которые не стоит тратить время; 3) выдать прогноз по конкретному артисту/альбому. Рекомендации сопровождались показателем достоверности (он зависел, в частности, от числа пользователей-единомышленников, взятых в расчет для составления прогноза). Какие-либо данные об абонентах не предоставлялись. Еще пользователь имел доступ к рецензиям своих рекомендателей, а также к досье на любого артиста с перечнем его альбомов и средней оценкой, данной им потребителями. Каждый абонент Ringo ранжировал в среднем около сотни артистов; средний балл составлял 3,7 (т. е. между «не моя вещь» и «не трогает»). Вначале рекомендации Ringo были неточны, поскольку сервис еще не набрал критической массы данных. По мере роста числа пользователей и их обращений компетентность прогнозов нарастала. Чтобы войти в норму, требовалось пару раз пройти операцию ранжирования артистов, в результате чего список абонентов со схожими предпочтениями, так называемых «соседей» пользователя, мог существенно уточниться.

В 1995 году на базе Ringo была создана программа Helpful Online Music Recommendations (HOMR – Полезные онлайновые музыкальные рекомендации). В 1995 году была учреждена компания Agents Inc., вскоре переименованная в Firefly Network (по-русски – «Светлячок»). К середине 1997 года она совместно с Microsoft и Netscape переключилась на регулирование вопросов, связанных с защитой приватности в сети. В 1998 году Microsoft купила эту компанию, хронически испытывающую финансовые затруднения, и тут оказалось, что нового владельца больше интересуют наработки Firefly в области обработки персональной информации о пользователях, но не коллаборативная фильтрация. 4 августа 1999 года Microsoft закрыла Firefly.com – один из наиболее важных экспериментов в истории интернет-коммьюнити закончился[133].

127

United We Find // The Economist, March 10, 2005.

128

Heylighen F. Collaborative Filtering // Principia Cybernetica Project [on-line], 2001. [cited Feb. 28, 2005]. Available from URL: <http://pespmc1.vub.ac.be/COLLFILT.html>.

129

Heylighen F. Collaborative Filtering.

130

Обычно мерой сходства потребителей являются коэффициенты корреляции Пирсона между их предпочтениями, выраженными в баллах, либо углы между векторами, представляющими собой отражение потребительских предпочтений. Подробнее о рекомендательных системах см. часть 2, глава 2.7.

131

По материалам: Shardanand and Upendra & Maes P. Social Information Filtering: Algorithms for Automating «World of Mouth» // Proc. of CHI’95 Conference on Human Factors in Computing Systems, ACM Press, 1995.

132

Один пользователь мог послать десятки запросов в день. Сообщения посылались головному серверу, который раз в час обрабатывал накопившуюся корреспонденцию и отвечал на нее. Подробнее см.: Heylighen F. Collaborative Filtering.

133

Oakes Ch. Firefly’s Dim Light Snuffed Out // Wired [on-line], 8th December, 1999. [cited Feb. 20, 2003]. Available from URL: <http://www. wired.com/news/culture/0,1284,21243,00. html>.