Добавить в цитаты Настройки чтения

Страница 19 из 116

1.3.2.5. Трюк с подменой технологии

Благовидный предлог для приостановки целомудренного навигационного сервиса оказался под рукой. Им стал тот самый недостаток коллаборативной фильтрации, о котором уже упоминалось: необходимость сбора клиентских предпочтений. Для продуктивной работы требуется приличная база клиентских оценок – минимум сотни тысяч. До того как критическая масса набрана, люди не мотивированы выражать свое мнение, поскольку система не способна вознаградить их усилия. Это так называемая проблема холодного старта. Кто-то первым должен потрудиться во имя остальных – это классическая ситуация производства общественного блага со всеми ее сложностями. Для разогрева на старте можно ничего не спрашивать у клиентов, а попытаться вычислить их предпочтения из потребительских действий (кстати, совершаемых не обязательно в рамках рекомендательной системы)[137]. Этой дорогой и двинулся бизнес, вскоре обнаружив, что можно вообще обойтись без сбора прямых и явных (сознательно выраженных) клиентских предпочтений[138]. Косвенными источниками оценок могут служить, например, прошлые покупки или время просмотра конкретной веб-страницы, или последовательность кликов по ссылкам в сети. В. Коуэн и В. Фэн показали, как можно отслеживать музыкальные предпочтения путем анализа логов (хронологической записи событий), статистики скачиваний и прочей технической информации[139]. По названию файла можно установить исполнителя или композитора, а по IP-адресам – потребителей.

Тот же принцип применяется в интернет-магазине Amazon: каждая книга здесь сопровождается списком литературы, приобретенной покупателями данной книги[140]. Считается, что фактом покупки люди выражают свою оценку. Хотя купленное и понравившееся – это, очевидно, не одно и то же, но этой разницей Amazon считает возможным пренебречь. Несмотря на то что качество прогнозов, выведенных из косвенных данных, ниже, чем из прямых потребительских оценок, бизнес сделал ставку именно на них. За этим проглядывает желание не просто избавить покупателей от лишних хлопот, но и дозировать их компетентность. (Это тот же мотив, который привел дигитальные отрасли культуры к единообразию цен.) Опции, облегчающие выбор, привлекают клиентов, способствуя увеличению продаж, но они же уточняют выбор, что ведет к снижению продаж. Предоставляя услугу по навигации, бизнес заинтересован в таком ее виде, который не вредит сбыту продукции разного достоинства. То есть он выбирает оптимальный для себя вариант, но это не значит, что это лучший вариант с точки зрения покупателя. Если бы навигационный сервис Amazon был платным и доходы от него были бы сопоставимы с продажей книг, тогда резонно было бы ожидать более высокого качества. Дареному же коню в зубы не смотрят. Предоставили какую-то навигацию – и на том спасибо. Вообще, экспертиза, соединенная с продажами, потенциально содержит возможность двурушничества, и полагаться на нее если и можно, то с большой осмотрительностью.

1.3.2.6. Кто кого фильтрует?

По мере того как число участников коллаборативной фильтрации растет, нарастают проблемы обработки данных. При нескольких миллионах пользователей ограничения скорости операций становятся ощутимыми. Поэтому, когда рекомендательный сервис используют в качестве придатка к торговым системам, фильтрацию по типу «потребитель-потребитель» заменяют цепочкой «объект-объект» (см. рисунок). Этот принцип экономичнее, в частности из-за отсутствия необходимости часто пересчитывать взаимосвязи между клиентами[141]. В этот момент и закладываются предпосылки для незаметной переориентации метода с нужд потребителей на интересы продавцов.

В основе пообъектной фильтрации – фиксация всех оценок, выставленных пользователями системы различным объектам (это могут быть товары, услуги, учреждения и т. д.), и анализ сходства между объектами, что не совсем то же самое, что сходство между людьми. Например, берется конкретный продукт – книга – и выявляются все прочие книги, получившие от различных потребителей сходную оценку. Хотя с точки зрения математики подсчеты «объект-объект» вроде идентичны данным, полученным из оценок потребителей, но во втором случае отбираются продукты, нужные людям, а в первом – люди, «нужные» для продвижения продуктов. В объектной фильтрации сходство между товарами устанавливается по профилю оценок потребителей, а в «чело­веческой» версии – по ряду персонально выделенных и значимых параметров. Разница именно в том, что в коллаборативной фильтрации с непосредственным участием потребителей те сами расставляют акценты, а пообъектная схема обходится без этого. Методы были бы идентичны, если бы в поклиентской версии фильтрации учитывались все оценки всех покупок, совершаемых потребителями.

Пренебрегать прямо высказанными оценками – это все равно что судить о совпадении вкусов людей по их знакомству с блокбастерами. К тому же очевидно, что факт потребления чего-либо далеко не всегда равнозначен удовлетворению. Существует зазор между интересом к продукту и его итоговой оценкой. Неспроста модераторы Ringo не ограничивались часто ранжируемыми артистами, а оставляли место для индивидуальных предпочтений. Расхождение между оплатой и удовлетворением особенно существенно тогда, когда нет повторного потребления, и накопления информации (позитивной или негативной) от предыдущих покупок не происходит. Именно поэтому культурная продукция, потребляемая однократно, оказывается в числе наиболее проблемных случаев для пообъектной фильтрации. Здесь между интересом, ожиданиями и конечными впечатлениями может пролегать пропасть. В предметной сфере ситуация менее острая.

В потребительской версии люди сигнализируют о своих итоговых эмоциях и впечатлениях, а в пообъектной – товары указывают на свою способность притягивать внимание людей, что, очевидно, заслуга не только их качества, но еще и рекламы и цены[142]. Таким образом, люди дают экспертную оценку товаров с большей пользой для себя. В особенности если учитывать, что их вовлеченность в процесс сама по себе позитивна. В областях, где люди потребляют приблизительно одинаковый ассортимент, например одни и те же автомобили или стиральные порошки, совпадение списка покупок не выявляет различий во вкусе. Другое дело, что оно указывает на схожесть статусов, и в этом смысле пообъектная фильтрация оказывается информативной. В то же время очевидно, что она скорее подогревает стремление к подражанию, чем к отличиям, и это на руку бизнесу.

Как отмечалось, анализ сходства в рамках объектной фильтрации не нужно делать каждый раз, что обеспечивает скорость ответа на запрос. Именно это и требуется Amazon и прочим торговцам для того, чтобы успеть напичкать клиентов рекомендациями, пока они пребывают в покупательском настроении. Люди ведут поиски и покупки в интернете, оставляя на различных сайтах следы своего присутствия, а на них попутно сыплется информация то ли рекомендательного, то ли рекламного свойства. Простые клики на веб-страницы засчитываются системой как акты потребительского ранжирования. Но остановка внимания на некоем предложении, а может быть просто пауза по сторонним причинам – не такой уж точный показатель заинтересованности человека в данной вещи. К тому же, далеко не все покупки совершаются в интернете, поэтому выборка покупательских предпочтений, сделанная только на основе этих данных, не вполне репрезентативна. Коллаборативная фильтрация с непосредственным участием потребителя пусть медленнее, но вернее служит его интересам.

1.3.2.7. Бизнес-версия коллаборативной фильтрации, или зачем поступаться принципами?

Рекомендательная система, интегрированная с процессом продаж так, чтобы подсовывать товары в то время, когда что-то приобретается или ищется, ориентирована на интересы бизнеса. Она не требует активности со стороны пользователя. Все, что от него нужно – это вступить на торговую площадь. Тут его и берут в оборот. Это соображение – ковать железо, пока горячо – стало решающим в эволюции коллаборативной фильтрации. Держать оценки наготове и быстро выдавать их, как того требуют интересы бизнеса, никого ни о чем не спрашивая, – данная логика подвела к скрытому этическому компромиссу. Как только решили не беспокоить клиента по таким пустякам, как его мнение о качестве, дело все больше стало клониться к программированию поведения.

137

Подробнее об этом см. часть 2, параграф 2.7.3.1.





138

Предпочтения могут быть явными (когда пользователь сам оценивает потребленные книгу, компакт-диск или ресторан) либо неявными (когда выводы делаются на основе его действий).

139

Cohen W. W., Fan W. Web-Collaborative Filtering: Recommending Music by Crawling the Web // Proceedings of the 9th International World Wide Web Conference, 2000.

140

Подробнее см. приложение 1, параграф 11.6.1.

141

Этот вариант навигации в 2001 г. предложили Бадрул Сарвар и его коллеги из Университета Миннеаполиса (см.: Sarwar B., Karypis G., Konstan J., Riedl J. Item-based Collaborative Filtering Recommendation Algorithms. [on-line] Department of Computer Science and Engineering, University of Mi

142

Подробно о взаимосвязях рекламы и цены см. часть 3, разделы 3.4.1. и 3.4.2.