Добавить в цитаты Настройки чтения

Страница 18 из 23

Даже если вы спокойно отнесетесь к тому, что список просмотренных вами фильмов выложат на всеобщее обозрение, вам вряд ли понравится, если будет обнародована вся история ваших поисковых запросов в интернете. Если вы не отличаетесь от подавляющего большинства людей, то чаще всего вводите в Google Maps свой домашний адрес. Ваше место жительства, посещаемые места, покупки, люди, которыми вы интересуетесь, и проблемы, которые вас беспокоят, относятся к наиболее интимным подробностям жизни. Поисковые запросы отражают и то, что в данный момент волнует общество, и Google предлагает получить представление об этом с помощью обработанной информации на Google Trends. Многие считают, что в Trends преобладают новости, но там можно узнать и о том, что в последние пару лет возрос интерес людей к таким проблемам, как интернет-травля и трансгендер. В то же время поисков по словам «приватность» и «транссексуал» стало меньше[97].

Теперь представьте, что у вас есть возможность видеть чей-то поиск в режиме реального времени. В 1990-х я навещал своего приятеля из Стэнфордского университета, который работал в стартапе в области поисковых систем. Я мог следить за поступающим потоком запросов. Один из них привлек мое внимание: кто-то только что искал «как совершить самоубийство»[98]. Что делать в таком случае? Отследить пользователя по его IP-адресу через сервис-провайдера и позвонить на «горячую линию» предотвращения самоубийств? А не будет ли это вторжением в личную жизнь? Может быть, сначала попробовать внимательно изучить историю поиска этого пользователя, чтобы попробовать понять его мотивацию и более точно оценить вероятность события, которое сразу же приходит в голову при виде такого запроса? А может быть, это писатель, собирающий материал, у которого и в мыслях нет причинить себе вред? Но затем появляется следующий запрос этого человека – «мост Золотые Ворота», где покончили с жизнью более 1600 человек[99]. И после этого вы спокойно отвернетесь от монитора и вернетесь к своей работе по улучшению качества поиска, забыв о том, что человек в опасности? Простого ответа на подобные вопросы не существует.

Схожим образом подробности о вас, а иногда и о ваших близких сообщают ваши покупки в интернете. Чтобы доставить вам заказ, Amazon нужны данные вашей кредитной карточки, в том числе ваши имя и адрес. Сообщить правильный адрес в ваших интересах, иначе посылка до вас не дойдет. В то же время история заказов может вводить в заблуждение, если в ней указаны вещи, которые покупались для кого-то еще. В Amazon можно помечать приобретаемый товар значком «в подарок», и тогда он не будет учитываться в рекомендациях для вас[100]. Алгоритмы обработки данных могут отделять то, что вы указали как покупку не для себя, от всех других ваших заказов. Когда вы покупаете блузку в подарок женщине, то, выбирая размер, сообщаете информацию о ее комплекции. Если это происходит за одну-две недели до Дня матери, а фамилия получательницы совпадает с вашей, алгоритмы Amazon могут сделать вывод о ваших родственных связях. Возможно, что ближе к следующему Дню матери Amazon порадует вас рекомендациями подарков по этому поводу.

Страничка Your Amazon предоставляет пользователям определенную прозрачность и свободу выбора. Возможность просматривать свою первичную информацию, в том числе историю покупок, позволяет контролировать данные, которые становятся основой для выработки персональных рекомендаций. В историю покупок можно включать и вещи, купленные в других местах, причем даже приобретения, сделанные много лет назад. В 2014 году похожий подход был применен в Facebook: «Журнал действий» представляет собой список запросов друзей, лайков, историй и фото с вашими тэгами, приглашений на мероприятия и многого другого. При желании можно удалять из истории отдельные элементы данных. А поскольку ваша цифровая личность в Facebook используется для персонификации рекламы, удаление части данных позволяет влиять на то, какие предложения вам будут присылать[101].

Удаление одного, двух или двадцати лайков из истории действий вряд ли изменит общий характер представления о вас. Исследования Дэвида Стиллуэлла из Психометрического центра Кембриджского университета показали, что действия в Facebook действительно достаточно точно отражают черты личности пользователя. Несколько тысяч пользователей Facebook прошли тест на «Большую пятерку» индивидуальных различий (открытость опыту, сознательность, экстравертность, доброжелательность и нейротизм), а затем Стиллуэлл предложил другой группе участников опыта оценить черты характера этих пользователей исходя из их профайлов. Обе оценки оказались удивительно схожими. Обычно образ человека в Facebook довольно точно отражает действительность – люди остаются самими собой, даже когда тщательно редактируют свои профайлы в социальных медиа[102]. Если совершенно незнакомые люди могут оценить основные черты вашего характера по ленте событий на вашей странице в Facebook, то алгоритмы тем более в состоянии это сделать. Чтобы иметь возможность держать друзей и знакомых в курсе своей жизни, придется мириться с выводами, к которым придут эти алго-ритмы.

В 2013 году Стиллуэлл, его коллега Майкл Косински и группа исследователей из Microsoft Research решили выяснить, насколько точно можно судить об интеллектуальном уровне, этнической принадлежности, политических взглядах, сексуальной ориентации и наличии наркозависимости по поведению человека в Facebook. Для этого они создали приложение YouAreWhatYouLike. По утверждению авторов, в 88 процентах случаев их модель «проводила точные различия между мужчинами гетеросексуальной и гомосексуальной ориентации» исключительно на основе лайков, причем не обязательно в темах, связанных с политикой или правами человека[103]. По данным исследования, достоверными признаками мужской гомосексуальности были, в частности, лайки на «Косметику MAC» и мюзикл «Злая», а среди явных признаков мужской гетеросексуальности была реакция на Wu Tang Clan[104][105]. Проверяя кандидатов на позицию, работодатели используют тесты на ай-кью и личностные качества. Вполне возможно, что в один прекрасный день вас попросят установить специальное приложение, чтобы оценить справедливость ваших утверждений о своей высокой организованности или стрессоустойчивости[106].

Данные о личных качествах могут формироваться и без активного участия человека. Один из таких примеров – несметное число фотографий, выложенных в сеть. Появление ваших изображений в интернете – вне вашего контроля, а права на них – и подавно. Если вас случайно сфотографировали во время какого-то мероприятия, идентификация вашей личности всего лишь вопрос времени. В лаборатории искусственного интеллекта Facebook, которую возглавляет Ян Лекун, разработана система DeepFace, которая может определять идентичность лиц на фотографиях с очень высокой точностью[107]. Система пока не может самостоятельно определять имя человека на изображении, но если фото подписано, алгоритм присвоит эту подпись всем остальным фото с похожими лицами. Создается и другая программа, которая будет анализировать место действия, то есть сможет различать, сфотографированы ли вы в людном баре или на пустынном холме. В зависимости от того, где вас фотографируют чаще, система отнесет вас либо к любителям потусоваться, либо к одиноким странникам.

Научный сотрудник Microsoft Research Синтия Дворк с коллегами доказали, что сам факт существования баз данных подразумевает информационную открытость любого человека. Базы данных существуют для того, чтобы предоставлять ответы, и можно сформировать такую последовательность вопросов, утвердительным ответам на которые будет соответствовать единственный человек в базе. Обычно Синтия демонстрирует это на таком примере: сначала она спрашивает, сколько человек с признаками серповидноклеточной анемии значится в медицинской базе данных сотрудников Microsoft. Затем уточняет, сколько из них мужчин с вьющимися волосами в должности старшего научного сотрудника. Поскольку Синтия – единственный в Microsoft старший научный сотрудник – женщина с вьющимися волосами и признаками серповидноклеточной анемии, разница между ответами на два ее вопроса точно указывает на нее[108].

97

Судя по Google Trends, “большие данные” не были на слуху у общественности до 2011 года.

98

Что касается темы самоубийства, метаанализ, проведенный учеными Оксфордского университета, показал, что «существенно более половины (59 процентов) опрошенных молодых людей сказали, что вели поик в интернете по слову ‘самоубийство’». См. Daine, Kate, Keith Hawton, Vinod Singaravelu, A

99

Эту цифру назвал сержант Калифонийской дорожной полиции Кевин Бриггс, выступая с рассказом о патрулировании моста Золотые Ворота на TED Talk. См. Briggs, Kevin, “The Bridge Between Suicide and Life”, TED Talk, March 21, 2014, https://www.ted.com/talks/kevin _briggs_the_bridge_between_suicide_and_life.

100

Вы можете сделать это на своей страничке “My Amazon”: https://www.amazon.com/gp/yourstore /iyr.

101





Facebook называет это «удалением», но эта информация не удаляется насовсем. Происходит это потому, что найти и вычистить все случаи ее появления на серверах значительно дороже, чем сохранять их, изменив способ пользования. Кроме того, в главе 3 мы убедимся, что Facebook постоянно экспериментирует, чтобы усовершенствовать взаимодействие с пользователями и повысить их активность. В одном из исследований рассматривалась самоцензура – случаи, когда люди начинали писать апдейты и комментарии, но в конечном итоге решали не публиковать их. Отмененные апдейты и комментарии нельзя удалить, поскольку их не публиковали, и тем не менее в Facebook изучают их контекст – всевозможные «как и где». См. Das, Sauvik, and Adam Kramer, “Self-Censorship on Facebook”, Proceedings of the 7th International AAAI Conference on Weblogs and Social Media, Cambridge, MA, July 8–11, 2013 (Palo Alto: AAAI Press, 2013), https://www.aaai.org/ocs/index.php/ICWSM/ICWSM13/paper/viewFile/6093/6350.

102

Bachrach, Yoram, Michal Kosinski, Thore Graepel, Pushmeet Kohli and David Stillwell, “Personality and Patterns of Facebook Usage”, Proceedings of the 4th A

103

Kosinski, Michal, David J. Stillwell and Thore Graepel, “Private Traits and Attributes Are Predictable from Digital Records of Human Behavior”, Proceedings of the National Academy of Sciences USA 110, no. 15 (April 9, 2013), p. 5802, http://www.pnas.org/content/early/2013/03/06/1218772110. Одна из трудностей, возникающих при оценке состоятельности подобных научных трудов, вызвана статистикой свойств личности. Так, если модель построена исходя из предпосылки гетеросексуальной ориентации 100 процентов анализируемых мужчин, она будет точной в 90 процентов случаев, поскольку примерно 10 процентов пользователей мужского пола указывают на наличие у себя «интереса к мужчинам». Тем не менее, выводы исследования на основе приложения YouAreWhatYouLike представляют интерес, особенно в силу того, что такие индивидуальные особенности, как, например, уровень интеллектуального развития, выявляются другими методами.

104

Хип-хоп-группа. – Ред.

105

Kosinski, Stillwell, and Graepel, “Private Traits and Attributes Are Predictable from Digital Records of Human Behavior”, p. 5804.

106

Для доступа к лайкам в Facebook исследователи использовали программный интерфейс приложения (API); им было труднее идентифицировать тех, кто использовал настройки приватности для ограничения доступа к своим лайкам, даже несмотря на их согласие участвовать в оценке индивидуальных особенностей. См. http://applymagicsauce.com. В интервью Косински говорил: «Это может приносить огромную пользу в деле подбора персонала»; Adams, Stephen, “‘Like’ Curly Fries on Facebook? Then You’re Clever”, Telegraph, March 12, 2013, http://www.telegraph.co.uk/technology/news/9923070/Like-curly-fries-on-Facebook-Then-youre-clever.html.

107

Simonite, Tom, “Facebook’s New AI Research Group Reports a Major Improvement in Face-Processing Software”, MIT Technology Review, March 17, 2014, http://www.technologyreview.com/news/525586/facebook-creates-software-that-matches-faces-almost-as-well-as-you-do; Taigman, Yaniv, Ming Yang, Marc’Aurelio Ranzato, and Lior Wolf, “DeepFace: Closing the Gap to Human-Level Performance in Face Verification”, paper presented at the IEEE Conference on Computer Vision and Pattern Recognition, Columbus, OH, June 24–27, 2014, pp. 1701–1708, https://www.cs.toronto.edu/~ranzato/publications/taigman_cvpr14.pdf.

108

Синтия использует этот пример в своей лекции под названием «Я – в базе данных (Но никто об этом не знает)»; I’m in the Database (But Nobody Knows), Dean’s Lecture, University of California – Berkeley School of Information, February 4, 2015, http://www.ischool.berkeley.edu/newsandevents/events/deanslectures/20150204.