Добавить в цитаты Настройки чтения

Страница 11 из 13



Посмотрев на список, можно ли сказать, «о чем» все эти бестселлеры в твердом переплете? Очевидно – ни о чем в частности и в то же время обо всем. Но в нем есть и закономерности. Подсказкой может служить то, что Джордж Р. Р. Мартин – своего рода аномалия. Его книга стала бестселлером в конце 2015 года, вероятно, в большой степени благодаря колоссальному успеху телесериала «Игра престолов». По крайней мере, про этот роман можно сразу сказать, что его попадание в бестселлеры было неожиданным. Тридцать лет назад – другое дело, тогда жанр фэнтези был популярен. Сейчас же в моду вошел современный реализм.

Мы пишем эту главу за неделю до Рождества – сейчас люди покупают подарки, и понятно, что на первое место в списке выходят самые популярные авторы. Поэтому задача распознавания тем слегка упрощается по сравнению с остальными неделями года. По-видимому, доминирующая тема – преступление. За ней идет война, которую можно назвать старшей сестрой преступления. В романах Спаркса и Стил, как и следовало ожидать, главная тема – любовь, но в аннотациях упоминаются отношения, грозящие героине опасностью, и смерть любимого человека. Так что и здесь не все безоблачно. Стивен Кинг (если не заболел) наверняка написал, как обычно, полный саспенса ужастик. В общем, несмотря на разнообразие (впрочем, не чрезмерное) тематики в списке этой недели, можно, вероятно, заключить, что основные темы, приводящие книгу в список бестселлеров, – насилие и страх. На этом мы могли бы завершить свой краткий анализ, сделав вывод, что удивительное культурное явление под названием «список бестселлеров NYT» отражает одержимость современного американского общества темой насилия (так что психиатры и социологи в этой стране еще долго не останутся без работы).

Надо сказать, что ни один из нас не собирается оспаривать этот вывод. Кроме того, ни один из нас не является дипломированным социологом. Раз уж мы пришли к этому выводу, мы его обнародуем. Но если вы решили срочно поменять профессию, пойти в литературные агенты и отбирать книги исключительно по наличию в них темы насилия, лучше погодите; давайте вместе рассмотрим менее очевидные закономерности, отраженные в этом списке.

При первом же взгляде на список бестселлеров в мягких обложках видно, что здесь ситуация несколько иная. Из десяти лидеров продаж преступлениям посвящена только одна книга. Это опять роман Джеймса Паттерсона об Алексе Кроссе, но уже другой: Алекс Кросс вынужден бросить семью за рождественским столом и бежать выручать заложников. Надо сказать, что в списке бестселлеров в мягкой обложке доминантная тема не просматривается вообще. На первом месте «Марсианин» – книга о покорении Марса, популярности которой очень способствовал успех фильма с Мэттом Деймоном. На втором – старая книга Филипа К. Дика (про Вторую мировую – но в альтернативной истории, где союзники войну проиграли). Два-три романа про жизнь женщин, любовь и дружбу. «Алхимик»[58] Пауло Коэльо, аллегорический роман о странствующем пастухе, находится в списке – потрясающе! – уже 383 недели. «Первому игроку приготовиться»[59] – книга Эрнеста Клайна о компьютерном игроке в виртуальной реальности. Ее тоже сейчас экранизируют. В четырех романах – Филипа К. Дика, «Все, чего я не сказала»[60], «Поезд сирот»[61] и «Бруклин»[62] – действие происходит в ХХ веке, но в разные десятилетия. Может быть, ключ к мегауспеху – не насилие, а историческая тематика? Даже если это и так, ее все же маловато для обобщения: четыре книги – это не десять. Что же это все-таки за тема, общая для всего списка? Может быть – путешествие?

Пока ясно только одно: во всех книгах списка персонажам приходится нелегко. Но чтобы обнаружить закономерности, нужно в первую очередь наблюдать за фактами и проверять гипотезы. Давайте шутки ради скажем, что если издательство намерено выложить несколько миллионов долларов за новый бестселлер, то, судя по этому списку, он должен быть о путешествии, которое главный герой совершает против своей воли или в страхе. Пожалуй, на сегодняшнем рынке такая книга имеет хорошие шансы на успех. И конечно, это предоставит редактору большую свободу действий, поскольку книга, соответствующая этому описанию, может быть и любовным романом, и триллером, и фантастическим романом, и произведением серьезной литературы. Этот сюжет можно отдать на разработку разным писателям и получить множество непохожих книг, несущих читателю разные послания, – поэтому все бестселлеры кажутся различными, хотя, как мы скоро увидим, в каком-то смысле они сходны.

Вот важный вывод из этого блиц-анализа, который следует запомнить: тема шире границ жанра. Первое, что нужно сделать, если вы хотите писать, публиковать или распознавать бестселлеры, – вообще забыть о понятии жанра, несмотря на его роль в книжном деле. Свадьба и супружеская жизнь могут фигурировать в книге любого жанра. Любовь и преступление – тоже. Пропорции тем в разных жанрах могут отличаться, но важно, чтобы где-то в тексте эти ключевые темы были. Вся проделанная нами работа доказывает, что концепция жанра подобна смирительной рубашке. Забудьте о ней. Если вы готовы взять на вооружение подобный образ мыслей, значит, вы уже начали мыслить как наш компьютер, строящий прогностическую модель.

Проверка

Для каждой книги в нашей коллекции были вычислены процентные значения, указывающие на содержание в ней той или иной из 500 тем, попавших в наш список. Конечно, в некоторых книгах какие-то темы не появляются вообще – например, в «Коде да Винчи» нет ковбоев. Но для каждого текста мы получили диаграмму вроде той, что изображена на рис. 3. Эта диаграмма – для книги Джоди Пиколт «Последнее правило»[63]: 23 % объема занимает тема, которую мы условно назвали «Дети и школа», 10 % – «Преступления», 7 % – «Судебные процессы и юридические вопросы», 6 % – «Домашние дела» и 2 % – «Близкие отношения».

Рис. 3. Основные темы романа Джоди Пиколт «Последнее правило»

После того как наш компьютер выделил основные темы, каталогизировал их и определил пропорцию каждой темы в каждой книге, мы обработали случайно выбранное подмножество результатов с помощью алгоритма машинного обучения, которому было заранее известно, какие книги в коллекции являются бестселлерами, а какие – нет. Используя эту информацию, программа подсчитала, какие темы и в каких пропорциях наиболее вероятно встретить в случайно выбранном бестселлере. Более того, эта же программа может определить, в использовании каких тем наиболее ярко проявляется различие между бестселлерами и небестселлерами.

Хороший пример – тема секса, о которой мы уже говорили раньше. В среднем она возникает в небестселлерах вдвое чаще, чем в бестселлерах. Компьютер способен уловить эту разницу и использовать полученные данные, чтобы спрогнозировать вероятность успеха доселе неизвестной рукописи. Согласно нашей модели, книга, в которой секс фигурирует почти в каждой главе, имеет мало шансов стать по-настоящему популярной. Конечно, из этого принципа есть исключения – трудно не заметить Сильвию Дэй или Э. Л. Джеймс, – но два автора не могут заметно повлиять на общие результаты исследования тысячи книг.

В конце концов наша компьютерная модель научилась на основании тематического профиля предсказывать с точностью 80 %, станет ли книга бестселлером[64]. И когда мы спросили модель, каким авторам за последние 30 лет лучше всего удавалось (преднамеренно или инстинктивно) использовать нужные темы в правильной пропорции, компьютер назвал два имени: Джон Гришэм и Даниэла Стил. Это нас как громом поразило. Наша реакция была вызвана не столько мнением по поводу их творчества – на тот момент мы еще не слишком пристально изучили их тематический «геном», – сколько тем фактом, что наша модель смогла выявить двух самых успешных писателей в истории человечества. Из всех их произведений она выбрала несколько самых, на ее взгляд, перспективных. Среди книг Стил это оказались «Неожиданный роман»[65], «Благословение»[66] и «Жить дальше»[67]. У Гришэма – «Противники»[68], «Юрист»[69] и «Джо из Калико»[70].

58

O Alquimista, Paulo Coelho.

59

Ready Player One, Ernest Cline.

60

Роман Селесты Инг. Everything I Never Told You, Celeste Ng.

61

Роман Кристины Бейкер Кляйн. Orphan Train, Christina Baker Kline.



62

Роман Колма Тойбина. Brooklyn, Colm Tóibín.

63

House Rules, Jodi Picoult.

64

Точность измеряется с помощью перекрестной проверки. В этом случае мы использовали два типа перекрестной проверки: в первом (скажем для читателей, которых интересуют подробности) сначала использовалось многократное обучение на случайной выборке 90 % книг, а затем проверка результатов на оставшихся 10 %. Во втором мы использовали принцип «все, кроме одной», заключавшийся в том, что мы обучали модель на множестве всех книг, изымая оттуда лишь по одной книге единомоментно. В обоих экспериментах успехом считалось, когда машина правильно угадывала класс (бестселлер или небестселлер) изъятой книги (или книг, при первом подходе). Это длительный и кропотливый процесс, включающий в себя обучение и испытание множества моделей. При обучении этих моделей нам приходилось использовать уже изданные книги, про которые было известно, стали они бестселлерами или нет. Первая модель была построена в 2011 г. Добавив в корпус текстов все бестселлеры и некоторое количество небестселлеров, вышедшие за следующие пять лет, мы смогли снова испытать модель и в каком-то смысле проверить, работают ли наши наблюдения, сделанные в 2011-м, для 2015 г. Оказалось, что да. Подкрепив свою уверенность с помощью перекрестной проверки, мы можем исследовать прогноз и связанные с ним показатели вероятностей для каждой книги. По поводу некоторых книг модель не смогла прийти к окончательному выводу, и такие книги получали индекс 51 %. Поскольку случайная догадка имеет вероятность 50 на 50, это не очень высокая степень уверенности. В таком случае мы исследовали все остальные характеристики текста – например стиль или сюжет, – прежде чем сделать вывод о вероятности успеха. Но для других книг модель прогнозировала индекс успеха с большой уверенностью и присваивала им соответствующий рейтинг. (Примеч. авторов.)

65

The House on Hope Street, Danielle Steel.

66

Mixed Blessings, Danielle Steel.

67

Accident, Danielle Steel.

68

The Litigators, John Grisham.

69

The Associate, John Grisham.

70

Calico Joe, John Grisham.