Чтение онлайн

ЖАНРЫ

Код бестселлера
Шрифт:

Мы начали с извлечения свыше 20 тысяч параметров – имейте в виду, что количество восклицательных знаков и частота употребления слова «него» это лишь два из них, – и изучили их все. Некоторые были приметами стиля, другие помогали что-то узнать о сюжете и месте действия, а третьи поясняли, о чем, собственно, книга. Оказалось, что не все эти параметры помогают отличить книгу, набравшую миллионы читателей, от той, которая, несмотря на все свои уникальные достоинства, провалилась. Например, выяснилось, что использование чисел в заглавии – «911», «1984», «867–5309», «$ 1 000 000» – никак не стимулирует продажи. Аналогичным образом мы потратили много времени, обучая компьютер распознавать место действия (например, действие книги «Дьявол носит Prada» [35] происходит целиком в Нью-Йорке, а действие «Исчезнувшей» начинается в Нью-Йорке, а потом переносится в штат Миссури), но оказалось, что, за малыми исключениями, географическое положение героев совершенно не влияет на популярность у читателей. В Нью-Йорке происходит действие как бестселлеров, так и книг, не имевших никакого успеха. Литературные мегахиты, действие в которых разворачивается в этом городе, – взять хотя бы «Обнаженную для тебя» Сильвии Дэй, «Костры амбиций» [36] Тома Вулфа, «По-быстрому» [37] Джеймса Паттерсона, «Жутко громко и запредельно близко» [38] Джонатана Сафрана Фоера – явно (намеренно со стороны автора или случайно) обладают какими-то иными, более важными «генами бестселлера».

35

The Devil Wears Prada, Lauren Weisberger.

36

The Bonfire of the Vanities, Tom Wolfe.

37

The Quickie, James Patterson.

38

Extremely Loud & Incredibly Close, Jonathan Safran Foer.

В конце концов мы отфильтровали свой список параметров, оставив от 20 тысяч примерно 2800, которые помогают отличить популярные у читателей книги от предназначенных для – будем честны – узкой читательской ниши. Сначала мы научили компьютеры читать книги и извлекать из них нужные данные, а затем проанализировали эти данные, используя другой набор компьютерных программ – для обнаружения и исследования скрытых закономерностей. В этой фазе анализа мы использовали процесс, весьма метко называемый машинным обучением. При анализе текстов бывает нужно сортировать или классифицировать их по сходству и различию. Например, мы хотим отличать спам от обычных сообщений в электронной почте. Поскольку у спамерских посланий много общего – искаженное написание слов, частое упоминание виагры и т. д., – можно написать программу, которая будет определять, с какой вероятностью данное сообщение окажется спамом. Сортировка романов на бестселлеры и небестселлеры очень похожа на действия, выполняемые спам-фильтром в электронной почте. Допустим, у нас есть новая книга, которую мы видим в первый раз, и мы хотим понять, может ли она стать бестселлером. Если у нас уже есть куча бестселлеров («не спам») и куча книг, которые бестселлерами не стали («спам»), мы можем ввести их все в компьютер и научить его отличать книги одной категории от другой по определенным параметрам. Именно так мы и поступили. Более того, мы проделали это тремя разными способами, усреднили результаты и обнаружили, что в 80 % случаев наша система правильно определяла, какой текст из нашего корпуса – бестселлер, а какой – нет [39] .

39

Первую попытку выявления бестселлеров мы предприняли в первом нашем эксперименте, в Стэнфорде, еще в 2008 г. Наш корпус текстов состоял из 20 000 романов, но параметров для анализа у нас было гораздо меньше, всего 505. Такой большой корпус текстов был полезен для определенных видов анализа, но при этом он был составлен с уклоном в пользу более ранних периодов – в нем содержалось слишком много книг XIX века, а среди более современной литературы преобладали научная фантастика, фэнтези и любовные романы. Несмотря на эти недостатки, мы получили хорошие результаты: точность определения бестселлера колебалась в пределах 70–80 %.

При написании этой книги мы построили совершенно новый корпус текстов: более разнообразный и более современный. В нем содержалось почти 5000 произведений, в том числе электронные книги, не ставшие бестселлерами, романы, опубликованные традиционным путем, а также бестселлеры из списка NYT числом чуть больше 500. (Примеч. авторов.)

Этот средний показатель 80 % означает, что, если взять наугад из недавно опубликованных книг 50 бестселлеров и 50 так и не ставших ими, наш компьютер правильно классифицирует 40 бестселлеров и 40 небестселлеров. Конечно, это значит также, что компьютер сочтет 10 бестселлеров провальными, а 10 небестселлерам напророчит блестящий успех. В проведенной нами серии тестов компьютер, в частности, был абсолютно уверен, что «Гордость и предубеждение и зомби» [40] не будет иметь успеха, – и ошибся. Конечно, «Гордость и предубеждение и зомби» вышла тогда, когда любая отсылка к Джейн Остин гарантировала книге внимание читателей, а в кинотеатрах пачками шли фильмы про зомби. Но в данном случае контекст оказал непропорционально большое влияние на уровень продаж.

40

Pride and Prejudice and Zombies, Seth Grahame-Smith.

Конечно, были еще и небестселлеры, которые наш компьютер превознес до небес, но это отдельная история.

Договор

Обсуждая новые романы, мы, авторы этой книги, часто говорим об отношениях читателя и автора так, будто существует некий неписаный договор – детали его туманны, но тем не менее он описывает эстетические, эмоциональные, интеллектуальные и даже этические причины, стоящие за выбором читателя. Обучая свою модель распознавать тему, сюжет, стиль и характеристики персонажей, мы много думали о том, чего ждет читатель от книги.

Этот неписаный договор содержит много статей. Если вы автор триллера, например, вы обязаны включить в него один-два трупа и сцену, в которой у читателя учащается пульс. Если вы пишете любовный роман, то он должен заканчиваться (но не начинаться) долгожданным воссоединением влюбленных. И независимо от жанра (если вы не новый литературный вундеркинд – им прощается двойная длина книги), у вас есть примерно 350 страниц, чтобы увести читателя куда-то далеко, а потом привести обратно. Таковы ваши основные обязательства, и вы наверняка видели, как брызжут желчью или роняют слезу читатели в отзывах на сайте goodreads.com, когда автор не оправдывает ожиданий.

Помня об этом, дорогой читатель, мы заключим с вами собственный договор, условия которого весьма прозрачны. Вот его статьи.

1. Номер первый

Одна из особенностей нашей культуры и книжного мира состоит в том, что мы обожаем ранжированные списки. Дело не ограничивается списком бестселлеров. В этом году в газетах и на сайтах крупных книжных сетей мелькали статьи с разнообразными заголовками вроде «Самые красивые места действия ваших любимых романов», «Десять самых влиятельных книг всех времен», «Выбери бойфренда среди литературных персонажей». Посетители сайта goodreads.com общими силами составили списки по самым разным темам: лучшие книги, действие которых происходит в космосе; лучшие японские издания; герои, оказавшие наибольшее влияние; книги, которые заставят вас всплакнуть. Этих списков тысячи. Книголюбам приятно составлять их, спорить о них и, конечно, сравнивать, с кем лучше пойти на свидание – с мистером Дарси или Кристианом Греем.

Не думайте, что у нас, авторов, иммунитет к составлению списков. Мы знаем, что всех, кто имеет отношение к книжному делу, просят порекомендовать любимую книгу. Если об этом спросили вас, ответ «У меня нет любимой книги» звучит смертным приговором – он убивает на корню и светскую беседу, и ваш авторитет профессионального читателя. Эти пять слов гарантированно действуют на собеседника как холодный душ. Так что мы участвуем в рискованной игре, поскольку понимаем, что в нашем мире номер первый решает все. Номер первый – это важно. Первый номер в списке бестселлеров NYT значит нечто гораздо большее, чем номер десятый. Возможно, именно потому, что современный мир предоставляет бесконечные возможности выбора, мы испытываем психологическую и культурную потребность – определить одного победителя, короля, бога. Выбрать что-нибудь одно.

К концу этой книги мы приведем собственный список рекомендованного чтения и назовем победителя – произведение, которое наш компьютер выбрал в качестве образцового, эталонного бестселлера последних тридцати лет.

2. Верьте нам, как мы доверились машине

Второе обещание, которое мы даем читателям «Кода бестселлера», – не «исправлять» выбор модели. Мы с самого начала согласились с тем, что наша задача – не выбирать, а объяснить выбор. По правде сказать, мы не читали «книгу номер один» до того, как ее выбрал компьютер, хотя и были знакомы с другими произведениями этого автора. Конечно, мы тут же схватили ее с полки, прочитали вместе и вместе посмеялись над неожиданной иронией. Мы советуем вам не перескакивать сразу к названию романа-победителя – каждая глава нашей книги объясняет очередной кусочек головоломки. Но в то же время мы знаем, какое это искушение – прочитать первую страницу и потом сразу же заглянуть на последнюю.

3. Волшебного чая не существует

Мы не утверждаем, что после первого же (или даже после второго) прочтения нашей книги вы сможете писать бестселлеры. Это вовсе не пособие «для чайников», и мы не даем никаких гарантий. Вы обязательно найдете на этих страницах множество полезных советов, которым мы сами непременно последуем, если решим написать бестселлер. И конечно, прежде чем сдавать агенту свое новое произведение, мы обязательно проведем компьютерный анализ текста. Но красота этой книги заключается еще и в том, что она позволяет пересмотреть старую аксиому, которая гласит: «писательское мастерство – дар, которому невозможно научить». Нам интереснее ниспровергать, чем обучать.

Почти все известные нам пособия для писателей (нам больше всего понравились написанные авторами книг-блокбастеров, такими как Дин Кунц и Стивен Кинг) дают советы по разным аспектам прозы: стиль, характер, сюжет. Мы делаем то же самое. Мы надеемся, что поможем вам заглянуть в глубины ДНК бестселлера, куда не проникает человеческий глаз, и препарировать это невыразимое je ne sais quoi [41] , свойственное талантливым писателям. Но мы не дадим вам формулы, которую можно было бы применить. Эта книга поведает вам многое об анатомии бестселлера, но не поможет ее скопировать – как не помогут стать писателем отпечатки пальцев Адама Джонсона [42] , даже если вы срежете кожу у него с кончиков пальцев и приклеите себе.

41

Не знаю что (фр.).

42

Джонсон Адам (р. 1967) – американский писатель, лауреат Пулитцеровской премии.

Возможно, вы сочтете нас возмутительно старомодными, но мы твердо верим: тот, кто хочет написать бестселлер, должен сначала изучить и уметь отличать хорошую прозу, используя для этого все доступные средства. Если наша книга окажется полезной и вы напишете бестселлер – пожалуйста, дайте нам знать. Мы обязательно купим его и подвергнем компьютерному анализу. Но не жалуйтесь, что вы искали простую формулу, чтобы отхватить миллионный контракт на роман, а мы вам ее не дали. Тот, кто предложит вам такую формулу, – шарлатан, ничем не лучше тех, кто продает волшебный чай для похудения, гарантируя «радикальную потерю веса за одну ночь».

Поделиться с друзьями: