Код бестселлера - [9]

Шрифт
Интервал

Вопросительные и восклицательные знаки тоже многое могут поведать. Возможно, вы помните, как писали сочинения в школе и как учитель советовал вам не злоупотреблять восклицаниями. Если каждая фраза визжит от возбуждения («О боже!»), или командует («Руки вверх!»), или кричит от боли («Ой!»), или жутко грохочет в подвале среди ночи («Бу-бух!»), то у читателя, не ровен час, может случиться сердечный приступ. Если текст изобилует восклицательными знаками, это кое-что говорит как о его возможном содержании и уровне накала страстей, так и о профессионализме автора. Аналогичным образом обилие вопросительных знаков указывает на то, что этот текст – диалог, а бесконечные страницы текста без единого вопросительного знака могут замедлить динамику повествования и притупить интерес читателя. Эти черты индивидуального стиля мы обсуждаем в 4-й главе.

Мы начали с извлечения свыше 20 тысяч параметров – имейте в виду, что количество восклицательных знаков и частота употребления слова «него» это лишь два из них, – и изучили их все. Некоторые были приметами стиля, другие помогали что-то узнать о сюжете и месте действия, а третьи поясняли, о чем, собственно, книга. Оказалось, что не все эти параметры помогают отличить книгу, набравшую миллионы читателей, от той, которая, несмотря на все свои уникальные достоинства, провалилась. Например, выяснилось, что использование чисел в заглавии – «911», «1984», «867–5309», «$ 1 000 000» – никак не стимулирует продажи. Аналогичным образом мы потратили много времени, обучая компьютер распознавать место действия (например, действие книги «Дьявол носит Prada»[35] происходит целиком в Нью-Йорке, а действие «Исчезнувшей» начинается в Нью-Йорке, а потом переносится в штат Миссури), но оказалось, что, за малыми исключениями, географическое положение героев совершенно не влияет на популярность у читателей. В Нью-Йорке происходит действие как бестселлеров, так и книг, не имевших никакого успеха. Литературные мегахиты, действие в которых разворачивается в этом городе, – взять хотя бы «Обнаженную для тебя» Сильвии Дэй, «Костры амбиций»[36] Тома Вулфа, «По-быстрому»[37] Джеймса Паттерсона, «Жутко громко и запредельно близко»[38] Джонатана Сафрана Фоера – явно (намеренно со стороны автора или случайно) обладают какими-то иными, более важными «генами бестселлера».

В конце концов мы отфильтровали свой список параметров, оставив от 20 тысяч примерно 2800, которые помогают отличить популярные у читателей книги от предназначенных для – будем честны – узкой читательской ниши. Сначала мы научили компьютеры читать книги и извлекать из них нужные данные, а затем проанализировали эти данные, используя другой набор компьютерных программ – для обнаружения и исследования скрытых закономерностей. В этой фазе анализа мы использовали процесс, весьма метко называемый машинным обучением. При анализе текстов бывает нужно сортировать или классифицировать их по сходству и различию. Например, мы хотим отличать спам от обычных сообщений в электронной почте. Поскольку у спамерских посланий много общего – искаженное написание слов, частое упоминание виагры и т. д., – можно написать программу, которая будет определять, с какой вероятностью данное сообщение окажется спамом. Сортировка романов на бестселлеры и небестселлеры очень похожа на действия, выполняемые спам-фильтром в электронной почте. Допустим, у нас есть новая книга, которую мы видим в первый раз, и мы хотим понять, может ли она стать бестселлером. Если у нас уже есть куча бестселлеров («не спам») и куча книг, которые бестселлерами не стали («спам»), мы можем ввести их все в компьютер и научить его отличать книги одной категории от другой по определенным параметрам. Именно так мы и поступили. Более того, мы проделали это тремя разными способами, усреднили результаты и обнаружили, что в 80 % случаев наша система правильно определяла, какой текст из нашего корпуса – бестселлер, а какой – нет[39].

Этот средний показатель 80 % означает, что, если взять наугад из недавно опубликованных книг 50 бестселлеров и 50 так и не ставших ими, наш компьютер правильно классифицирует 40 бестселлеров и 40 небестселлеров. Конечно, это значит также, что компьютер сочтет 10 бестселлеров провальными, а 10 небестселлерам напророчит блестящий успех. В проведенной нами серии тестов компьютер, в частности, был абсолютно уверен, что «Гордость и предубеждение и зомби»[40] не будет иметь успеха, – и ошибся. Конечно, «Гордость и предубеждение и зомби» вышла тогда, когда любая отсылка к Джейн Остин гарантировала книге внимание читателей, а в кинотеатрах пачками шли фильмы про зомби. Но в данном случае контекст оказал непропорционально большое влияние на уровень продаж.

Конечно, были еще и небестселлеры, которые наш компьютер превознес до небес, но это отдельная история.

Договор

Обсуждая новые романы, мы, авторы этой книги, часто говорим об отношениях читателя и автора так, будто существует некий неписаный договор – детали его туманны, но тем не менее он описывает эстетические, эмоциональные, интеллектуальные и даже этические причины, стоящие за выбором читателя. Обучая свою модель распознавать тему, сюжет, стиль и характеристики персонажей, мы много думали о том, чего ждет читатель от книги.


Рекомендуем почитать
Православный календарь на 2013 год

В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.


Диагностический справочник иммунолога

Данный справочник посвящен важнейшим вопросам современной иммунологии. В нем подробно рассматриваются различные иммунодефицитные состояния и методы их диагностики, все известные на сегодня болезни и расстройства иммунной системы, проблемы вакцинологии, традиционные и нетрадиционные методы лечения иммунной системы. Книга адресована практикующим врачам-иммунологам, а также широкому кругу читателей.


Пенсия: расчет и порядок оформления

Многим гражданам, претендующим на пенсию, порой трудно понять, какой размер пенсии у них должен быть, когда возникает право на нее, куда следует обращаться за назначением пенсии, какие документы необходимо представить для расчета пенсии, как правильно документально оформить трудовой стаж… Ответы на эти и массу других вопросов вы сможете найти в этой книге.Особая ценность издания – в многочисленных примерах, где рассмотрены самые разнообразные варианты расчета и начисления пенсий, и перечне документов, необходимых для оформления всех видов пенсий.Рассчитано на широкий круг читателей.


Каталог «Библиотеки всемирной литературы»

ОТ СОСТАВИТЕЛЕЙ Настоящий справочный том к «Библиотеке всемирной литературы» содержит библиографическое описание томов и алфавитные указатели авторов художественных произведений, переводчиков, художников, авторов вступительных статей и примечаний. В библиографическом описании сведения взяты с титульного листа, выходных данных и содержания томов. При описании антологических томов после общего описания названы авторы и переводчики в том порядке, в каком они даны в томе. Алфавитные указатели отсылают к номерам томов «Библиотеки всемирной литературы», которые указаны в проспекте издания, в выходных данных томов, на клапанах суперобложек и в библиографическом описании настоящего справочного тома.


Хозяйственное право: Шпаргалка

В шпаргалке в краткой и удобной форме приведены ответы на все основные вопросы, предусмотренные государственным образовательным стандартом и учебной программой по дисциплине «Хозяйственное право».Книга позволит быстро получить основные знания по предмету, повторить пройденный материал, а также качественно подготовиться и успешно сдать зачет и экзамен.Рекомендуется всем изучающим и сдающим дисциплину «Хозяйственное право» в высших и средних учебных заведениях.


Молодежный словарь

В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.