Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры

Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры

Насколько велики на самом деле «большие данные» – огромные массивы информации, о которых так много говорят в последнее время? Вот наглядный пример: если выписать в линейку все цифры 0 и 1, из которых состоит один терабайт информации (вполне обычная емкость для современного жесткого диска), то цепочка цифр окажется в 50 раз длиннее, чем расстояние от Земли до Сатурна! И тем не менее, на «большие данные» вполне можно взглянуть в человеческом измерении. Эрец Эйден и Жан-Батист Мишель – лингвисты и компьютерные гении, создатели сервиса Google Ngram Viewer и термина «культуромика», показывают, каким образом анализ «больших данных» помогает исследовать трудные проблемы языка, культуры и истории.

Жанры: Научная литература, Базы данных
Серия: Наука XXI век
Всего страниц: 66
ISBN: 978-5-17-088935-8
Год издания: 2016
Формат: Полный

Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры читать онлайн бесплатно

Шрифт
Интервал

Моему папе, который всегда верил, что я умею считать

– ЭРЕЦ ЭЙДЕН —

Моей семье

– ЖАН-БАТИСТ МИШЕЛЬ —
* * *

Erez Aiden and Jean-Baptiste Michel

Uncharted: Big Data as a Lens on Human Culture


Дизайн обложки: студия OpenDesign

Печатается с разрешения авторов и литературного агентства Brockman, Inc.


Исключительные права на публикацию книги на русском языке принадлежат издательству AST Publishers. Любое использование материала данной книги, полностью или частично, без разрешения правообладателя запрещается.


Фото Эреца Эйдена © Eliza Grinnel

Фото Жана-Батиста Мишеля © Bret Hartman

© Erez Lieberman Aiden and Jean-Baptiste Michel, 2013

© Павел Миронов, перевод, 2014

© Издание на русском языке AST Publishers, 2016

Глава 1

Зазеркалье

Давайте представим, что у нас есть робот, способный прочитать каждую книгу на каждой полке всех крупных библиотек мира. Он может их прочесть невероятно быстро и запомнить каждое прочитанное слово в своей бесперебойно работающей памяти. Чему мы могли бы научиться у такого робота-историка?

Вот вам простой пример, знакомый каждому американцу. В наши дни принято говорить, что южные штаты полны (are full, множественное число) южан. Мы также говорим, что северные штаты полны (are full) северян или что штаты Новой Англии полны (are full) жителями. Однако мы говорим: the United States is full of citizens (то есть «США полон жителей», единственное число). Почему мы используем единственное число? Вопрос лежит не только в области грамматики – это, скорее, вопрос нашей национальной идентичности.

После основания Соединенных Штатов Америки основополагающий документ – Статьи Конфедерации – наделил центральное правительство слабыми полномочиями и описывал новое государство не как национальное объединение, а, скорее, как «дружеский союз» между отдельными государствами, чем-то напоминающий современный Европейский союз. Люди воспринимали себя не гражданами США, а гражданами определенного штата (государства).

И в этом смысле граждане говорили о Соединенных Штатах во множественном числе, что было вполне закономерно для союза различных и в целом независимых государств. Например, в обращении президента Джона Адамса 1799 года говорится о «Соединенных Штатах и их договорах с ее Британским Величеством» (курсив наш. – Э. Э. и Ж.-Б. М.). В наше время для президента США это совершенно немыслимо.

Когда же слова «Мы, народ…» (Конституция США, принятая в 1787 году) стали обозначать «одну нацию» (Клятва верности флагу, включенная в «Кодекс о флаге США» в 1942 году)? [1]

Если бы мы спросили об этом людей-историков, то, возможно, они бы указали нам на самый знаменитый ответ из финала знаменитой книги Джеймса Макферсона по истории гражданской войны – «Боевой клич свободы» [2]:

…Некоторые масштабные последствия войны кажутся очевидными. Были побеждены раскол и рабство, чтобы никогда не возникнуть вновь, даже через полтора столетия после Аппоматокса. Этот итог означал серьезную трансформацию американского общества и изменение государственного устройства, уточнившегося, если не сформировавшегося, в результате войны.

До 1861 года слова «Соединенные Штаты» чаще всего использовались как существительное во множественном числе: the United States are republic («Соединенные Штаты представляют собой республику»). Война привела к тому, что «Соединенные Штаты» стали в английском языке существительным в единственном числе.

Макферсон был не первым, кто выдвинул такое предположение; эта тема обсуждается уже не менее сотни лет. Стоит хотя бы вспомнить выдержку из статьи в газете Washington Post, опубликованной в 1887 году[3]:

Какое-то время, буквально несколько лет назад, о Соединенных Штатах говорилось во множественном числе. Было принято говорить: «Соединенные Штаты имеют» или «Соединенные Штаты являлись». Однако война все изменила. Вопрос грамматики был навсегда решен на линии огня от Чесапика до Сэбин-Пасс. Решение приняли не Уэллс, не Грин, не Линдли Мюррей, а сабли Шеридана, мушкеты Шермана и артиллерия Гранта… Поражение мистера Дэвиса и генерала Ли означало переход от множественного числа к единственному.

Даже через сто лет после того, как была написана эта потрясающая история о языке, артиллерии и приключениях, сложно сдержать волнение. Кто бы мог представить, что люди станут сражаться за грамматику или что «мушкеты Шермана» решат спор о тонкостях словоупотребления?

Но стоит ли этому верить?

Возможно. Джеймс Макферсон – бывший президент Американской исторической ассоциации и настоящая легенда среди историков. Его самая знаменитая работа «Боевой клич свободы» получила Пулитцеровскую премию. Более того, кто бы ни написал в 1887 году статью в Washington Post, Макферсон, вероятнее всего, сам испытал этот синтаксический переворот, и его свидетельству сложно не верить.

Тем не менее Джеймс Макферсон, каким бы великим он ни был, не непогрешим. А свидетели иногда неправильно интерпретируют факты. Можно ли с этим что-то сделать?

Возможно. Давайте предположим, что мы попросили нашего робота – гипотетического робота, прочитавшего все книги из всех библиотек, – поделиться с нами своим механистическим мнением.


Рекомендуем почитать
Деревянное копытце

Повесть-сказка «Деревянное копытце» Петра Африкантова написана для детей младшего подросткового возраста. Она рассказывает ребятам историю их сверстника, Павлика, который очень любит проводить время в деревне, с бабушкой, дедушкой и своим другом Генкой. А еще Павлик любит играть в шахматы.В один прекрасный день наш герой получает в подарок набор шахмат, которые дедушка сделал своими руками. Удивлению Павлика нет предела, когда он обнаруживает, что шахматные фигурки из набора не только очень красивые, но еще и… живые! И вот, Павлик уже вовлечен в полномасштабные военные действия, которые проводят Черное и Белое шахматные королевства.


Невероятные приключения Моли и её друзей

Неразлучная троица друзей – собранный детьми их двух разных игрушек Гагагав, плюшевый Медвежонок и их подружка Моль, прожорливая бабочка, обитающая в платяном шкафу – стали главными героями этой весёлой сказочной повести. Они совершенно разные, но связывает их неиссякаемая тяга к головокружительным приключениям. И они смело отправляются сначала в космос за звездой для новогодней ёлки, затем в подземно-подводное царство самовлюблённого и коварного Бульконыра и, наконец, в далёкий и заманчивый Голливуд.


Операция «Людоед»

Майор Службы внешней разведки, спецагент Валерий Колчин неожиданно получает информацию о том, что профессиональные террористы готовят на территории России дикий по своей жестокости теракт, рядом с которым меркнут все прошлые преступления боевиков. Скоро ему становится известен главный исполнитель этой чудовищной акции, некий бывший офицер Российской армии, а ныне преступный авторитет по кличке Стерн. Руководство ФСБ понимает, что на карту поставлена жизнь десятков тысяч ни в чем не повинных людей, но времени на привлечение к операции регулярных частей уже нет.


Темные аллеи славы

Вступительная статья Юрия Комова к книге «Убийства, в которые я влюблен. Маленькие детективы большой Америки рекомендует Альфред Хичкок» рассказывает о жизни и творчестве А. Хичкока.В книге собраны детективные рассказы из разных сборников, которые редактировал А. Хичкок.


На траверзе — Дакар

Послевоенные годы знаменуются решительным наступлением нашего морского рыболовства на открытые, ранее не охваченные промыслом районы Мирового океана. Одним из таких районов стала тропическая Атлантика, прилегающая к берегам Северо-западной Африки, где советские рыбаки в 1958 году впервые подняли свои вымпелы и с успехом приступили к новому для них промыслу замечательной деликатесной рыбы сардины. Но это было не простым делом и потребовало не только напряженного труда рыбаков, но и больших исследований ученых-специалистов.


Историческое образование, наука и историки сибирской периферии в годы сталинизма

Настоящая монография посвящена изучению системы исторического образования и исторической науки в рамках сибирского научно-образовательного комплекса второй половины 1920-х – первой половины 1950-х гг. Период сталинизма в истории нашей страны характеризуется определенной дихотомией. С одной стороны, это время диктатуры коммунистической партии во всех сферах жизни советского общества, политических репрессий и идеологических кампаний. С другой стороны, именно в эти годы были заложены базовые институциональные основы развития исторического образования, исторической науки, принципов взаимоотношения исторического сообщества с государством, которые определили это развитие на десятилетия вперед, в том числе сохранившись во многих чертах и до сегодняшнего времени.


Интеллигенция в поисках идентичности. Достоевский – Толстой

Монография посвящена проблеме самоидентификации русской интеллигенции, рассмотренной в историко-философском и историко-культурном срезах. Логически текст состоит из двух частей. В первой рассмотрено становление интеллигенции, начиная с XVIII века и по сегодняшний день, дана проблематизация важнейших тем и идей; вторая раскрывает своеобразную интеллектуальную, духовную, жизненную оппозицию Ф. М. Достоевского и Л. Н. Толстого по отношению к истории, статусу и судьбе русской интеллигенции. Оба писателя, будучи людьми диаметрально противоположных мировоззренческих взглядов, оказались “versus” интеллигентских приемов мышления, идеологии, базовых ценностей и моделей поведения.


Князь Евгений Николаевич Трубецкой – философ, богослов, христианин

Монография протоиерея Георгия Митрофанова, известного историка, доктора богословия, кандидата философских наук, заведующего кафедрой церковной истории Санкт-Петербургской духовной академии, написана на основе кандидатской диссертации автора «Творчество Е. Н. Трубецкого как опыт философского обоснования религиозного мировоззрения» (2008) и посвящена творчеству в области религиозной философии выдающегося отечественного мыслителя князя Евгения Николаевича Трубецкого (1863-1920). В монографии показано, что Е.


Технологии против Человека. Как мы будем жить, любить и думать в следующие 50 лет?

Эксперты пророчат, что следующие 50 лет будут определяться взаимоотношениями людей и технологий. Грядущие изобретения, несомненно, изменят нашу жизнь, вопрос состоит в том, до какой степени? Чего мы ждем от новых технологий и что хотим получить с их помощью? Как они изменят сферу медиа, экономику, здравоохранение, образование и нашу повседневную жизнь в целом? Ричард Уотсон призывает задуматься о современном обществе и представить, какой мир мы хотим создать в будущем. Он доступно и интересно исследует возможное влияние технологий на все сферы нашей жизни.


Лес. Как устроена лесная экосистема

Что такое, в сущности, лес, откуда у людей с ним такая тесная связь? Для человека это не просто источник сырья или зеленый фитнес-центр – лес может стать местом духовных исканий, служить исцелению и просвещению. Биолог, эколог и журналист Адриане Лохнер рассматривает лес с культурно-исторической и с научной точек зрения. Вы узнаете, как устроена лесная экосистема, познакомитесь с различными типами леса, характеризующимися по составу видов деревьев и по условиям окружающей среды, а также с видами лесопользования и с некоторыми аспектами охраны лесов. «Когда видишь зеленые вершины холмов, которые волнами катятся до горизонта, вдруг охватывает оптимизм.


Сквозь зеркало языка

Книга «Сквозь зеркало языка» – один из главных научно-популярных бестселлеров последних лет. Почему в некоторых культурах синий и зеленый цвета обозначаются одним и тем же словом? Почему Гомер называл море «виноцветным»? Почему коренные жители Австралии вместо «правый» и «левый» говорят «западный» и «восточный»? Как язык определяет образ жизни человека и судьбу народа? Остроумная и блестяще написанная книга одного из самых известных современных лингвистов – настоящий подарок для всех, кто интересуется жизнью языка и разнообразием человеческой культуры.