Максимальный репост. Как соцсети заставляют нас верить фейковым новостям - [44]

Шрифт
Интервал

Откуда алгоритм знает, какую характеристику оценить в 500 баллов, а какую – всего в 10? Он начинает раздавать баллы наобум и потом уточняет их раз за разом на каждом примере, для которого известен правильный ответ, – это и есть обучение. Так выясняется, какие признаки важные, какие нет. Например, класс каюты: в первом выжили 63 % пассажиров, в третьем – всего 24 %. Или пол пассажира «Титаника»: среди женщин из списка – 74 % выживших, среди мужчин – всего 19 %.

В случае с записями в Facebook, про которые алгоритму надо ответить «показывать / не показывать», есть еще один небесполезный источник информации – это слова, из которых составлена запись. Если модель знает, что вы любите читать про ракеты, Марс и Илона Маска, то за каждое из этих слов выдаст много баллов, и случайные знакомые, делами которых вы не интересовались последние пять лет, имеют шанс пробиться к вам во френд-ленту со своими рассуждениями про запуск автомобиля в космос.


Рис. 8. Нейросети шестьдесят лет назад: американский математик Фрэнк Розенблатт придумал алгоритм под названием «персептрон» (его назвали бы однослойной нейросетью – или, что то же самое, линейной моделью) и построил способную обучаться вычислительную машину Mark I, не похожую на все остальные компьютеры. «Баллы» за каждый признак были реализованы в виде вращающихся стержней-резисторов, каждый из которых в процессе обучения подкручивал свой электромотор: чем сильнее стержень выкручен – тем больше баллов полагается за каждый признак


К чему простые и быстрые алгоритмы безнадежно глухи – так это к интонации и стилю. Они не отличают стихов от прозы. Скрытые цитаты и сарказм за пределами их понимания, потому что для простой модели ваша запись – мешок слов (у специалистов по машинному обучению это устоявшийся термин): слова либо есть, либо нет, а в каком порядке идут и что означают вместе, уже неважно. И если вы из чувства возмущения приводите кусок чужой прямой речи, который вас задел, и как угодно его комментируете – вас запросто заблокируют за оскорбительный контент.

Еще простые линейные модели не умеют видеть смысл в комбинациях признаков. Если на «Титанике» выжили все мужчины из второго класса, которые сели на лайнер в Саутгемптоне (потому что, скажем, всех их разместили в удачных каютах рядом со спасательной шлюпкой), то модель выдаст только скромную порцию баллов за Саутгемптон и за второй класс, а более тонких закономерностей не увидит – и ошибется в прогнозе.

Консилиум врачей: решающие деревья

Ситуация: врач скорой зашел в дом и, чтобы решить, надо ли везти пациента в больницу, начинает с вопроса «на что жалуемся?». С точки зрения математики это по-прежнему все та же задача про «Титаник»: есть люди, у них много характеристик (медики называют их словом «симптомы»), и в конце нужно ответить «да» или «нет».

Сценарии диалога врача с больным можно нарисовать в форме ветвящегося дерева: каждый следующий вопрос зависит от ответа на предыдущий. Если у пациента болит горло, надо спросить про температуру. Если хватается за сердце – проверить пульс.

Такие ветвящиеся деревья в мире алгоритмов – проверенный способ искать и находить то, что вам нужно, в огромных множествах. В 2007 году появилась интернет-игра «Акинатор», где ее главный персонаж – одноименный джин – предлагал угадать какого угодно персонажа (реального человека, героя мультфильма, историческую личность) за 15–20 вопросов, на которые можно ответить «да», «нет» или «не знаю». «Ваш персонаж существовал в реальности?» «Ваш персонаж женского пола?» «Ваш персонаж старше сорока лет?» «Ваш персонаж умер?» «У вашего персонажа больше одной головы?»

Каждый правильно заданный вопрос сужает поле вариантов – миллионы имен, упомянутых в кино и книгах, – примерно вдвое, следующий – еще вдвое, пока в итоге, на конце одной из ветвей дерева поиска, не остается один наиболее реальный кандидат. На десятом или двадцатом ходу (как повезет) Акинатор выдает ответ: царь обезьян Хануман, Емельян Пугачев, Человек-Паук. Хотя иногда и промахивается – вместо контрреволюционера и живого монгольского бога барона Унгерна предлагает революционера Григория Котовского.

Дерево решений в голове у врача точно так же позволяет проделать путь от общей ситуации к конкретной гипотезе. Подозрение на инфаркт: надо срочно вызывать скорую. Подозрение на ОРЗ: пусть пациент сидит дома и пьет чай под одеялом.

Все просто, когда правильные вопросы уже известны. Но сначала есть только десятки или сотни признаков в случайном порядке: пульс, давление, температура, диаметр зрачка, бледность кожи, громкость кашля, хрипы в груди или их отсутствие – и вопросы нужно научиться задавать в единственно верной последовательности.

Простой выход из положения: созвать консилиум из многих врачей, пусть даже мегаэрудированного доктора Хауса среди них и нет. Каждый врач знает все про три-четыре случайных симптома и делает все выводы только на их основе. Потом врачи голосуют, и консилиум записывает мнение большинства. Если, скажем, шесть из десяти говорят «везти в больницу» – больного везут в больницу. В машинном обучении это называют «ансамбль случайных деревьев».


Еще от автора Борислав Козловский
Штурм мозга

Интернет влияет на базовые параметры нашего восприятия реальности. Сеть переполнила мозг современного человека сильнее, чем вся прежняя культура — мозг первобытного бушмена. Что именно изменилось у нас в голове с появлением браузера?Написал Борислав Козловский, корреспондент отдела науки журнала «Русский репортер».Консультировали Татьяна Черниговская, нейробиолог, профессор СПбГУ; Илья Колмановский, редактор блога «Наука» сайта snob.ru.


Рекомендуем почитать
Инстинкт и бессознательное

В предлагаемой работе Юнг дает психологическое описание инстинктивной деятельности, увязывает инстинкты с концепцией бессознательного, а также настойчиво подчеркивает некорректность рациональных мотиваций инстинктивных поступков.


Поверженный разум. Теория и практика глупости

Автор „Поверженного разума“ — известный испанский писатель, философ и психолог Хосе Антонио Марина, лауреат многих престижных наград, в том числе Национальной премии за лучшую научно-популярную книгу. Все его работы посвящены человеку — его силе и слабостям, возможностям и месту в социуме. Исследование человеческого разума для Марины — ключ к пониманию целого круга проблем, с которыми сталкивается личность в современном мире. Какие ошибки чаще всего совершает наш разум? Почему мы порой ведем себя откровенно глупо? Если существует научная теория разума, то и глупость заслуживает не менее глубокого изучения.


Как стать любимой и желанной

Откуда берутся Антиневесты? Почему так трудно привлечь мужчину и выйти замуж? Почему девушки, мечтая о Завидном женихе, довольствуются обычным балбесом? Почему мужчины одних женщин любят, а о других вытирают ноги? Как перестать гадать бросит – не бросит и взять под контроль отношения с мужчиной в свои хрупкие руки и расчетливый ум? Как манипулировать женихом, чтобы он стал мужем? Как повысить планку требований к мужчинам? Как обрести целеустремленность, стать обаятельной и удачно выйти замуж? Как стать хозяйкой своей жизни? Обо всем этом ты узнаешь, прочитав и воспользовавшись рекомендациями данной книги.


Женская консультация девяностых годов глазами психотерапевта

Рассказать о работе врача-психотерапевта можно по-всякому. Но имеет практический смысл рассказ без вранья. Как это, если оба слова, по Михаилу Задорнову, имеют общий корень?В этой «шутке» лишь доля шутки. На мой взгляд, рассказать честно — это, прежде всего, последовательно, по этапам совершенствования психотерапевтической помощи, чтобы читатель, погружаясь в многослойную почву терапии, мог оценить значимость составляющих опоры здания здоровья и болезни.Рассказать так, чтобы выводы, даже и положительные, не оказались лишь средством заурядной рекламы или пропаганды, а негативные не походили на оговор или самооговор.


Стратегия разума и успеха

О чем эта книга:О смысле жизни.Во что верить и где её (веру) искать.О людях феноменальной силы, ума, воли.Вся, правда, о ясновидцах, экстрасенсах...О том, как нами манипулируют и обманывают.Как жить, не болея и оставаться работоспособным до старости.Что такое секс и любовь.О ложных и истинных жизненных целях.О экологически чистом сельском хозяйстве.Что такое «Национальная идея»?Об образовании и воспитании.Об экологии и экономике и о многом другом здесь написано простым и понятным языком. Книга рассчитана на широкий круг читателей.


Взрослые дети, или Инструкция для родителей

Подростковый возраст — самый трудный, считают многие родители. Однако подростковый возраст проходит, а трудности в общении с детьми только нарастают. Почему? У молодых людей наступает период самореализации, когда родители часто оказываются "не в теме", и повзрослевшим детям кажется невозможным объяснить «замшелым предкам» свои проблемы. Старшие удивляются нахальству и агрессивности младших, а младшие обвиняют старших в "твердолобости". Конфликт — налицо! Как не превратить этот конфликт в затяжную войну между поколениями и правильно выстроить отношения с повзрослевшими детьми, вы узнаете из этой книги.