Верховный алгоритм - [11]

Шрифт
Интервал



Турбоускорение для научного метода

Машинное обучение — все равно что научный метод с допингом. Оно следует той же схеме обобщения, проверки, исключения и уточнения гипотез, однако ученый может за свою жизнь придумать и протестировать несколько сотен предположений, а система машинного обучения проделает то же самое в долю секунды. Машинное обучение ставит открытия на поток, поэтому неудивительно, что в науке оно производит революцию, во многом подобную революции в бизнесе.

Чтобы развиваться, любая область науки нуждается в данных, соизмеримых по сложности с явлениями, которые она изучает. Именно поэтому физика первой пошла вперед: записей Тихо Браге о положении планет и наблюдений Галилея за маятником и наклонными плос­костями оказалось достаточно, чтобы сформулировать законы Ньютона. По той же причине молекулярная биология обогнала более старую нейробиологию: ДНК-микрочипы и высокоэффективное секвенирование дают столько данных, сколько нейробиологам и не снилось. Социальные науки находятся в этом отношении в невыгодном положении: с выборкой всего лишь в сотню человек по десятку измерений на каждого смоделировать получается лишь очень узкие явления. Но даже такие небольшие фено­мены не существуют в изоляции: на них влияют мириады факторов, а это значит, что ученые очень далеки от того, чтобы их понять.

Хорошая новость: сегодня даже науки, некогда оперировавшие небольшими объемами информации, получили приток данных. Вместо того чтобы платить 50 студентам, которые будут клевать носом в лаборатории психолога, можно получить сколько угодно испытуемых, дав задание краудсорсинговой площадке Amazon Mechanical Turk (к тому же выборка окажется более разнообразной). Сейчас уже не все помнят, как немногим более десятилетия назад социологи, изучавшие социальные сети, жаловались, что не могут найти такую сеть, в которой было бы больше нескольких сотен участников. Теперь в их распоряжении весь Facebook, где больше миллиарда пользователей рассказывают о своей жизни во всех подробностях — чем не прямая трансляция общественной жизни на планете Земля? Коннектомика10 и функциональная магнитно-резонансная томография распахнули перед нейробиологами окно, через которое прекрасно виден головной мозг. В молекулярной биологии экспоненциально растут базы данных генов и белков. Даже «старые» дисцип­лины, например физика и астрономия, не стоят на месте благодаря потокам данных, льющимся из ускорителей частиц и цифрового исследования неба.

Однако от больших данных нет пользы, если их нельзя превратить в знание, и в мире слишком мало ученых, чтобы справиться с этой задачей. В свое время Эдвин Хаббл11 открывал новые галактики, скрупулезно изучая фотографические пластинки, но можно ручаться, что таким способом не получилось бы найти полмиллиарда небесных тел, которые нам подарил проект Digital Sky Survey, — это было бы подобно ручному подсчету песчинок на пляже. Конечно, можно вручную написать правила, чтобы отличить галактики от звезд и шумов (например, птиц, самолетов или пролетающего мимо Супермена), но они будут не очень точными. Поэтому в проекте SKICAT, посвященном анализу и каталогизации изображений неба, был применен обучающийся алгоритм. Получив пластинки, где объектам уже были присвоены правильные категории, он разобрался, что характеризует каждую из них, а затем применил результаты ко всем необозначенным пластинкам. Эффективность превзошла все ожидания: алгоритм сумел классифицировать объекты настолько слабые, что человек не смог бы их выявить, и таких оказалось больше всего.

Благодаря большим данным и машинному обучению можно понять намного более сложные феномены, чем до появления этих факторов. В большинстве дисциплин ученые традиционно пользовались только очень скромными моделями, например линейной регрессией, где кривая, подобранная к данным, — всегда прямая линия. К сожалению (а может, и к счастью, потому что иначе жизнь была бы очень скучной — вообще говоря, никакой жизни бы и не было), большинство феноменов в мире нелинейны, и машинное обучение открывает перед нами огромный мир нелинейных моделей: это все равно что включить свет в комнате, которую до того освещала лишь Луна.

В биологии алгоритмы машинного обучения разбираются, где в молекуле ДНК расположены гены, какие фрагменты РНК вырезают при сплайсинге12 перед синтезом белка, как белки принимают характерную для них форму и как заболевания влияют на экспрессию разных генов. Вместо того чтобы тестировать в лаборатории тысячи новых лекарств, обучающийся алгоритм спрогнозирует, будут ли они эффективны, и допустит до этапа тестирования только самые перспективные. Алгоритмы будут отсеивать молекулы, которые, скорее всего, вызовут неприятные побочные эффекты, например рак. Это позволит избежать дорогих ошибок, к примеру, когда лекарство запрещают только после начала испытаний на человеке.

Однако самый большой вызов — это собрать всю эту информацию в единое целое. Какие факторы усугубляют риск сердечных заболеваний и как они между собой взаимодействуют? Все, что было нужно Ньютону, — это три закона движения и один гравитации, однако одиночке открыть полную модель клетки, организма и общества не под силу. По мере роста объема знаний ученые все больше специализируются на какой-то области, но никто не способен собрать все части воедино, потому что элементов просто слишком много. Они сотрудничают друг с другом, но язык — очень медленное средство общения. Ученые пытаются быть в курсе других исследований, однако объем публикаций настолько велик, что они все больше и больше отстают, и зачастую повторить эксперимент проще, чем найти статью, в которой он описан. Машинное обучение и здесь приходит на помощь: оно просеивает литературу в поисках соответствующей информации, переводит специальный язык одной дисциплины на язык другой и даже находит связи, о которых ученые и не подозревали. Машинное обучение все больше напоминает гигантский хаб13, через который методики моделирования, изобретенные в одной области, пробиваются в другие.


Рекомендуем почитать
Человек в поисках себя. Очерки антропологических и этических учений. Том 1. Античность и Средневековье

Работа представляет комплексный анализ антропологических и этических учений с древнейших времен до современности в их взаимозависимости и взаимовлиянии. Адресуется студентам и аспирантам гуманитарных вузов, а также широкому кругу читателей.


Похитители счастья. Как справиться с депрессией

Депрессивные расстройства – это воры, отбирающие у людей счастье. Они крадут уверенность в себе, энергию и интерес к жизни. Депрессия – это потеря способности радоваться и испытывать счастье. А еще депрессия – это утрата умения печалиться. Она безжалостно атакует самовосприятие. Депрессия – это сумрачные дни и бесконечные ночи. В последние годы появилось много полезной информации о том, как можно преодолеть депрессию. Книга «Похитители счастья» написана для всех, кто нуждается в такой информации: для тех, у кого бывают периоды депрессии, для их родственников и друзей, для врачей.


Пурпурный. Как один человек изобрел цвет, изменивший мир

Это история об Уильяме Перкине, который случайно изобрел пурпурный цвет. И навсегда изменил мир вокруг себя. До 1856 года красители были исключительно натуральными – их получали из насекомых, моллюсков, корней и листьев, а искусственное окрашивание было кропотливым и дорогим. Но в 1856 году все изменилось. Английский химик, работая над лекарством от малярии в своей домашней лаборатории, случайно открыл способ массового производства красителей на фабриках. Этот эксперимент – или даже ошибка – произвел революцию в моде, химии и промышленности. Эта книга – удивительный рассказ о том, как иногда даже самая маленькая вещь может менять и иметь такое продолжительное и важное воздействие. В формате PDF A4 сохранён издательский дизайн.


Высшая духовная школа. Проблемы и реформы. Вторая половина XIX в.

Монография посвящена истории высших учебных заведений Русской Православной Церкви – Санкт-Петербургской, Московской, Киевской и Казанской духовных академий – в один из важных и сложных периодов их развития, во второй половине XIX в. В работе исследованы организационное устройство духовных академий, их отношения с высшей и епархиальной церковной властью; состав, положение и деятельность профессорско-преподавательских и студенческих корпораций; основные направления деятельности духовных академий. Особое внимание уделено анализу учебной и научной деятельности академий, проблем, возникающих в этой деятельности, и попыток их решения.


Яды на Земле. В природе и жизни людей

Смертельные яды, порой несущие смерть человеку, на нашей планете встречаются довольно часто. Причем не только в неживой и живой природе, но и в человеческом обществе. Ядовитые соединения находятся в вулканических выбросах, в некоторых пещерах и водоемах. Многие растения и животные тоже синтезируют различные токсические вещества, которые используют в качестве защиты от своих врагов. Нередко эти яды опасны и для человека. Люди тоже издавна применяют ядовитые вещества. Причем в самых разных целях: и как средство для лечения различных заболеваний, и как смертельное и невидимое оружие в борьбе за политическое влияние и богатство.


Школьное образование и политика британских партий (1870–1997 гг.)

В монографии рассматривается проблема школьного образования в ходе реформ Консервативной, Либеральной и Лейбористской партий с 1870 г. по 1997 г. Охарактеризованы и систематизированы разные типы государственных школ, частных заведений и церковных школ разных конфессий. Повышенное внимание уделено инициативе британских церквей, и в первую очередь государственной Церкви Англии, создавшей основу начального обучения в Англии в XVIII в. и опекавшей специальные заведения для детей с ограниченными возможностями, а также благотворительные женские школы.