Основы глубокого обучения - [3]

Шрифт
Интервал

Чтобы интуитивно понимать модели машинного обучения, рассмотрим пример. Допустим, мы решили узнать, как предсказывать результаты экзаменов, если известно количество часов сна и учебы в день перед испытанием. Мы собираем массив данных и при каждом замере х = [x>1 x>2]>T записываем количество часов сна (x>1), учебы (x>2) и отмечаем, выше или ниже они средних по классу. Наша цель — создать модель h(х) с вектором параметров θ = [θ>0 θ>1 θ>2]>T, чтобы:



По нашему предположению, проект модели h(х) будет таким, как описано выше (с геометрической точки зрения он описывает линейный классификатор, делящий плоскость координат надвое). Теперь мы хотим узнать вектор параметров θ, чтобы научить модель делать верные предсказания (−1, если результаты ниже среднего уровня, и 1 — если выше) на основании примерного входного значения x. Такая модель называется линейным персептроном и используется с 1950-х[3]. Предположим, наши данные соответствуют тому, что показано на рис. 1.4.


Рис. 1.4.Образец данных для алгоритма предсказания экзаменов и потенциального классификатора


Оказывается, при θ = [−24 3 4]>T модель машинного обучения способна сделать верное предсказание для каждого замера:



Оптимальный вектор параметров θ устанавливает классификатор так, чтобы можно было сделать как можно больше корректных предсказаний. Обычно есть множество (иногда даже бесконечное) возможных оптимальных вариантов θ. К счастью, в большинстве случаев альтернативы настолько близки, что разницей между ними можно пренебречь. Если это не так, можно собрать больше данных, чтобы сузить выбор θ.

Звучит разумно, но есть много очень серьезных вопросов. Во-первых, откуда берется оптимальное значение вектора параметров θ? Решение этой задачи требует применения метода оптимизации. Оптимизаторы стремятся повысить производительность модели машинного обучения, последовательно изменяя ее параметры, пока погрешность не станет минимальной.

Мы подробнее расскажем об обучении векторов параметров в главе 2, описывая процесс градиентного спуска[4]. Позже мы постараемся найти способы еще больше увеличить эффективность этого процесса.

Во-вторых, очевидно, что эта модель (линейного персептрона) имеет ограниченный потенциал обучения. Например, случаи распределения данных на рис. 1.5 нельзя удобно описать с помощью линейного персептрона.


Рис. 1.5.По мере того как данные принимают более комплексные формы, нам становятся необходимы более сложные модели для их описания


Но эти ситуации — верхушка айсберга. Когда мы переходим к более комплексным проблемам — распознаванию объектов или анализу текста, — данные приобретают очень много измерений, а отношения, которые мы хотим описать, становятся крайне нелинейными. Чтобы отразить это, в последнее время специалисты по машинному обучению стали строить модели, напоминающие структуры нашего мозга. Именно в этой области, обычно называемой глубоким обучением, ученые добились впечатляющих успехов в решении проблем компьютерного зрения и обработки естественного языка. Их алгоритмы не только значительно превосходят все остальные, но даже соперничают по точности с достижениями человека, а то и превосходят их.

Нейрон

Нейрон — основная единица мозга. Небольшой его фрагмент, размером примерно с рисовое зернышко, содержит более 10 тысяч нейронов, каждый из которых в среднем формирует около 6000 связей с другими такими клетками[5]. Именно эта громоздкая биологическая сеть позволяет нам воспринимать мир вокруг. В этом разделе наша задача — воспользоваться естественной структурой для создания моделей машинного обучения, которые решают задачи аналогично. По сути, нейрон оптимизирован для получения информации от «коллег», ее уникальной обработки и пересылки результатов в другие клетки. Процесс отражен на рис. 1.6. Нейрон получает входную информацию по дендритам — структурам, напоминающим антенны. Каждая из входящих связей динамически усиливается или ослабляется на основании частоты использования (так мы учимся новому!), и сила соединений определяет вклад входящего элемента информации в то, что нейрон выдаст на выходе. Входные данные оцениваются на основе этой силы и объединяются в клеточном теле. Результат трансформируется в новый сигнал, который распространяется по клеточному аксону к другим нейронам.


Рис. 1.6.Функциональное описание биологической структуры нейрона


Мы можем преобразовать функциональное понимание работы нейронов в нашем мозге в искусственную модель на компьютере. Последняя описана на рис. 1.7, где применен подход, впервые введенный в 1943 году Уорреном Маккаллоу и Уолтером Питтсом[6]. Как и биологические нейроны, искусственный получает некоторый объем входных данных — x>1x>2, …, x>n, каждый элемент которых умножается на определенное значение веса — w>1w>2, …, w>n. Эти значения, как и раньше, суммируются, давая логит нейрона:

. Часто он включает также смещение (константа, здесь не показана). Логит проходит через функцию активации f, образуя выходное значение y = f(z). Это значение может быть передано в другие нейроны.


Рис. 1.7.Схема работы нейрона в искусственной нейросети


Рекомендуем почитать
Политическая экономия Николая Зибера. Антология

Николай Иванович Зибер (1844–1888) ― популяризатор Рикардо и Маркса, ставший марксистом еще до появления марксизма, знаток первобытной экономической культуры, предвосхитивший экономическую антропологию, критик маржинализма до его триумфа. В антологии представлены тексты разных лет о биографии и теоретическом наследии Зибера, опубликованы редкие архивные материалы и письма. Составители антологии выражают надежду, что сборник сформирует базу, на основе которой возможно по-новому оценить вклад Зибера в политическую экономию, марксизм, экономическую антропологию, а также быстрее и четче реконструировать различные контексты той эпохи.


Доллар всемогущий

Вы никогда не задумывались, почему мы можем позволить себе гораздо больше одежды, чем наши деды, но не дом, в котором ее хранить? Почему цена бензина может удвоиться за несколько месяцев, а падает гораздо медленнее? Почему правительства тех или иных стран игнорируют одни ужасные конфликты, происходящие на планете, но не стесняются вмешиваться в другие? За всем этим стоит экономика. Даршини Дэвид предлагает нам проследить за путешествием по земному шару одного доллара. Сегодня экономика США составляет меньше четверти мировой, но 87% сделок, заключаемых в иностранной валюте, совершаются именно в американской валюте – в долларах.


Капитал. Полная квинтэссенция 3-х томов

«Капитал» – главный труд немецкого экономиста и политического деятеля Карла Маркса, несомненно, оказавший влияние на мировую историю. Данное издание – это основные положения и идеи содержащиеся в «Капитале», обработанные немецким экономистом и политиком Ю. Борхардтом. Как отмечает сам Борхардт, ему «удалось передать теорию учения в правильной форме», что «дает ключ непосвященному или новичку к ее пониманию». Книга будет интересна как специалистам, так и всем интересующимся вопросами социально-экономических теорий.


Экономический кризис и перспективы развития капитализма

Вопреки дифирамбам французских энциклопедистов, а также мнению многих деятелей науки и культуры, живших в разные времена и считающих человека венцом творения, homo sapiens сам по себе не является идеальным и, к сожалению, все больше отдаляется от библейских стандартов. В наше время охваченные страстью потребительства люди далеко не всегда сознают, что творят. Ведь и современный кризис, как известно, стал следствием циничного прагматизма, а точнее, превысившей все пределы элементарной человеческой жадности руководителей банковских корпораций, которые в погоне за прибылью безответственно предоставили кредиты неспособным к их оплате потребителям.


Падение титанов. Сага о ««Форде», «Крайслере», «Дженерал моторс» и упущенных возможностях

Захватывающая история о рождении и гибели американской автопромышленности: о гордыне, упущенных возможностях, недооценке японских производителей и вкусов граждан, несостоятельности корпоративной культуры. Чем история заканчивается? Для спасения легендарных брендов Обама вынул из карманов американских налогоплательщиков 100 миллиардов долларов — этой суммы хватило бы, чтобы купить все седаны и пикапы, имевшиеся на американском рынке в первой половине 2009 года.Лауреат Пулитцеровской премии Пол Инграссия пишет увлекательную историю о людях, идеях, ошибочных и гениальных решениях, драматизме профсоюзной политики.


Непубличный аспект кризиса демократии

В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.


Суперобучение

Скотт Янг, изучив результаты последних исследований и опыт выдающихся личностей, нашел те методы обучения, которые дают максимальный эффект: позволяют лучше понять и запомнить информацию, а также раскрыть новые таланты. Он сформулировал девять принципов быстрого самообразования, позволяющие осваивать сложные навыки, получать необходимые знания, максимизировать конкурентные преимущества и выстраивать карьеру. Эти принципы пригодятся всем, кто хочет научиться чему-либо самостоятельно: овладеть языком (или несколькими языками), получить новую профессию или освоить несколько инструментов для создания продукта или бизнеса с нуля. На русском языке публикуется впервые.


Думай о смысле. Будни переводчика IT-текстов

Иван Чаплыгин рассказывает о сложных отношениях внутри пары автор – переводчик. Он позволит заглянуть на переводческую кухню и буквально на пальцах покажет, чем хороший перевод отличается от посредственного и откровенно плохого. Иван расскажет о чувстве слова, неоправданной русификации и переводческих головоломках. О заслуженной критике и необоснованных придирках. А еще о конкуренции среди переводчиков, о поиске заказчиков и об удовольствии от работы. Эта книга поможет вам понять, как находить суть в мутной воде авторского высказывания и как передавать смысл, не искажая оригинал и не привнося в него собственное звучание.


Никаких правил. Уникальная культура Netflix

Книга о корпоративной культуре Netflix, которая построена вокруг свободы и ответственности. Именно культура позволила компании вырасти из небольшой фирмы по прокату DVD в гиганта развлекательной индустрии.


Принципы изменения мирового порядка

Рэй Далио, успешный инвестор и один из самых влиятельных людей планеты, основатель компании Bridgewater, исследует империи прошлого, выявляет закономерности взлетов и падений ведущих мировых экономик и делает выводы относительно настоящего и будущего в сфере макроэкономики и геополитики.