Основы глубокого обучения - [5]

Шрифт
Интервал

4. Входные и выходные данные — векторные представления. Например, можно изобразить нейросеть, в которой входные данные и конкретные пиксельные значения картинки в режиме RGB представлены в виде вектора (см. рис. 1.3). Последний слой может иметь два нейрона, которые соотносятся с ответом на задачу: [1, 0], если на картинке собака; [0, 1], если кошка; [1, 1], если есть оба животных; [0, 0], если нет ни одного из них.

Заметим, что, как и нейрон, можно математически выразить нейросеть как серию операций с векторами и матрицами. Пусть входные значение i-го слоя сети — вектор x = [x>1x>2x>n]. Нам надо найти вектор y = [y>1 y>2 … y>m], образованный распространением входных данных по нейронам. Мы можем выразить это как простое умножение матрицы, создав матрицу весов размера n × m и вектор смещения размера m. Каждый столбец будет соответствовать нейрону, причем j-й элемент сопоставлен весу соединения с j-м входящим элементом. Иными словами, y = ƒ(W>Tx + b), где функция активации применяется к вектору поэлементно. Эта новая формулировка очень пригодится, когда мы начнем реализовывать эти сети в программах.

Линейные нейроны и их ограничения

Большинство типов нейронов определяются функцией активации f, примененной к логиту logit z. Сначала рассмотрим слои нейронов, которые используют линейную функцию f(z) = az + b. Например, нейрон, который пытается подсчитать стоимость блюда в кафе быстрого обслуживания, будет линейным, a = 1 и b = 0. Используя f(z) = z и веса, эквивалентные стоимости каждого блюда, программа присвоит линейному нейрону на рис. 1.10 определенную тройку из бургеров, картошки и газировки, и он выдаст цену их сочетания.


Рис. 1.10.Пример линейного нейрона


Вычисления с линейными нейронами просты, но имеют серьезные ограничения. Несложно доказать, что любая нейросеть с прямым распространением сигнала, состоящая только из таких нейронов, может быть представлена как сеть без скрытых слоев. Это проблема: как мы уже говорили, именно скрытые слои позволяют узнавать важные свойства входных данных. Чтобы научиться понимать сложные отношения, нужно использовать нейроны с определенного рода нелинейностью.

Нейроны с сигмоидой, гиперболическим тангенсом и усеченные линейные

На практике для вычислений применяются три типа нелинейных нейронов. Первый называется сигмоидным и использует функцию:



Интуитивно это означает, что, если логит очень мал, выходные данные логистического нейрона близки к 0. Если логит очень велик — то к 1. Между этими двумя экстремумами нейрон принимает форму буквы S, как на рис. 1.11.


Рис. 1.11.Выходные данные сигмоидного нейрона с переменной z


Нейроны гиперболического тангенса (tanh-нейроны) используют похожую S-образную нелинейность, но исходящие значения варьируют не от 0 до 1, а от −1 до 1. Формула для них предсказуемая: f(z) = tanh(z). Отношения между входным значением y и логитом z показаны на рис. 1.12. Когда используются S-образные нелинейности, часто предпочитают tanh-нейроны, а не сигмоидные, поскольку у tanh-нейронов центр находится в 0.


Рис. 1.12.Выходные данные tanh-нейрона с переменной z


Еще один тип нелинейности используется нейроном с усеченным линейным преобразованием (ReLU). Здесь задействована функция f(z) = max(0, z), и ее график имеет форму хоккейной клюшки (рис. 1.13).


Рис. 1.13.Выходные данные ReLU-нейрона с переменной z


ReLU в последнее время часто выбирается для выполнения многих задач (особенно в системах компьютерного зрения) по ряду причин, несмотря на свои недостатки[8]. Этот вопрос мы рассмотрим в главе 5 вместе со стратегиями борьбы с потенциальными проблемами.

Выходные слои с функцией мягкого максимума

Часто нужно, чтобы выходной вектор был распределением вероятностей по набору взаимоисключающих значений. Допустим, нам нужно создать нейросеть для распознавания рукописных цифр из набора данных MNIST. Каждое значение (от 0 до 9) исключает остальные, но маловероятно, чтобы нам удалось распознать цифры со стопроцентной точностью. Распределение вероятностей поможет понять, насколько мы уверены в своих выводах. Желаемый выходной вектор приобретает такую форму, где

:

[p>0 p>1p>2 p>3p>9].

Для этого используется особый выходной слой, именуемый слоем с мягким максимумом (softmax). В отличие от других типов, выходные данные нейрона в слое с мягким максимумом зависят от выходных данных всех остальных нейронов в нем. Нам нужно, чтобы сумма всех выходных значений равнялась 1. Приняв z>i как логит i-го нейрона с мягким максимумом, мы можем достичь следующей нормализации, задав выходные значения:



При сильном предсказании одно из значений вектора будет близко к 1, остальные — к 0. При слабом останется несколько возможных значений, каждое из которых характеризуется своим уровнем вероятности.

Резюме

В этой главе мы дали базовые представления о машинном обучении и нейросетях. Мы рассказали о структуре нейрона, работе нейросетей с прямым распространением сигнала и важности нелинейности в решении сложных задач обучения. В следующей главе мы начнем создавать математический фундамент для обучения нейросети решению задач. Например, мы поговорим о нахождении оптимальных векторов параметров, лучших методов обучения нейросетей и основных проблемах. В последующих главах мы будем применять эти основополагающие идеи к более специализированным вариантам архитектуры нейросетей.


Рекомендуем почитать
Политическая экономия Николая Зибера. Антология

Николай Иванович Зибер (1844–1888) ― популяризатор Рикардо и Маркса, ставший марксистом еще до появления марксизма, знаток первобытной экономической культуры, предвосхитивший экономическую антропологию, критик маржинализма до его триумфа. В антологии представлены тексты разных лет о биографии и теоретическом наследии Зибера, опубликованы редкие архивные материалы и письма. Составители антологии выражают надежду, что сборник сформирует базу, на основе которой возможно по-новому оценить вклад Зибера в политическую экономию, марксизм, экономическую антропологию, а также быстрее и четче реконструировать различные контексты той эпохи.


Доллар всемогущий

Вы никогда не задумывались, почему мы можем позволить себе гораздо больше одежды, чем наши деды, но не дом, в котором ее хранить? Почему цена бензина может удвоиться за несколько месяцев, а падает гораздо медленнее? Почему правительства тех или иных стран игнорируют одни ужасные конфликты, происходящие на планете, но не стесняются вмешиваться в другие? За всем этим стоит экономика. Даршини Дэвид предлагает нам проследить за путешествием по земному шару одного доллара. Сегодня экономика США составляет меньше четверти мировой, но 87% сделок, заключаемых в иностранной валюте, совершаются именно в американской валюте – в долларах.


Капитал. Полная квинтэссенция 3-х томов

«Капитал» – главный труд немецкого экономиста и политического деятеля Карла Маркса, несомненно, оказавший влияние на мировую историю. Данное издание – это основные положения и идеи содержащиеся в «Капитале», обработанные немецким экономистом и политиком Ю. Борхардтом. Как отмечает сам Борхардт, ему «удалось передать теорию учения в правильной форме», что «дает ключ непосвященному или новичку к ее пониманию». Книга будет интересна как специалистам, так и всем интересующимся вопросами социально-экономических теорий.


Экономический кризис и перспективы развития капитализма

Вопреки дифирамбам французских энциклопедистов, а также мнению многих деятелей науки и культуры, живших в разные времена и считающих человека венцом творения, homo sapiens сам по себе не является идеальным и, к сожалению, все больше отдаляется от библейских стандартов. В наше время охваченные страстью потребительства люди далеко не всегда сознают, что творят. Ведь и современный кризис, как известно, стал следствием циничного прагматизма, а точнее, превысившей все пределы элементарной человеческой жадности руководителей банковских корпораций, которые в погоне за прибылью безответственно предоставили кредиты неспособным к их оплате потребителям.


Падение титанов. Сага о ««Форде», «Крайслере», «Дженерал моторс» и упущенных возможностях

Захватывающая история о рождении и гибели американской автопромышленности: о гордыне, упущенных возможностях, недооценке японских производителей и вкусов граждан, несостоятельности корпоративной культуры. Чем история заканчивается? Для спасения легендарных брендов Обама вынул из карманов американских налогоплательщиков 100 миллиардов долларов — этой суммы хватило бы, чтобы купить все седаны и пикапы, имевшиеся на американском рынке в первой половине 2009 года.Лауреат Пулитцеровской премии Пол Инграссия пишет увлекательную историю о людях, идеях, ошибочных и гениальных решениях, драматизме профсоюзной политики.


Непубличный аспект кризиса демократии

В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.


Суперобучение

Скотт Янг, изучив результаты последних исследований и опыт выдающихся личностей, нашел те методы обучения, которые дают максимальный эффект: позволяют лучше понять и запомнить информацию, а также раскрыть новые таланты. Он сформулировал девять принципов быстрого самообразования, позволяющие осваивать сложные навыки, получать необходимые знания, максимизировать конкурентные преимущества и выстраивать карьеру. Эти принципы пригодятся всем, кто хочет научиться чему-либо самостоятельно: овладеть языком (или несколькими языками), получить новую профессию или освоить несколько инструментов для создания продукта или бизнеса с нуля. На русском языке публикуется впервые.


Думай о смысле. Будни переводчика IT-текстов

Иван Чаплыгин рассказывает о сложных отношениях внутри пары автор – переводчик. Он позволит заглянуть на переводческую кухню и буквально на пальцах покажет, чем хороший перевод отличается от посредственного и откровенно плохого. Иван расскажет о чувстве слова, неоправданной русификации и переводческих головоломках. О заслуженной критике и необоснованных придирках. А еще о конкуренции среди переводчиков, о поиске заказчиков и об удовольствии от работы. Эта книга поможет вам понять, как находить суть в мутной воде авторского высказывания и как передавать смысл, не искажая оригинал и не привнося в него собственное звучание.


Никаких правил. Уникальная культура Netflix

Книга о корпоративной культуре Netflix, которая построена вокруг свободы и ответственности. Именно культура позволила компании вырасти из небольшой фирмы по прокату DVD в гиганта развлекательной индустрии.


Принципы изменения мирового порядка

Рэй Далио, успешный инвестор и один из самых влиятельных людей планеты, основатель компании Bridgewater, исследует империи прошлого, выявляет закономерности взлетов и падений ведущих мировых экономик и делает выводы относительно настоящего и будущего в сфере макроэкономики и геополитики.