Работа с данными в любой сфере

Работа с данными в любой сфере

Что общего у аналитика данных и Шерлока Холмса? Как у Netflix получилось создать 100 %-ный хит – сериал «Карточный домик»? Ответ кроется в правильном использовании данных. Эта книга – практическое руководство и увлекательное путешествие в науку о данных, независимо от того, хотите ли вы использовать анализ данных в своей профессии, собираетесь ли стать аналитиком данных, или уже работаете в этой области. Ее автор, основатель образовательного онлайн-портала и консультант, Кирилл Еременко просто и понятно рассказывает об основных методах, алгоритмах и приемах, которые вам помогут на любом этапе: от сбора данных и их анализа до визуализации полученных результатов. Благодаря «Работе с данными в любой сфере» вы не только узнаете, как данные влияют на нашу жизнь (и как защитить свои данные), но и сможете расширить свои карьерные возможности.

Жанр: Базы данных
Серии: -
Всего страниц: 83
ISBN: 978-5-9614-2652-6
Год издания: 2019
Формат: Полный

Работа с данными в любой сфере читать онлайн бесплатно

Шрифт
Интервал


Переводчик Д. Шалаева

Научный редактор З. Мамедьяров

Редактор Л. Любавина

Главный редактор С. Турко

Руководитель проекта Л. Разживайкина

Корректоры Е. Аксёнова, М. Смирнова

Компьютерная верстка М. Поташкин

Художественное оформление и макет Ю. Буга

Дизайн обложки Ю. Буга


© Kirill Eremenko, 2018

© This translation of Confident Data Skills is published by arrangement with Kogan Page.

© Издание на русском языке, перевод, оформление. ООО «Альпина Паблишер», 2019


Все права защищены. Данная электронная книга предназначена исключительно для частного использования в личных (некоммерческих) целях. Электронная книга, ее части, фрагменты и элементы, включая текст, изображения и иное, не подлежат копированию и любому другому использованию без разрешения правообладателя. В частности, запрещено такое использование, в результате которого электронная книга, ее часть, фрагмент или элемент станут доступными ограниченному или неопределенному кругу лиц, в том числе посредством сети интернет, независимо от того, будет предоставляться доступ за плату или безвозмездно.

Копирование, воспроизведение и иное использование электронной книги, ее частей, фрагментов и элементов, выходящее за пределы частного использования в личных (некоммерческих) целях, без согласия правообладателя является незаконным и влечет уголовную, административную и гражданскую ответственность.

* * *

Моим родителям,

Александру и Елене Еременко,

которые научили меня самому важному в жизни – быть хорошим человеком


Бонус для читателей

Спасибо, что выбрали эту книгу. Вы сделали огромный шаг на пути в науку о данных.

Получите бесплатный доступ к моему курсу A-Z Data Science. Просто зайдите на сайт www.superdatascience.com/bookbonus и используйте пароль datarockstar.

Удачи в анализе данных!

Введение

«Наверное, вы всегда хотели стать аналитиком данных – с самого детства?»

Мне приятно, что меня об этом спрашивают. Да, я люблю свою работу. Я с большим удовольствием обучаю студентов основам науки о данных. И здорово, что люди, похоже, думают, что энтузиазм по отношению к данному предмету возник во мне еще в молодом возрасте. Но это абсолютно не соответствует действительности. Скажем честно, ни один ребенок не мечтает о том, чтобы стать ученым – аналитиком данных. Дети хотят быть космонавтами. Танцорами. Врачами. Пожарными. И если вы грезите о спасении жизней или о полетах в космическом пространстве, вы вряд ли остановите свой выбор на столь приземленном занятии.

Когда люди спрашивают меня, всегда ли я хотел построить карьеру в области науки о данных, я возвращаюсь к своему детству и вижу маленького русского мальчика, выросшего в Зимбабве. Запах тлеющих углей, брачные вопли африканских красных жаб, незабываемый уют зимнего вечера, кончики пальцев, переворачивающие страницу за страницей сборника историй для детей, – это фрагменты воспоминаний о множестве прекрасных вечеров, когда я слушал русские сказки, которые читала мне мама.

Моя мать хотела, чтобы я, мои братья и сестры любили Зимбабве, но она также заботилась о том, чтобы мы знали свои культурные корни. Она подумала, как наилучшим образом передать нам эту информацию, и решила, что самый действенный способ – сказки. Когда я в конце концов вернулся в Москву – в город, который едва помнил, – то почувствовал, что возвращаюсь домой, благодаря крупицам информации о России, вплетенным в затейливые сюжеты.

Такова сила повествования. И все множество услышанных сказок я хотел разбить на составляющие их компоненты. Мне нужно было увидеть большую картину, но я хотел видеть ее сквозь призму маленьких деталей. Я был очарован каждой частью механизма, создающего что-то настолько прекрасное. Я интуитивно знал: для того чтобы самому рассказать хорошую историю, сначала нужно собрать эти маленькие единицы информации. Именно так сформировалось мое отношение к данным.

В сегодняшнюю цифровую эпоху данные используются для создания историй о том, кто мы такие, как мы себя представляем, что нам нравится и когда мы хотим чего-то. Для того, чтобы проложить тропинку с уникальными виртуальными следами. Машины теперь знают о нас больше, чем мы сами, благодаря всем доступным им данным. Они читают наши личные данные как сборник рассказов о нас. И в науке о данных замечательно то, что любая дисциплина сегодня записывает свои данные, а это значит, что, освоив профессию аналитика данных, мы также можем стать космонавтами, танцорами и врачами, о чем так сильно мечтали.

Мало кто знает, что работать с данными в конечном итоге означает быть рассказчиком, передающим информацию. Так же, как и структурные компоненты историй, проекты по анализу и обработке данных тоже организованы логически. В книге «Работа с данными в любой сфере» четко выделяются пять этапов, которые составляют то, что я называю процессом обработки и анализа данных. Это не единственный подход, который можно использовать, но он обеспечит нашему проекту связь с практикой и продвижение к логическому завершению. И он четко и ясно структурирован, что мне так нравилось в детстве.

И вот я решил рассказать историю данных…

Но я абсолютный новичок


Рекомендуем почитать
Ученик

В Стокгольме жестоко убиты несколько женщин. Государственная комиссия по расследованию убийств под управлением Торкеля Хёглунда зашла в тупик.Эти убийства идентичны тем, которые совершал Эдвард Хинде, серийный убийца, пятнадцать лет тому назад посаженный за решетку полицейским психологом Себастианом Бергманом. Там, в тюрьме строго режима «Лёвхага», Хинде и пребывает.Себастиан больше не работает в полиции, но требует, чтобы его допустили к расследованию. Вскоре он понимает, что убийства связаны друг с другом так, как он и представить себе не мог.


Край бесконечности

Эта книга, воскрешающая оптимистический дух фантастики Золотого века, посвящена давней мечте человечества о полетах в космос, о покорении других планет и исследовании Солнечной системы. Здесь в нечеловеческих условиях Юпитера зарождается новая ступень человеческой эволюции, рискованная афера оборачивается контактом с иной формой жизни, художники в качестве холстов используют целые планеты, а обычный день инструктора по управлению космическими кораблями превращается в настоящий триллер. От постсингулярности до проблем искусственного интеллекта, от настоящей утопии до новых форм общества – все это «Край бесконечности», твердая научная фантастика в своих самых незаурядных и захватывающих проявлениях.


Савва Мамонтов

Книга известного писателя и публициста В. А. Бахревского представляет биографию одного из ярких деятелей отечественной истории. Савва Мамонтов — потомственный купец, предприниматель, меценат, деятель культуры. Строитель железных дорог в России, он стал создателем знаменитого абрамцевского кружка-товарищества, сыгравшего огромную роль в судьбе художников — Репина. Поленова. Серова, Врубеля, братьев Васнецовых, Коровина, Нестерова.Мамонтов создал Частную оперу, которая открыла талант Шаляпина, дала широкую дорогу русской опере — произведениям Чайковского, Римского-Корсакова, Бородина, Мусоргского, Даргомыжского, Верстовского, заложила основы русской вокальной школы и национального оперного театра.


Чумной корабль

Выполняя секретное антитеррористическое задание, экипаж корабля «Оре­гон» во главе с Хуаном Кабрильо встречает в море круизный лайнер, на ко­тором все мертвы — и экипаж, и пассажиры. Причем останки людей находят­ся в таком состоянии, что в голову потрясенного увиденным Кабрильо сразу же приходит мысль о какой-то стремительно распространяющейся заразе, ти­па вируса. Наконец на лайнере обнаруживается единственная выжившая — молодая девушка, подключенная к кислородному аппарату. Это подтвержда­ет догадку Хуана о вирусе.


Игродром. Что нужно знать о видеоиграх и игровой культуре

Жизнь современного человека плотно связана с видеоиграми. Даже если вы не играете сами, в вашем окружении наверняка найдутся заядлые геймеры, а новости из индустрии игр зачастую не обходят и вас стороной. Это положение дел приводит к вопросам: а что же такое видеоигры и какое место они занимают в жизни человека? Поиском ответов на них занимается дисциплина game studies. Александр Ветушинский – один из ведущих российских представителей этого направления исследований. Его книга «Игродром» – философское осмысление этапов развития игровой индустрии, анализ.


Выразительный JavaScript

В процессе чтения вы познакомитесь с основами программирования и, в частности, языка JavaScript, а также выполните несколько небольших проектов. Один из самых интересных проектов — создание своего языка программирования.


Справка по SQL

В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.


Темные данные. Практическое руководство по принятию правильных решений в мире недостающих данных

Человечество научилось собирать, обрабатывать и использовать в науке, бизнесе и повседневной жизни огромные массивы данных. Но что делать с данными, которых у нас нет? Допустимо ли игнорировать то, чего мы не замечаем? Британский статистик Дэвид Хэнд считает, что это по меньшей мере недальновидно, а порой – крайне опасно. В своей книге он выделяет 15 влияющих на наши решения и действия видов данных, которые остаются в тени. Например, речь идет об учете сигналов бедствия, которые могли бы подать жители бедных районов, если бы у них были смартфоны, результатах медицинского исследования, которые намеренно утаили или случайно исказили, или данных, ставших «темными» из-за плохого набора критериев для включения в выборку.


Создание инструмента научных исследований на основе XML: Проблемы и методология

"В своем докладе я опишу процесс создания электронного исследовательского инструмента, имеющего в своей основе печатный библиографический указатель, который предназначен для использования в научных целях, а также проанализирую некоторые трудности, с которыми мы столкнулись в ходе реализации данного проекта, и расскажу об избранных нами вариантах решения возникших проблем.".


Обработка баз данных на Visual Basic.NET

Это практическое руководство разработчика программного обеспечения на Visual Basic .NET и ADO.NET, предназначенное для создания приложений баз данных на основе WinForms, Web-форм и Web-служб. В книге описываются практические способы решения задач доступа к данным, с которыми сталкиваются разработчики на Visual Basic .NET в своей повседневной деятельности. Книга начинается с основных сведений о создании баз данных, использовании языка структурированных запросов SQL и системы управления базами данных Microsoft SQL Server 2000.