Работа с данными в любой сфере - [77]

Шрифт
Интервал

Что еще?

Вы уже сделали первый шаг в деле изучения науки о данных, прочитав эту книгу. Но здесь важно подчеркнуть, что это может быть только первым шагом. Одной книги никогда не бывает достаточно – да и не должно быть!

Вот что вы должны сделать, прежде чем подать свое первое заявление о приеме на работу.

1. Дайте себе (больше) времени, чтобы узнать свое ремесло

Осознав, насколько высок спрос на науку о данных, университеты начали обучение студентов по таким специальностям, как «магистр наук в области прогностической аналитики (онлайн-курс)» (Северо-Западный университет), «бизнес-аналитика и социальные сети» (Университет Брунеля), «вычислительная статистика и машинное обучение» (Университетский колледж Лондона).

Если честно, я считаю, что нет большого смысла в получении таких дипломов. Помимо финансовых издержек, связанных с обучением, есть еще одна проблема: эта дисциплина очень быстро стареет. Разработка новой учебной программы в университете может занять более шести месяцев. К тому времени, когда курс пройдет через все бюрократические препоны, сама наука, вероятно, уже уйдет дальше[71].

Более того, практически всю информацию, необходимую для овладения наукой о данных, можно найти в интернете. Многие практикующие аналитики данных (включая меня) ведут онлайн-курсы, и с их помощью вы можете научиться не только теории, но и практическому применению своих знаний. Это, на мой взгляд, сейчас более разумный вариант. Но важно не терять бдительность при выборе преподавателя: в наш демократический век интернета любой и каждый может создать собственный курс. А вот найдя правильного руководителя, вы получите открытый доступ к информации, которая будут обновляться по мере того, как новые методы станут доступными, а старые практики уйдут в небытие.

2. Важно не то, что вы знаете, а то, как применяете знания

Как вы думаете, что было самым мощным инструментом в начале моей карьеры? Программирование? Tableau? Реляционные базы данных? Выборка Томпсона?

Вы удивитесь, узнав, что я имею в виду программу PowerPoint, но именно так и было. Этот простой инструмент изменил для меня всё. Из всех сложных программных пакетов и алгоритмов, которые я использовал, PowerPoint оказала на меня наибольшее влияние, и в значительной степени благодаря ей я получил свою самую заметную должность. Как я уже сказал в главе 9, есть много талантливых жонглеров числами, но аналитики данных, способные эффективно донести свои идеи, встречаются редко.

Речь здесь не о том, что PowerPoint – палочка-выручалочка для всех специалистов по данным, но не стоит недооценивать что-либо из-за простоты. Просто-напросто я понял, как сделать так, чтобы мои знания и сильные стороны работали на меня. Еще учась в университете, я знал, что презентации в PowerPoint особенно хорошо даются мне.

Это пример того, как я применил свои знания для своего профессионального роста. Ваши знания, скорее всего, будут лежать в иной плоскости – найдите время, чтобы понять в какой, и запишите несколько идей. В «Будущем разума» Митио Каку цитирует нейробиолога Ричарда Дэвидсона, чтобы показать, насколько важно расширять свое представление о навыках и способности к успеху:

«Ваши оценки в школе, ваши баллы, полученные на выпускных экзаменах, менее значимы для жизненного успеха, чем ваши способности сотрудничать, управлять эмоциями, отложить удовольствие и фокусировать внимание. Эти навыки гораздо важнее…»

(Ричард Дэвидсон, цит. по книге Каку)

Вы не сумма ваших дипломов. Склонность к аналитике сослужит вам хорошую службу, но общительность и интерес к этике – дополнительные важные факторы, которые часто игнорируют даже наиболее проницательные аналитики данных. Когда у вас будет время, подумайте, как эти навыки или знания могут быть применены к любому из шагов в процессе анализа данных.

3. Делитесь – и делитесь по-братски

Если вы еще не готовы внести свой вклад, есть много краудсорсинговых проектов, где требуются специалисты для работы с большими массивами данных, способные оптимизировать их алгоритмы. Поиск в Google по фразе «проекты краудсорсинга данных» (data crowdsourcing projects) поможет вам найти их, а дополнительным преимуществом станет то, что вы сможете работать над многими из этих проектов не выходя из собственной комнаты.

Кэролайн Макколл, ассоциированный партнер FutureYou (небольшой австралийской фирмы, занимающейся консалтингом в области науки о данных), особо подчеркивает, что обмен знаниями внутри сообщества – эффективный и благодаря интернету практически бесплатный способ стать услышанным и повысить свою профессиональную репутацию. Самые успешные аналитики данных, которых я знаю, ведут блоги, записывают влоги (видеоблоги), делятся кодами на Github (сервис исходных кодов хостинга) и подобных платформах, отвечают на вопросы пользователей на таких сайтах, как StackExchange и Quora, работают фрилансерами в Upwork (крупнейшая сеть фрилансеров) и выступают на конференциях. Если вы уверены в себе или хотите сосредоточиться на определенной нише, блоги – эффективный путь к совмещению исследовательской деятельности и карьерного роста. Не беспокойтесь о том, что поначалу можете ошибиться, – вы быстро научитесь у членов сообщества или же попросите своего наставника (см. ниже) предварительно ознакомиться с вашим материалом. Будьте скромны и открыты для критики.


Рекомендуем почитать
Записки парасистемного программиста

Методический материал для разработчика ПО. Статьи полезные с исторической точки зрения для всех любителей современных теорий организации программного производства, так еще и актуальность до сих пор не потеряна. Правда примеры основаны на реалиях тех времен (1984 год или около того), но это почти не помеха — аналоги в современной практике находятся без труда. В общем, приобщайтесь к истокам!


Выразительный JavaScript

В процессе чтения вы познакомитесь с основами программирования и, в частности, языка JavaScript, а также выполните несколько небольших проектов. Один из самых интересных проектов — создание своего языка программирования.


Темные данные. Практическое руководство по принятию правильных решений в мире недостающих данных

Человечество научилось собирать, обрабатывать и использовать в науке, бизнесе и повседневной жизни огромные массивы данных. Но что делать с данными, которых у нас нет? Допустимо ли игнорировать то, чего мы не замечаем? Британский статистик Дэвид Хэнд считает, что это по меньшей мере недальновидно, а порой – крайне опасно. В своей книге он выделяет 15 влияющих на наши решения и действия видов данных, которые остаются в тени. Например, речь идет об учете сигналов бедствия, которые могли бы подать жители бедных районов, если бы у них были смартфоны, результатах медицинского исследования, которые намеренно утаили или случайно исказили, или данных, ставших «темными» из-за плохого набора критериев для включения в выборку.


Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры

Насколько велики на самом деле «большие данные» – огромные массивы информации, о которых так много говорят в последнее время? Вот наглядный пример: если выписать в линейку все цифры 0 и 1, из которых состоит один терабайт информации (вполне обычная емкость для современного жесткого диска), то цепочка цифр окажется в 50 раз длиннее, чем расстояние от Земли до Сатурна! И тем не менее, на «большие данные» вполне можно взглянуть в человеческом измерении. Эрец Эйден и Жан-Батист Мишель – лингвисты и компьютерные гении, создатели сервиса Google Ngram Viewer и термина «культуромика», показывают, каким образом анализ «больших данных» помогает исследовать трудные проблемы языка, культуры и истории.


Справка по SQL

В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.


Firebird. Руководство разработчика баз данных

Рассмотрены вопросы, необходимые разработчику для создания клиент-серверных приложений с использованием СУБД Firebird, явившейся развитием СУБД Borland Interbase 6. Содержится обзор концепций и моделей архитектуры клиент/сервер, а также практические рекомендации по работе с клиентскими библиотеками Firebird. Детально описаны особенности типов данных SQL, язык манипулирования данными (Data Manipulation Language, DML), а также синтаксис и операторы языка определения данных ( Data Definition Language, DDL)