Работа с данными в любой сфере - [11]
02
Как данные удовлетворяют наши потребности
В науке о данных не так уж много таинственного – она, в конце концов, полностью вписана в современные реалии. И все же преобладает неверное представление, будто данные сложны и даже непостижимы. К сожалению, многие сегодня либо охотно отказываются видеть, как широко применяется наука о данных, либо намеренно отвергают ее как нечто недоступное или неприменимое к их работе. Наука о данных как дисциплина предполагает что-то весьма замысловатое. Это похоже на то, чем люди занимаются в маленьких кабинетах без окон, сгорбившись над своими столами.
Такой взгляд совершенно неверен.
В этой главе мы точно узнаем, насколько данные вездесущи, как широко они генерируются и собираются и почему наука о данных никогда не может считаться причудой.
Проникновение данных
Чтобы проиллюстрировать, насколько важны данные для всех аспектов нашей жизни – что это необходимость, а не роскошь, я буду использовать пирамиду потребностей Маслоу, которая, я уверен, знакома многим бизнес-практикам. В литературе по бизнес-психологии о ней написано очень много. Я считаю, что эта модель на удивление хорошо сочетается с распространенностью и преимуществами данных[11].
Иерархия потребностей была разработана Абрахамом Маслоу в 1943 г. для отображения сложной мотивации, обуславливающей поведение людей. Иерархия представлена в форме пирамиды, которая в последовательности снизу вверх включает в себя потребности – от наиболее к наименее фундаментальным (рис. 2.1). Короче говоря, иерархия организована таким образом, что потребности, находящиеся на самом нижнем уровне пирамиды, должны быть удовлетворены до того, как у индивидуума, о котором идет речь, появится мотивация для удовлетворения потребностей более высоких уровней[12].
Наука о данных и физиология
В основе иерархии Маслоу лежат физиологические факторы – основные потребности людей для простого выживания. Как данные могут поспособствовать лучшему удовлетворению этих основных потребностей?
Давайте возьмем в качестве примера воздух, которым мы дышим. Загрязнение воздуха – один из наиболее серьезных поводов для глобального беспокойства со времен промышленной революции конца XVIII и начала XIX в. Мы могли бы считать смог феноменом прошлого – так, в 1950-х гг. выбросы, образовавшиеся при сгорании угля, регулярно окутывали Лондон. Но смесь дыма, тумана и пыли остается большой проблемой во многих городах по всему миру, от Китая до Бразилии.
Любые технологии, предназначенные для уменьшения загрязнения воздуха в городах, зависят от данных: чтобы улучшить состояние воздуха, его состав необходимо сначала контролировать.
Программа «Зеленый горизонт» (Green Horizon) была запущена компанией IBM в 2014 г. в связи с необходимостью отреагировать на ужасное качество воздуха в Китае путем «преобразования его национальных энергетических систем и поддержки потребностей в устойчивой урбанизации» (IBM, 2017a). «Зеленый горизонт»[13] использует данные 12 глобальных исследовательских лабораторий и применяет когнитивные модели к собранным данным, чтобы предоставить информацию, связанную с главной целью проекта – сокращением загрязнения. Данные необходимы для мониторинга колебаний загрязнения воздуха в отдельных районах, а также для того, чтобы ученые могли проанализировать различные факторы, которые прямо или косвенно влияют на качество, температуру и состояние воздуха, и начать улучшать физическую среду в Китае.
Огромное преимущество этих проектов заключается в том, что экологические данные чаще всего являются общедоступными и в глобальном масштабе. Это означает, что технологические разработки, направленные на борьбу с загрязнением воздуха, могут быстро развиваться. Наличие доступа к важным массивам данных, связанных с удовлетворением наших самых основных потребностей, необходимо для понимания того, как имеющиеся технологии могут работать лучше. Вот почему у нас теперь есть специальные стеклянные панели, которые могут быть установлены в зданиях, чтобы окна могли «дышать», очищая воздух внутри помещения и тем самым защищая находящихся там людей. Вот почему у нас есть фильтры, которые могут быть использованы на фабриках в целях уменьшения вредных выбросов и защиты местных жителей от отравления.
Еда еще один пример того, как данные связаны с самыми основными потребностями человека (физиологические факторы в пирамиде Маслоу). Для некоторых это может показаться научной фантастикой, но уже в течение многих лет еда выращивается в лабораториях, а использование искусственного мяса становится все более актуальным феноменом. Memphis Meats, стартап в Кремниевой долине, который с момента своего создания разработал разные виды искусственного мяса, от говядины до домашней птицы, – всего лишь один из подобных институтов.
Поскольку это все еще некая «серая» область для регулирующих органов, религии и науки, искусственное мясо вызвало и похвалы, и гнев мирового сообщества (Devitt, 2017). Но нравится нам это или нет, искусственное мясо в недалеком будущем может стать заменой того, что мы едим. Резко сократив потребление воды и выбросы углерода, оно станет экологически безопасным решением в условиях, когда сельское хозяйство негативно влияет на мир природы. И данные, которые мы собираем для производства такого мяса, в конечном итоге выйдут за рамки исследования ДНК. Поскольку пищевые технологии становятся все более обыденными, дополнительные потребительские данные будут использоваться для других целей, таких как определение оптимальных способов приготовления искусственного мяса, – это позволит не только сделать мясо вкуснее, но и, что особенно важно для производящих компаний, повысить его продаваемость.
Методический материал для разработчика ПО. Статьи полезные с исторической точки зрения для всех любителей современных теорий организации программного производства, так еще и актуальность до сих пор не потеряна. Правда примеры основаны на реалиях тех времен (1984 год или около того), но это почти не помеха — аналоги в современной практике находятся без труда. В общем, приобщайтесь к истокам!
В процессе чтения вы познакомитесь с основами программирования и, в частности, языка JavaScript, а также выполните несколько небольших проектов. Один из самых интересных проектов — создание своего языка программирования.
Человечество научилось собирать, обрабатывать и использовать в науке, бизнесе и повседневной жизни огромные массивы данных. Но что делать с данными, которых у нас нет? Допустимо ли игнорировать то, чего мы не замечаем? Британский статистик Дэвид Хэнд считает, что это по меньшей мере недальновидно, а порой – крайне опасно. В своей книге он выделяет 15 влияющих на наши решения и действия видов данных, которые остаются в тени. Например, речь идет об учете сигналов бедствия, которые могли бы подать жители бедных районов, если бы у них были смартфоны, результатах медицинского исследования, которые намеренно утаили или случайно исказили, или данных, ставших «темными» из-за плохого набора критериев для включения в выборку.
"В своем докладе я опишу процесс создания электронного исследовательского инструмента, имеющего в своей основе печатный библиографический указатель, который предназначен для использования в научных целях, а также проанализирую некоторые трудности, с которыми мы столкнулись в ходе реализации данного проекта, и расскажу об избранных нами вариантах решения возникших проблем.".
В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.
Рассмотрены вопросы, необходимые разработчику для создания клиент-серверных приложений с использованием СУБД Firebird, явившейся развитием СУБД Borland Interbase 6. Содержится обзор концепций и моделей архитектуры клиент/сервер, а также практические рекомендации по работе с клиентскими библиотеками Firebird. Детально описаны особенности типов данных SQL, язык манипулирования данными (Data Manipulation Language, DML), а также синтаксис и операторы языка определения данных ( Data Definition Language, DDL)