Наука о данных. Базовый курс - [57]
Наука о данных (Data Science)
Развивающаяся область знаний, которая использует набор алгоритмов, процессов и методов постановки проблемы для анализа больших данных с целью извлечь из них полезную информацию. Тесно связана с глубинным анализом данных, но имеет более широкую сферу применения и круг проблем. Занимается анализом как структурированных, так и неструктурированных больших данных и базируется на принципах целого ряда научных отраслей, включая машинное обучение, статистику, высокопроизводительные вычисления, а также этические вопросы использования данных и их регулирование.
Нейрон (Neuron)
Нейрон принимает на вход несколько значений (или активаций) и отображает их в качестве выходного сигнала. Это отображение обычно обеспечивается функцией линейной регрессии, примененной к входным данным, и последующим выводом результата этой функции через нелинейные функции активации, такие как логистическая функция или функция TANH.
Нейронная сеть (Neural Network)
Тип модели машинного обучения, которая реализована в виде сети процессорных блоков, называемых нейронами. Можно создавать различные типы нейронных сетей, изменяя в них топологию нейронов. Наиболее часто встречаются полностью подключенные нейронные сети с прямой связью, которые обучают методом обратного распространения ошибки.
Обучение без учителя (Unsupervised Learning)
Форма машинного обучения, целью которой является выявление закономерностей в базе данных, которые включают кластеры похожих объектов или регулярность атрибутов. В отличие от контролируемого обучения в наборе данных не определен целевой атрибут.
Необработанный атрибут (Raw Attribute)
Абстракция сущности, которая является ее прямым измерением, например рост человека (в отличие от производного атрибута).
Неструктурированные данные (Unstructured Data)
Данные, где каждый объект в наборе может иметь собственную внутреннюю структуру, отличающуюся от внутренних структур других объектов. Например, текстовые данные часто не структурированы и требуют, чтобы к ним применялась последовательность операций для извлечения структурированного представления каждого объекта.
Объект (Instance)
Каждая строка в наборе данных содержит информацию, относящуюся к одному объекту (также называемому экземпляром, сущностью, случаем или записью).
Поиск ассоциативных правил (Association Rule Mining)
Техника анализа данных при неконтролируемом обучении, которая ищет группы элементов, часто встречающихся вместе. Классическим примером использования является анализ рыночной корзины, когда розничные компании пытаются идентифицировать наборы товаров, которые часто покупают вместе, к примеру хот-дог, кетчуп и пиво.
Прогнозирование (Prediction)
В контексте науки о данных и машинного обучения прогнозирование — это задача вычисления значения целевого атрибута для данного объекта на основе значений других атрибутов (или входных атрибутов) этого же объекта.
Производный атрибут (Derived Attribute)
Атрибут, значение которого генерируется путем применения функции к данным, а не путем прямого измерения объекта (в отличие от базового атрибута). Примером производного атрибута является атрибут, который описывает среднее значение выборки.
Регрессионный анализ (Regression Analysis)
Вычисляет ожидаемое (или среднее) значение числового целевого атрибута при всех заданных значениях входного атрибута. Регрессионный анализ предполагает параметризованную математическую модель гипотетической взаимосвязи между входами и выходами, известную как функция регрессии. Функция регрессии может иметь множество параметров, и целью регрессионного анализа является поиск правильных настроек для них.
Собранные данные (Captured Data)
Данные, которые зафиксированы непосредственно в процессе сбора данных (в отличие от аномалий).
Структурированные данные (Structured Data)
Данные, которые могут храниться в таблице, каждый объект которой имеет одинаковый набор атрибутов (в отличие от неструктурированных данных).
Транзакционные данные (Transactional Data)
Включают информацию о событиях, таких как продажа товара, выставление счета, доставка груза, оплата кредитной картой и т. д.
Умный город (Smart City)
Проекты умных городов, как правило, пытаются интегрировать данные в режиме реального времени из множества различных источников в единый центр данных, где они анализируются и используются для принятия управленческих решений и планирования.
Хранилище данных (Data Warehouse)
Централизованный репозиторий, который содержит данные из разных источников со всех уровней организации. Данные структурированы так, чтобы поддерживать генерацию сводных отчетов. Интерактивная аналитическая обработка (OLAP) — термин, используемый для описания типичных операций в хранилище данных.
Целевой атрибут (Target Attribute)
В задаче прогнозирования целевой атрибут — это атрибут, которому модель прогнозирования обучается для вычисления значений.
Жизнь современного человека плотно связана с видеоиграми. Даже если вы не играете сами, в вашем окружении наверняка найдутся заядлые геймеры, а новости из индустрии игр зачастую не обходят и вас стороной. Это положение дел приводит к вопросам: а что же такое видеоигры и какое место они занимают в жизни человека? Поиском ответов на них занимается дисциплина game studies. Александр Ветушинский – один из ведущих российских представителей этого направления исследований. Его книга «Игродром» – философское осмысление этапов развития игровой индустрии, анализ.
В процессе чтения вы познакомитесь с основами программирования и, в частности, языка JavaScript, а также выполните несколько небольших проектов. Один из самых интересных проектов — создание своего языка программирования.
В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.
В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.
Это практическое руководство разработчика программного обеспечения на Visual Basic .NET и ADO.NET, предназначенное для создания приложений баз данных на основе WinForms, Web-форм и Web-служб. В книге описываются практические способы решения задач доступа к данным, с которыми сталкиваются разработчики на Visual Basic .NET в своей повседневной деятельности. Книга начинается с основных сведений о создании баз данных, использовании языка структурированных запросов SQL и системы управления базами данных Microsoft SQL Server 2000.