Анализ и визуализация данных в электронных таблицах - [3]

Шрифт
Интервал


Мы познакомились с окном выбора таблиц. Теперь пора переходить к загрузке данных.

Снова выбираем все таблицы.

Нажимаем кнопку загрузки:

Load.

Рассмотрим результаты загрузки.

В правой части окна Excel открывается список выполненных запросов на загрузку данных:

Queries & Connections.

Это должно быть нам знакомо по предыдущей работе. Тогда мы работали с набором инструментов Get & Transform и с надстройкой Power Query.

В разделе Queries нам сообщают, что было выполнено пять запросов:

5 queries.

Кроме того, радом с названием запроса указано количество загруженных строк.

Подведём курсор к любому запросу. Нам выводят подробные сведения об источнике данных (рис. 2.8).

Название таблицы:

S_Teams.

Далее идёт область предварительного просмотра.

Названия загруженных столбцов:

Columns [4] — Event, Discipline, Sport, Participation.

Время последнего обновления результатов запроса:

Last refreshed.

Указан источник данных:

Data Sources [1] — каталог и файл.

Между прочим, нам намекают про возможность загрузить данные сразу из нескольких источников.

Кроме того, здесь говорится, что данные из выбранной таблицы были загружены в «Модель данных»:

Load status — Loaded to Data Model.


Рис. 2.8. Запросы на загрузку данных


Задание. Ознакомьтесь с описанием каждого запроса.


Мы загрузили данные. Переходим к анализу.

Создадим сводную таблицу:

Insert — Tables — PivotTable.

Появляется диалоговое окно создания сводной таблицы:

Create PivotTable (рис. 2.9).

В качестве источника данных нам сразу предлагают использовать модель данных, которая уже создана в текущей рабочей книге:

Choose the data you want to analyze — Use this workbook’s Data Model.

Нажимаем ОК.


Рис. 2.9. Создание сводной таблицы на основе модели данных


Задание. Создайте сводную таблицу по модели данных.


Появляется заготовка сводной таблицы и меню настройки полей:

PivotTable Fields.

Можно сравнить список таблицы в списке запросов и в списке полей сводной таблицы. Надеемся, что они совпадут.

Обратим внимание, что после загрузки таблиц сами исходные данные на экран не выводятся. Мы видим только сообщения о существующей модели данных.


Рис. 2.10. Поля сводной таблицы


Задание. Сравните списки таблиц в запросах и в сводной таблице.


Посмотрим повнимательнее на список полей сводной таблицы.

Значки таблиц намекают на базу данных — цилиндр как символ компьютерного диска (то есть база данных) на фоне таблички.

Каждая таблица на самом деле — это раскрывающийся список. Щёлкаем по значку> слева от названия таблицы и получаем список полей данной таблицы. Чтобы свернуть список полей, щёлкаем по значку слева от названия таблицы.

Задание. Ознакомьтесь с полями каждой таблицы в списке полей сводной таблицы.


Наводим курсор на любую таблицу. Появляется всплывающая подсказка — сообщение про источник данных:

Data Source: Query — Medals.

Здесь явно указано, что данные получены с помощью запроса на загрузку (рис. 2.10).

Задание. Ознакомьтесь с источником данных по каждой таблице.


Вернёмся к источнику данных.

Откроем наш исходный файл базы данных в пакете Microsoft Access. Для этого достаточно просто дважды щёлкнуть по файлу в Проводнике. Конечно, при этом сам пакет Access должен быть установлен на компьютере. Если нет, то для нашего опыта придётся его установить.

В верхнем меню находим следующий пункт:

Database Tools — Relationships — Relationships.

Читаем всплывающую подсказку (рис. 2.11).


Рис. 2.11. Построение схемы базы данных


Задание. Откройте файл базы данных в Access и прочитайте описание функции Relationships.


Нажимаем на кнопку Relationships.

На экране появляется схема базы данных (рис. 2.12).

Видим, что здесь всего одна связь типа «один ко многим» между двумя таблицами.

Три оставшиеся таблицы оказались сами по себе.

Вспоминаем, как мы рассматривали связанные таблицы при загрузке таблиц из файла базы данных — на одном из предыдущих шагов, несколько страниц тому назад. Это было в диалоговом окне Navigator. Там мы тоже увидели, какие таблицы связаны между собой, а какие — нет.


Рис. 2.12. Модель базы данных


Задание. Постройте схему / структуру базы данных в Access. Изучите связи между таблицами в базе данных. Сравните с результатами отображения связанных таблиц в процессе загрузки


Мы создали сводную таблицу. Пришло время настроить поля.

Как и в предыдущих работах, мы просто перетаскиваем поля исходных таблиц в области строк, столбцов, фильтров и значений. В этот раз мы перетаскиваем поля не из общего списка, а из списка полей отельной исходной таблицы.

Настроим сводную таблицу следующим образом:

По столбцам расположим страну национального оргкомитета:

Columns: Medals — NOC_CountryRegion.

По строкам расположим виды спорта:

Rows: Disciplines — Discipline.

Организуем фильтрацию по медалям:

Filters: Medals — Medal.

В качестве обобщённого показателя найдём количество медалей:

Values: Medals — Medal.

Обратите внимание на автоматическое вычисление количества медалей Count of Medal в области значений (рис. 2.13). Обычно при создании сводной таблицы нам предлагается по умолчанию найти сумму.


Рис. 2.13. Сводная таблица


Задание. Настройте сводную таблицу описанным выше образом.


Отредактируем заголовки сводной таблицы и сделаем их более понятными (рис. 2.14).


Еще от автора Валентин Юльевич Арьков
Организация параллельных потоков. Часть 1

В данной лабораторной работе рассматриваются основы организации параллельных потоков с помощью стандартных вызовов операционной системы. В работе используется бесплатная интегрированная среда разработки. Приводятся примеры программ на языке Си.


Применение гистограмм в управлении качеством

Гистограмма — это один из самых простых инструментов статистического УПРАВЛЕНИЯ КАЧЕСТВОМ производства. В этой работе будет использоваться пакет Microsoft Excel для создания исходных данных, а также для построения и анализа гистограммы. Можно также использовать любой другой программный инструмент, позволяющий строить гистограммы.


Бизнес-аналитика. Извлечение, преобразование и загрузка данных

Системы бизнес-аналитики работают с различными источниками данных с помощью функций ETL (Extract-Transform-Load). Название ETL можно перевести как «извлечение, преобразование и загрузка данных». Имеется в виду загрузка в хранилище данных для дальнейшей обработки в системе бизнес-аналитики. В простейшем случае это загрузка данных в виде одной, объединённой, консолидированной таблицы. В данной работе мы познакомимся с основными этапами ETL на примере загрузки данных в электронные таблицы.


Анализ распределения в Excel

Учебное пособие позволяет освоить базовые методы статистического анализа распределения с помощью сводки и группировки данных в пакете Microsoft Excel. Практическое знакомство происходит подробно, шаг за шагом, с примерами и комментариями. Попутно можно улучшить навыки работы в Excel, что само по себе уже полезно как элемент современной компьютерной грамотности.


Организация параллельных потоков. Часть 2

При решении инженерных, экономических и научных задач используются высокопроизводительные вычисления — High Performance Computing или сокращённо HPC. Параллельные программы нужны для того, чтобы использовать вычислительные мощности многоядерных процессоров и графических ускорителей. В данной работе мы рассмотрим технологию автоматической организации параллельных потоков для многоядерных вычислительных машин.


Анализ рядов динамики в электронных таблицах

В данной работе мы рассмотрим раздел «Динамика». Здесь изучают данные, привязанные ко времени. Мы будем опираться на две предыдущие работы: «Анализ распределения (Сводка и группировка)» и «Анализ взаимосвязи (Корреляция и регрессия)». Работа выполняется в пакете типа электронных таблиц. Как и в предыдущих работах, вначале мы сгенерируем случайные числа и поиграем с ними, а затем поработаем с реальными данными.


Рекомендуем почитать
На траверзе — Дакар

Послевоенные годы знаменуются решительным наступлением нашего морского рыболовства на открытые, ранее не охваченные промыслом районы Мирового океана. Одним из таких районов стала тропическая Атлантика, прилегающая к берегам Северо-западной Африки, где советские рыбаки в 1958 году впервые подняли свои вымпелы и с успехом приступили к новому для них промыслу замечательной деликатесной рыбы сардины. Но это было не простым делом и потребовало не только напряженного труда рыбаков, но и больших исследований ученых-специалистов.


Историческое образование, наука и историки сибирской периферии в годы сталинизма

Настоящая монография посвящена изучению системы исторического образования и исторической науки в рамках сибирского научно-образовательного комплекса второй половины 1920-х – первой половины 1950-х гг. Период сталинизма в истории нашей страны характеризуется определенной дихотомией. С одной стороны, это время диктатуры коммунистической партии во всех сферах жизни советского общества, политических репрессий и идеологических кампаний. С другой стороны, именно в эти годы были заложены базовые институциональные основы развития исторического образования, исторической науки, принципов взаимоотношения исторического сообщества с государством, которые определили это развитие на десятилетия вперед, в том числе сохранившись во многих чертах и до сегодняшнего времени.


Интеллигенция в поисках идентичности. Достоевский – Толстой

Монография посвящена проблеме самоидентификации русской интеллигенции, рассмотренной в историко-философском и историко-культурном срезах. Логически текст состоит из двух частей. В первой рассмотрено становление интеллигенции, начиная с XVIII века и по сегодняшний день, дана проблематизация важнейших тем и идей; вторая раскрывает своеобразную интеллектуальную, духовную, жизненную оппозицию Ф. М. Достоевского и Л. Н. Толстого по отношению к истории, статусу и судьбе русской интеллигенции. Оба писателя, будучи людьми диаметрально противоположных мировоззренческих взглядов, оказались “versus” интеллигентских приемов мышления, идеологии, базовых ценностей и моделей поведения.


Князь Евгений Николаевич Трубецкой – философ, богослов, христианин

Монография протоиерея Георгия Митрофанова, известного историка, доктора богословия, кандидата философских наук, заведующего кафедрой церковной истории Санкт-Петербургской духовной академии, написана на основе кандидатской диссертации автора «Творчество Е. Н. Трубецкого как опыт философского обоснования религиозного мировоззрения» (2008) и посвящена творчеству в области религиозной философии выдающегося отечественного мыслителя князя Евгения Николаевича Трубецкого (1863-1920). В монографии показано, что Е.


Технологии против Человека. Как мы будем жить, любить и думать в следующие 50 лет?

Эксперты пророчат, что следующие 50 лет будут определяться взаимоотношениями людей и технологий. Грядущие изобретения, несомненно, изменят нашу жизнь, вопрос состоит в том, до какой степени? Чего мы ждем от новых технологий и что хотим получить с их помощью? Как они изменят сферу медиа, экономику, здравоохранение, образование и нашу повседневную жизнь в целом? Ричард Уотсон призывает задуматься о современном обществе и представить, какой мир мы хотим создать в будущем. Он доступно и интересно исследует возможное влияние технологий на все сферы нашей жизни.


Лес. Как устроена лесная экосистема

Что такое, в сущности, лес, откуда у людей с ним такая тесная связь? Для человека это не просто источник сырья или зеленый фитнес-центр – лес может стать местом духовных исканий, служить исцелению и просвещению. Биолог, эколог и журналист Адриане Лохнер рассматривает лес с культурно-исторической и с научной точек зрения. Вы узнаете, как устроена лесная экосистема, познакомитесь с различными типами леса, характеризующимися по составу видов деревьев и по условиям окружающей среды, а также с видами лесопользования и с некоторыми аспектами охраны лесов. «Когда видишь зеленые вершины холмов, которые волнами катятся до горизонта, вдруг охватывает оптимизм.