Анализ и визуализация данных в электронных таблицах - [6]

Шрифт
Интервал

. Получаем тридцать вариантов перевода (рис. 3.13). Обратим внимание, что в каждом варианте перевода даётся краткая формулировка значения на английском.


Рис. 3.13. Перевод Яндекса


Задание. Изучите результаты переводчика Яндекса.


Попробуем поискать не в Яндексе, а в Гугле. Конечно же, первый результат поиска — Переводчик Гугл. Здесь тоже самые разные русские эквиваленты. А вот в левой части окна мы видим английский текст. Это английский толковый словарь. То есть объяснение смысла английского слова с помощью английских слов. И здесь становится понятно, что у слова HOST всего пять разных значений.

Остаётся выбрать из этих пяти вариантов то значение, которое подходит для разговора об Олимпийских играх. А затем нужно подобрать адекватное русское слово или выражение, которое передаёт смысл.


Рис. 3.14. Перевод Гугл


Задание. Выберите подходящее значение слова HOST и подберите русский эквивалент.

4. Связи между таблицами

Мы загрузили таблицы из базы данных. В этих данных была заложена связь между двумя таблицами.

Power Pivot позволяет вывести на экран изображение схемы связей между таблицами.

Чтобы запустить Power Pivot, выбираем в верхнем меню:

Power Pivot — Data Model — Manage (рис. 4.1).


Рис. 4.1. Запуск Power Pivot


Появляется новое окно:

Power Pivot for Excel (рис. 4.2).

Это не просто диалоговое окно. Это надстройка со своими особыми функциями.

Чтобы вывести на экран схему модели данных, выбираем следующий пункт в верхнем меню:

Home — View — Diagram View.

Можно также нажать кнопку Diagram с таким же значком в правом нижнем углу окна.

На схеме мы видим пять таблиц, загруженных из базы данных. Других таблиц Excel здесь пока нет.

Между таблицами Disciplines и Medals имеется связь «один ко многим». На этой схеме она показана следующими символами:

1 —> *.


Рис. 4.2. Схема модели данных


Рассмотрим список доступных таблиц.

Выберем сводную таблицу. Переходим на соответствующий лист рабочей книги и щёлкаем по сводной таблице.

Рассмотрим список полей сводной таблицы:

PivotTable Fields.

Выбираем вкладку со списком всех доступных полей:

All.

Сравним списки выбранных (активных) и всех доступных полей/таблиц (рис. 4.3). Активные поля, то есть задействованные в создании сводной таблицы, выделены жирным шрифтом.

В списке всех полей можно увидеть пять таблиц из базы данных и две таблицы, загруженные по отдельности.


Рис. 4.3. Поля сводной таблицы


Задание. Изучите списки таблиц и обратите внимание на разные значки для разных таблиц.


Перетащим поле Sport из новой таблицы Sports в область строк сводной таблицы. Поместим его над полем Discipline.

Как мы убедились, эта новая таблица пока не учтена в модели данных. Поэтому сообщают, что может потребоваться создать связи между таблицами:

Relationships between tables may be needed (рис. 4.4).

Это предупреждение выводится на жёлтом фоне, чтобы обратить на него наше внимание.


Рис. 4.4. Приглашение к созданию связей


Рассмотрим две таблицы в списке исходных полей для сводной таблицы:

— Disciplines — Спортивные дисциплины;

— Sports — Виды спорта.

В обеих таблицах есть одно и то же поле:

SportID — идентификатор вида спорта (рис. 4.5).

Пришло время прояснить ситуацию. Нам нужно разобраться, что такое — «вид спорта» и «спортивная дисциплина». Придётся поискать ответ в интернете.


Рис. 4.5. Общее поле


Задание. Выясните, как связаны между собой ВИД СПОРТА и СПОРТИВНАЯ ДИСЦИПЛИНА.


Теперь попробуем создать связь. Нажимаем кнопку

Create.

Открывается диалоговое окно создания связи:

Create Relationship.

Настроим связь следующим образом (рис. 4.6):

— Table — Disciplines;

— Column (Foreign) — SportID;

— Related Table — Sports;

— Related Column (Primary) — SportID.

В связанной таблице указываем первичный ключ — идентификатор вида спорта.

Нажимаем ОК.


Рис. 4.5. Создание связи между таблицами


Задание. Настройте связь между таблицами (рис. 4.5).


Сводная таблица изменилась и стала более осмысленной (рис. 4.6). Например, две спортивные дисциплины — фигурное катание Figure skating и конькобежный спорт Speed skating — входят в коньковые виды спорта Skating.

Это так называемая ИЕРАРХИЯ.


Рис. 4.6. Сводная таблица после создания связи


Задание. Рассмотрите иерархию в сводной таблице.

Задание. Отключите фильтрацию по строкам и выясните, в каких видах спорта присутствует иерархия.


Мы работаем с реальными данными. Конечно, их хорошо подготовили к обработке, но это настоящие реальные данные.

Можно познакомиться с иерархией «Вид спорта — Дисциплина». Достаточно найти в Википедии соответствующую статью.

Ну а чтобы увидеть все виды спорта и дисциплины, отключим все виды фильтрации, нажав в меню фильтрации пункт Clear Filter from…

Задание. Изучите в Википедии статью «Олимпийские виды спорта» и сравните перечень видов спорта с иерархией в сводной таблице.

5. Добавление связи в PowerPivot

Мы рассмотрели, как настроить связь между таблицами в режиме диалога.

Второй способ управления связями — это использование надстройки Power Pivot. В этом случае мы просто перетаскиваем поля на схеме модели данных.

Продемонстрируем этот приём работы.

Добавим таблицу Hosts в модель данных. Для этого переходим на лист


Еще от автора Валентин Юльевич Арьков
Организация параллельных потоков. Часть 1

В данной лабораторной работе рассматриваются основы организации параллельных потоков с помощью стандартных вызовов операционной системы. В работе используется бесплатная интегрированная среда разработки. Приводятся примеры программ на языке Си.


Применение гистограмм в управлении качеством

Гистограмма — это один из самых простых инструментов статистического УПРАВЛЕНИЯ КАЧЕСТВОМ производства. В этой работе будет использоваться пакет Microsoft Excel для создания исходных данных, а также для построения и анализа гистограммы. Можно также использовать любой другой программный инструмент, позволяющий строить гистограммы.


Бизнес-аналитика. Извлечение, преобразование и загрузка данных

Системы бизнес-аналитики работают с различными источниками данных с помощью функций ETL (Extract-Transform-Load). Название ETL можно перевести как «извлечение, преобразование и загрузка данных». Имеется в виду загрузка в хранилище данных для дальнейшей обработки в системе бизнес-аналитики. В простейшем случае это загрузка данных в виде одной, объединённой, консолидированной таблицы. В данной работе мы познакомимся с основными этапами ETL на примере загрузки данных в электронные таблицы.


Анализ распределения в Excel

Учебное пособие позволяет освоить базовые методы статистического анализа распределения с помощью сводки и группировки данных в пакете Microsoft Excel. Практическое знакомство происходит подробно, шаг за шагом, с примерами и комментариями. Попутно можно улучшить навыки работы в Excel, что само по себе уже полезно как элемент современной компьютерной грамотности.


Организация параллельных потоков. Часть 2

При решении инженерных, экономических и научных задач используются высокопроизводительные вычисления — High Performance Computing или сокращённо HPC. Параллельные программы нужны для того, чтобы использовать вычислительные мощности многоядерных процессоров и графических ускорителей. В данной работе мы рассмотрим технологию автоматической организации параллельных потоков для многоядерных вычислительных машин.


Анализ рядов динамики в электронных таблицах

В данной работе мы рассмотрим раздел «Динамика». Здесь изучают данные, привязанные ко времени. Мы будем опираться на две предыдущие работы: «Анализ распределения (Сводка и группировка)» и «Анализ взаимосвязи (Корреляция и регрессия)». Работа выполняется в пакете типа электронных таблиц. Как и в предыдущих работах, вначале мы сгенерируем случайные числа и поиграем с ними, а затем поработаем с реальными данными.


Рекомендуем почитать
На траверзе — Дакар

Послевоенные годы знаменуются решительным наступлением нашего морского рыболовства на открытые, ранее не охваченные промыслом районы Мирового океана. Одним из таких районов стала тропическая Атлантика, прилегающая к берегам Северо-западной Африки, где советские рыбаки в 1958 году впервые подняли свои вымпелы и с успехом приступили к новому для них промыслу замечательной деликатесной рыбы сардины. Но это было не простым делом и потребовало не только напряженного труда рыбаков, но и больших исследований ученых-специалистов.


Историческое образование, наука и историки сибирской периферии в годы сталинизма

Настоящая монография посвящена изучению системы исторического образования и исторической науки в рамках сибирского научно-образовательного комплекса второй половины 1920-х – первой половины 1950-х гг. Период сталинизма в истории нашей страны характеризуется определенной дихотомией. С одной стороны, это время диктатуры коммунистической партии во всех сферах жизни советского общества, политических репрессий и идеологических кампаний. С другой стороны, именно в эти годы были заложены базовые институциональные основы развития исторического образования, исторической науки, принципов взаимоотношения исторического сообщества с государством, которые определили это развитие на десятилетия вперед, в том числе сохранившись во многих чертах и до сегодняшнего времени.


Интеллигенция в поисках идентичности. Достоевский – Толстой

Монография посвящена проблеме самоидентификации русской интеллигенции, рассмотренной в историко-философском и историко-культурном срезах. Логически текст состоит из двух частей. В первой рассмотрено становление интеллигенции, начиная с XVIII века и по сегодняшний день, дана проблематизация важнейших тем и идей; вторая раскрывает своеобразную интеллектуальную, духовную, жизненную оппозицию Ф. М. Достоевского и Л. Н. Толстого по отношению к истории, статусу и судьбе русской интеллигенции. Оба писателя, будучи людьми диаметрально противоположных мировоззренческих взглядов, оказались “versus” интеллигентских приемов мышления, идеологии, базовых ценностей и моделей поведения.


Князь Евгений Николаевич Трубецкой – философ, богослов, христианин

Монография протоиерея Георгия Митрофанова, известного историка, доктора богословия, кандидата философских наук, заведующего кафедрой церковной истории Санкт-Петербургской духовной академии, написана на основе кандидатской диссертации автора «Творчество Е. Н. Трубецкого как опыт философского обоснования религиозного мировоззрения» (2008) и посвящена творчеству в области религиозной философии выдающегося отечественного мыслителя князя Евгения Николаевича Трубецкого (1863-1920). В монографии показано, что Е.


Технологии против Человека. Как мы будем жить, любить и думать в следующие 50 лет?

Эксперты пророчат, что следующие 50 лет будут определяться взаимоотношениями людей и технологий. Грядущие изобретения, несомненно, изменят нашу жизнь, вопрос состоит в том, до какой степени? Чего мы ждем от новых технологий и что хотим получить с их помощью? Как они изменят сферу медиа, экономику, здравоохранение, образование и нашу повседневную жизнь в целом? Ричард Уотсон призывает задуматься о современном обществе и представить, какой мир мы хотим создать в будущем. Он доступно и интересно исследует возможное влияние технологий на все сферы нашей жизни.


Лес. Как устроена лесная экосистема

Что такое, в сущности, лес, откуда у людей с ним такая тесная связь? Для человека это не просто источник сырья или зеленый фитнес-центр – лес может стать местом духовных исканий, служить исцелению и просвещению. Биолог, эколог и журналист Адриане Лохнер рассматривает лес с культурно-исторической и с научной точек зрения. Вы узнаете, как устроена лесная экосистема, познакомитесь с различными типами леса, характеризующимися по составу видов деревьев и по условиям окружающей среды, а также с видами лесопользования и с некоторыми аспектами охраны лесов. «Когда видишь зеленые вершины холмов, которые волнами катятся до горизонта, вдруг охватывает оптимизм.