Анализ распределения в Excel - [12]

Шрифт
Интервал

Chart Output

Вывод графика

Настройка закончена. Нажимаем OK.

Рассматриваем результаты группировки данных.


Результаты группировки


Можно заметить, что ширина столбцов осталась стандартной, и длинные заголовки не умещаются в таких ячейках. Настроим ширину столбцов. Для этого наводим курсор на границу между именами столбцов, и он превращается в указатель границы ячеек (двунаправленную стрелку). Стрелочки влево и вправо намекают, что эту границу можно передвинуть.

Дважды щёлкаем левой кнопкой мыши, и программа автоматически подстраивает ширину левого из двух соседних столбцов. В результате ширина столбца меняется так, чтобы всё содержимое всех ячеек данного столбца было видно на экране и не перекрывалось ячейками справа.

Аналогично настроим ширину остальных «пострадавших» столбцов. Если слова и числа в столбце короткие, то ширина столбца может даже уменьшиться.


Столбцы разной ширины


Рассмотрим полученную таблицу. В ней всего три столбца.

Первый столбец — верхние границы интервалов группировки. В качестве заголовка столбца использован заголовок соответствующего столбца нашей вспомогательной таблицы границ интервалов верх гр.

Второй столбец — абсолютные частоты, то есть число попаданий в интервал:

Frequency

Частота

Третий столбец — накопленные (кумулятивные) относительные чатоты в процентах:

Cumulative %

Интегральный %

Теперь обратим внимание на график. Здесь есть столбики, отдалённо напоминающие стандартную гистограмму. Ширину столбиков придётся дополнительно настроить.

Есть график накопленных частот, который называется КУМУЛЯТА. Про кумуляту мы подробно поговорим чуть позже, когда будем строить её вручную. Пока примем к сведению, что кумулята — это график накопленных относительных частот в процентах. Кумулята — это оценка формы функции распределения по результатам группировки данных.

Для каждого графика имеется своя вертикальная ось, потому что числа слишком уж разные. Вертикальная ось слева — для гистограммы, показывает число единиц, попавших в интервалы. Масштаб от 0 до 1200. Вертикальная ось справа — для кумуляты; здесь указан масштаб в процентах. Ломаная линия накопленных процентов идёт от 0% до 100%.


Гистограмма и кумулята


Займёмся настройкой гистограммы. Дважды щёлкнем по любому столбцу и настроим изображение, как было описано выше: ширина столбика, заливка, линии, цвета.

Настроим график кумуляты. Кроме линии, здесь присутствуют маркеры для каждой точки:. Чтобы убрать маркеры и оставить только линию, щёлкаем по ней и устанавливаем следующие настройки:

Сплошная линия на графике:

Format Data Series — Series Options — Fill & Line — Line — Solid line

Формат ряда данных — Параметры ряда — Заливка и границы — Линия — Сплошная линия

Убираем маркеры точек:

Marker — Marker Options — None

Маркер — Параметры маркера — Нет


Настройка графика кумуляты


Отключаем легенду, и график практически готов.

Chart Elements — Legend

Элементы диаграммы — Легенда


Окончательный вид гистограммы и кумуляты


На графике можно обнаружить следующие особенности.

Появился дополнительный интервал, куда складывают всё, что не попало в наши интервалы:

More

Ещё

Горизонтальная ось в качестве текстовых меток содержит верхние границы интервалов группировки, причём эти метки расположены посередине интервалов. Получается, что значения накопленных частот привязаны к середине интервала, а не к его верхней границе.

По сути, здесь нет масштаба по оси Х, а использованы ПОРЯДКОВЫЕ НОМЕРА столбиков и ТЕКСТОВЫЕ ПОДПИСИ под ними — вместо числовых меток. Чтобы это увидеть, щёлкаем правой кнопкой по графику и выбираем пункт

Select Data

Выбрать данные


Выбор данных


Появляется диалоговое окно

Select Data Source

Выбор источника данных

Можно видеть два ряда данных в разделе

Legend Entries (Series)

Элементы легенды (ряды)

Первый набор данных — Frequency.

Второй набор данных — Cumulative %.

Кроме того, имеется раздел

Horizontal (Category) Axis Labels

Подписи горизонтальной оси (категории)

Здесь указаны метки для горизональной оси: 195, 200, 205 — весь столбец верхних границ.


Данные для графика и метки по горизонтальной оси


Выбираем ряд данных Frequency и нажимаем кнопку

Edit

Изменить


Ряд данных Frequency


Появляется диалоговое окно

Edit Series

Изменение ряда

Здесь есть возможность указать только имя ряда

Series Name

Имя ряда

В нашем примере это поле не заполнено.

Сами данные для графика

Series values

Значения

Здесь указан диапазон ячеек и первые несколько значений:

27, 27, 7210.

Здесь есть только «игреки», а «иксов» для графика нет. Та же картина наблюдается и для графика накопленных частот. В качестве «иксов» на графике использованы ПОРЯДКОВЫЕ НОМЕРА СТОЛБЦОВ, а по горизонтальной оси выводтся текстовые метки вместо масштаба.

Чтобы из полученных таблицы и графика сделать что-то осмысленное и вразумительное, придётся повозиться, и это будет темой следующего раздела.

Гистограмма. Числовые метки

Рассмотрим пример того, как можно улучшить результаты группировки данных с помощью надстройки и приблизить их к требованиям стандартов и здравого смысла.

Для начала создадим копию текущего листа, где нахдятся результаты группировки с помощью надстройки. Напомним, что в нижней части окна Excel расположены вкладки рабочих листов и средства перехода между листами в пределах рабочей книги. Щёлкнем по вкладке текущего листа правой кнопкой мыши и выберем пункт


Еще от автора Валентин Юльевич Арьков
Анализ и визуализация данных в электронных таблицах

Перед вами продолжение серии пособий, позволяющих познакомиться с основными технологиями бизнес-аналитики. Многое можно сделать в рамках электронной таблицы, которая превращается в интуитивно понятный интерфейс к продвинутым инструментам анализа данных. В данной работе мы рассмотрим создание реляционной модели и визуализацию иерархии в агрегированных данных с использованием специализированных надстроек.


Организация параллельных потоков. Часть 1

В данной лабораторной работе рассматриваются основы организации параллельных потоков с помощью стандартных вызовов операционной системы. В работе используется бесплатная интегрированная среда разработки. Приводятся примеры программ на языке Си.


Применение гистограмм в управлении качеством

Гистограмма — это один из самых простых инструментов статистического УПРАВЛЕНИЯ КАЧЕСТВОМ производства. В этой работе будет использоваться пакет Microsoft Excel для создания исходных данных, а также для построения и анализа гистограммы. Можно также использовать любой другой программный инструмент, позволяющий строить гистограммы.


Бизнес-аналитика. Извлечение, преобразование и загрузка данных

Системы бизнес-аналитики работают с различными источниками данных с помощью функций ETL (Extract-Transform-Load). Название ETL можно перевести как «извлечение, преобразование и загрузка данных». Имеется в виду загрузка в хранилище данных для дальнейшей обработки в системе бизнес-аналитики. В простейшем случае это загрузка данных в виде одной, объединённой, консолидированной таблицы. В данной работе мы познакомимся с основными этапами ETL на примере загрузки данных в электронные таблицы.


Организация параллельных потоков. Часть 2

При решении инженерных, экономических и научных задач используются высокопроизводительные вычисления — High Performance Computing или сокращённо HPC. Параллельные программы нужны для того, чтобы использовать вычислительные мощности многоядерных процессоров и графических ускорителей. В данной работе мы рассмотрим технологию автоматической организации параллельных потоков для многоядерных вычислительных машин.


Анализ рядов динамики в электронных таблицах

В данной работе мы рассмотрим раздел «Динамика». Здесь изучают данные, привязанные ко времени. Мы будем опираться на две предыдущие работы: «Анализ распределения (Сводка и группировка)» и «Анализ взаимосвязи (Корреляция и регрессия)». Работа выполняется в пакете типа электронных таблиц. Как и в предыдущих работах, вначале мы сгенерируем случайные числа и поиграем с ними, а затем поработаем с реальными данными.


Рекомендуем почитать
На траверзе — Дакар

Послевоенные годы знаменуются решительным наступлением нашего морского рыболовства на открытые, ранее не охваченные промыслом районы Мирового океана. Одним из таких районов стала тропическая Атлантика, прилегающая к берегам Северо-западной Африки, где советские рыбаки в 1958 году впервые подняли свои вымпелы и с успехом приступили к новому для них промыслу замечательной деликатесной рыбы сардины. Но это было не простым делом и потребовало не только напряженного труда рыбаков, но и больших исследований ученых-специалистов.


Историческое образование, наука и историки сибирской периферии в годы сталинизма

Настоящая монография посвящена изучению системы исторического образования и исторической науки в рамках сибирского научно-образовательного комплекса второй половины 1920-х – первой половины 1950-х гг. Период сталинизма в истории нашей страны характеризуется определенной дихотомией. С одной стороны, это время диктатуры коммунистической партии во всех сферах жизни советского общества, политических репрессий и идеологических кампаний. С другой стороны, именно в эти годы были заложены базовые институциональные основы развития исторического образования, исторической науки, принципов взаимоотношения исторического сообщества с государством, которые определили это развитие на десятилетия вперед, в том числе сохранившись во многих чертах и до сегодняшнего времени.


Интеллигенция в поисках идентичности. Достоевский – Толстой

Монография посвящена проблеме самоидентификации русской интеллигенции, рассмотренной в историко-философском и историко-культурном срезах. Логически текст состоит из двух частей. В первой рассмотрено становление интеллигенции, начиная с XVIII века и по сегодняшний день, дана проблематизация важнейших тем и идей; вторая раскрывает своеобразную интеллектуальную, духовную, жизненную оппозицию Ф. М. Достоевского и Л. Н. Толстого по отношению к истории, статусу и судьбе русской интеллигенции. Оба писателя, будучи людьми диаметрально противоположных мировоззренческих взглядов, оказались “versus” интеллигентских приемов мышления, идеологии, базовых ценностей и моделей поведения.


Князь Евгений Николаевич Трубецкой – философ, богослов, христианин

Монография протоиерея Георгия Митрофанова, известного историка, доктора богословия, кандидата философских наук, заведующего кафедрой церковной истории Санкт-Петербургской духовной академии, написана на основе кандидатской диссертации автора «Творчество Е. Н. Трубецкого как опыт философского обоснования религиозного мировоззрения» (2008) и посвящена творчеству в области религиозной философии выдающегося отечественного мыслителя князя Евгения Николаевича Трубецкого (1863-1920). В монографии показано, что Е.


Технологии против Человека. Как мы будем жить, любить и думать в следующие 50 лет?

Эксперты пророчат, что следующие 50 лет будут определяться взаимоотношениями людей и технологий. Грядущие изобретения, несомненно, изменят нашу жизнь, вопрос состоит в том, до какой степени? Чего мы ждем от новых технологий и что хотим получить с их помощью? Как они изменят сферу медиа, экономику, здравоохранение, образование и нашу повседневную жизнь в целом? Ричард Уотсон призывает задуматься о современном обществе и представить, какой мир мы хотим создать в будущем. Он доступно и интересно исследует возможное влияние технологий на все сферы нашей жизни.


Лес. Как устроена лесная экосистема

Что такое, в сущности, лес, откуда у людей с ним такая тесная связь? Для человека это не просто источник сырья или зеленый фитнес-центр – лес может стать местом духовных исканий, служить исцелению и просвещению. Биолог, эколог и журналист Адриане Лохнер рассматривает лес с культурно-исторической и с научной точек зрения. Вы узнаете, как устроена лесная экосистема, познакомитесь с различными типами леса, характеризующимися по составу видов деревьев и по условиям окружающей среды, а также с видами лесопользования и с некоторыми аспектами охраны лесов. «Когда видишь зеленые вершины холмов, которые волнами катятся до горизонта, вдруг охватывает оптимизм.