Анализ распределения в Excel - [16]

Шрифт
Интервал

Number — Category — Percentage

Число — Числовые форматы — Процентный


Процентный формат


Подсчитаем остальные относительные частоты. Двойным щелчком по маркеру заполнения копируем формулу в остальные ячейки столбца.

Подсчитаем накопленные относительные частоты. Выделяем столбец относительных честот. Нажимаем кнопку экспресс-анализа. Выбираем вкладку

Totals

Итоги

Пролистаем список функций вправо и нажмём кнопку подсчёта суммы нарастающим итогом ПО СТОЛБЦУ

Running Total

Нарастающий итог


Подсчёт итогов


Перед нами две кнопки подсчёта суммы нарастающим итогом — по строке и по столбцу. На изображении кнопок показаны строка (голубым цветом) и столбец (оранжевым цветом) — см. рисунок.


Суммы нарастающим итогом


Нас интересует работа со столбцом. Если навести курсор на кнопку суммы нарастающим итогом, на экране выводится результат. Если результат нас устраивает, нажимаем на эту кнопку.


Вызов Running Total


В столбце Кумулята появились накопленные частоты. Проверим, как они вычисляются. Выберем любую ячейку в этом столбце и рассмотрим формулу в строке формул:

=SUM ($E$6:E6)

Это сумма содержимого ячеек, начиная с первой относительной частоты.


Формула кумуляты


На этом мы заканчиваем наши расчёты и переходим к построению графиков.

Начинаем с относительных частот. Как мы уже убедились, столбиковые диаграммы в Excel имеют один недостаток: координаты по горизонтальной оси — порядковый номер столбика, а не середина интервала группировки.

Чтобы использовать на графике значения случайной величины, построим второй вид графика относительных частот под названием ПОЛИГОН. Это ломаная линия. Координаты по оси «икс» — середины интервалов, координаты по «игрек» — относительные частоты.

Строим полигон точно так же, как мы строили кумуляту в предыдущем разделе. Под полигоном строим кумуляту — по верхним границам интервалов. Настраиваем размеры и вид обеих диаграмм.


Полигон и кумулята

Гистограмма. Функция COUNTIF

Задание. Самостоятельно постройте гистограмму c использованием функции

COUNTIF (range, criteria)

СЧЁТЕСЛИ (диапазон; критерий)

Сравнение распределения с теоретическим

Сравним построенные графики распределения с теорией в соответствии с вариантом задания.

Начинаем с кумуляты. Вычислим теоретические значения функции распределения. Добавляем новый столбец и озаглавим его Функция распределенияF (x). Для теоретических расчётов используем статистическую функцию

NORM. DIST (x, mean, standard_dev, cumulative)

НОРМ. РАСП (x; среднее; стандартное_откл; интегральная)

x — значение случайной величины

mean — среднее значение

standard_dev — стандартное отклонение

cumulative — выбор графика распределения:

0 — функция плотности вероятности;

1 — функция распределения

Для вычисления теоретических значений функции распределения для нашего варианта задания вводим следующую формулу:

=NORM. DIST (C5,250,20,1).

Копируем формулу в остальные ячейки столбца.

Для сравнения фактического распределения с теоретическим наложим второй график на кумуляту. Щёлкаем правой кнопкой и выбираем

Select Data

Выбрать данные

В окне

Select Data Source

Выбор источника данных

в группе

Legend Entries (Series)

Элементы легенды (ряды)

нажимаем кнопку

Add

Добавить

Данные для второго графика: «иксы» — верхние границы интервалов, «игреки» — теоретические значения функции распределения.

Щёлкаем по линии и настраиваем её тип и цвет:

Format Data Series — Series Options — Fill & Line — Line

Формат ряда данных — Параметры ряда — Заливка и границы — Линия


Solid line

Сплошная линия


Color — Black

Цвет —Чёрный


Width — 1 pt

Ширина — 1 пт


Dash type — Dash

Тип штриха — Штрих


Настройка типа и цвета линии


Графики очень похожи друг на друга, поскольку мы заранее точно знаем закон распределения.


Кумулята и функция распределения


Теперь займёмся полигоном. Определим теоретические значения относительных частот как разность соседних значений функции распределения. Создадим новый столбец и озаглавим его Относительная частота ΔF (x).

Чтобы ввести значок «дельта», выберем в верхнем меню

Insert — Symbols — Symbol

Вставка — Символы — Символ


Вставка символа


Первое значение относительной частоты копируем из соседней ячейки функции распределения. Остальные значения — разность текущего и предыдущего значений функции распределения.


Относительная частота


Накладываем относительные частоты на полигон и настраиваем цвет и тип линии — чёрный пунктир.


Полигон и распределение


На графиках наблюдается небольшое различие — чуть больше, чем в случае с кумулятой. Это случайная погрешность, связанная с ограниченным объёмом выборки. Разница между кумулятой и функцией распределения не так заметна, потому что при вычислении кумуляты происходит суммирование, и случайные ошибки разного знака могут частично компенсировать друг друга.

Задание повышенной сложности. Нанесите на один график гистограмму и кривую плотности вероятности, используя общий масштаб по осям. Это должны быть два набора данных для одной диаграммы. Надеемся что графики будут похожи.

Сравнение графиков

Сравним графики, полученные разными способами.

По очереди скопируем готовые графики в буфер и вставим их на новом листе. Для копирования в буфер Щёлкнем правой кнопкой по графику и выберем в контекстном меню пункт


Еще от автора Валентин Юльевич Арьков
Анализ и визуализация данных в электронных таблицах

Перед вами продолжение серии пособий, позволяющих познакомиться с основными технологиями бизнес-аналитики. Многое можно сделать в рамках электронной таблицы, которая превращается в интуитивно понятный интерфейс к продвинутым инструментам анализа данных. В данной работе мы рассмотрим создание реляционной модели и визуализацию иерархии в агрегированных данных с использованием специализированных надстроек.


Организация параллельных потоков. Часть 1

В данной лабораторной работе рассматриваются основы организации параллельных потоков с помощью стандартных вызовов операционной системы. В работе используется бесплатная интегрированная среда разработки. Приводятся примеры программ на языке Си.


Применение гистограмм в управлении качеством

Гистограмма — это один из самых простых инструментов статистического УПРАВЛЕНИЯ КАЧЕСТВОМ производства. В этой работе будет использоваться пакет Microsoft Excel для создания исходных данных, а также для построения и анализа гистограммы. Можно также использовать любой другой программный инструмент, позволяющий строить гистограммы.


Сетевые коммуникации

Общение в сети ничем особенно не отличается от обычного, прямого общения между людьми. Это такое же общение, то есть обмен словами, мыслями или эмоциями между людьми. Вы сможете практически познакомиться с общими правилами общения в сети на примере такого вроде бы простого действия, как составление отзыва. Если честно выполнить все предложенные задания, можно будет узнать что-то новое — о других и о себе.


Бизнес-аналитика. Сводные таблицы. Часть 1

Сводные таблицы — средство оперативного анализа данных с помощью статистических методов сводки и группировки. Обобщенные итоговые показатели подсчитываются в виде сумм и средних значений. Настройка сводных таблиц делается визуально, без программирования. Каждый метод анализа данных вначале рассматривается на примере смоделированных данных, а затем с использованием реальных данных из интернета.


Бизнес-аналитика. Сводные таблицы. Часть 2

Данная работа посвящена дальнейшему изучению методов бизнес-аналитики на примере «продвинутых» возможностей функций сводных таблиц. Мы продолжаем использовать общий подход к практическому освоению программного пакета: моделирование и исследование. Мы поработаем с генератором случайных чисел и сформируем реалистичные наборы данных для анализа.


Рекомендуем почитать
История географических названий Руси

Книга представляет собой уникальный справочник, в котором собраны сведения по истории географических названий Руси. Данное издание рассчитано на широкий круг читателей и будет интересно как людям, увлекающимся историей России, так и эрудитам, желающим расширить свой кругозор.


«Боевая стрельба из пистолета. Израильский стиль»

В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.


Метод солнечных обращений

В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.


Затаенное имя - Тайнопись в 'Слове о полку Игореве'

В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.


Крестоносцы, Они же татары

В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.


Электрошокеры - осторожно, злая собака!

В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.