Анализ распределения в Excel - [7]

Шрифт
Интервал

Мы будем моделировать различные распределения случайных чисел, чтобы потом на этих данных освоить статистические методы. Для этого «выходные» числа генератора пропускают через различные «фильтры» в виде уравнений. Такой подход называется ИМИТАЦИОННЫМ МОДЕЛИРОВАНИЕМ. Мы строим модель реального объекта или системы, а зетем пропускаем через эту модель различные входные сигналы, наблюдая за поведением модели и её выходными сигналами.

Иногда в литературе и видеороликах ИМИТАЦИОННОЕ МОДЕЛИРОВАНИЕ называют словом СИМУЛЯЦИЯ. Такое заимствование происходит, когда человек вначале изучает материал на английском языке, не зная общепринятой отечественной терминологии. Он встречает слово SIMULATION и записывает его русскими буквами. Это не самый удачный поход к техническому переводу. В конце концов, на этот случай существуют словари и коллеги-специалисты. В русском языке слово СИМУЛЯЦИЯ означает, что здоровый человек притворяется больным и изображает внешние признаки заболевания. С неудачными переводами мы ещё встретимся, и не раз. Рекомендуем относиться к таким ситуациям с пониманием и сочувствием. И не брать с них пример.

После освоения методов обработки данных мы возьмём самые что ни на есть реальные данные на сайтах онлайн магазинов или биржевых брокеров. Здесь можно будет увидеть, как рассмотренные методы работают и насколько полученные результаты отличаются от «красивых», идеальных, приглаженных учебных примеров. Ещё мы на своём опыте почувствуем неприятности, которые подстерегают тех, кто «тупо жмёт на кнопки», не понимая сущности используемых методов.

Моделирование нормального распределения

Для знакомства со стандартными распределениями и статистическим методами смоделируем исходные данные. Генератор случайных чисел позволяет создать выборку заданного объёма, сгенерированную по одному из законов распределения в зависимости от варианта задания. Данные будем располагать в столбцах таблицы. Как мы уже говорили, обработка табличных данных традиционно ориентирована на работу со столбцами, чтобы подсчитывать суммы в нижней строке.

Озаглавим первую колонку x. Каждую колонку лучше озаглавить так, чтобы было понятно, где и что находится. Это полезно при автоматическом формировании графиков и при обработке данных. Читателю такой заголовок поможет понять, что находится в этой колонке. Ну а составителю не помешает такой заголовок, чтобы вспомнить, что он делал неделю или месяц назад. К тому же, при защите работы гораздо проще обсуждать с преподавателем использованную методику и полученные результаты.

Вызываем меню инструментов анализа и выбираем генератор случайных чисел:

Data — Analysis — Data Analysis — Random Number Generation

Данные — Анализ — Анализ данных — Генерация случайных чисел


Вызов генератора


Установим необходимые настройки генератора в диалоговом окне

Random Number Generation

Генерация случайных чисел


Настройка генератора


Нам понадобятся следующие настройки.

Number of Variables

Число переменных

Это количество столбцов, которые будут заполняться случайными числами. Как мы уже говорили, данные в электронной таблице обычно расположены по столбцам. Нам нужен один столбец. Вводим 1.


Number of Random Numbers

Число случайных чисел

Здесь задаём объём выборки n. В нашей таблице это количество строк. В нулевом варианте это 10000.


Distribution — Normal

Распределение — Нормальное

Выбираем нужное распределение из выпадающего списка.


Далее идёт группа настроек

Parameters

Параметры

Это параметры распределения. Для нормального распределения нужно задать среднее значение и сигму.


Mean

Среднее

Задаём среднее значение. Более красивое и грамотное название этого параметра — математическое ожидание. Обозначается греческой буквой «мю». В нулевом варианте среднее равно 250.


Standard deviation

Стандартное отклонение

Указываем значение сигмы. Другие названия этого параметра — стандартное отклонение, среднее квадратическое (квадратичное) отклонение, сокращённо с. к. о. Обозначается греческой буквой «сигма». В нулевом варианте сигма равна 20.


Random Seed

Случайное рассеивание

Вводим любые четыре цифры, например, 1234. Это число определяет начальное состояние генератора псевдослучайных чисел. Так можно определить всю последовательность псевдослучайных чисел. Задавая одно и то же значение параметра, мы каждый раз будем получать один и тот же набор случайных чисел. Поэтому при генерировании новых случайных переменных используйте другие начальные состояния генератора.

СЛУЧАЙНОЕ РАССЕИВАНИЕ — ещё один пример неудачного перевода с английского языка. Это название ни о чём не говорит пользователю, да ещё и сбивает с толка. В данном случае английское слово SEED означает «начальное состояние генератора псевдослучайных чисел». Переводы других терминов тоже будут «креативными». К сожалению, неудачные переводы путешествуют из одной версии пакета в другую почти без изменений. Это особенность программных продуктов. Программы изменяются так быстро, что разработчики физически не успевают исправить все недочёты.

Задание. Поэкспериментируйте с начальной настройкой генератора. Определите максимальное количество десятичных цифр, а затем и максимальное значение этого числа. Попробуйте вводить положительные и отрицательные числа. Сообразите, сколько бит нужно для кодирования такого числа.


Еще от автора Валентин Юльевич Арьков
Анализ и визуализация данных в электронных таблицах

Перед вами продолжение серии пособий, позволяющих познакомиться с основными технологиями бизнес-аналитики. Многое можно сделать в рамках электронной таблицы, которая превращается в интуитивно понятный интерфейс к продвинутым инструментам анализа данных. В данной работе мы рассмотрим создание реляционной модели и визуализацию иерархии в агрегированных данных с использованием специализированных надстроек.


Организация параллельных потоков. Часть 1

В данной лабораторной работе рассматриваются основы организации параллельных потоков с помощью стандартных вызовов операционной системы. В работе используется бесплатная интегрированная среда разработки. Приводятся примеры программ на языке Си.


Применение гистограмм в управлении качеством

Гистограмма — это один из самых простых инструментов статистического УПРАВЛЕНИЯ КАЧЕСТВОМ производства. В этой работе будет использоваться пакет Microsoft Excel для создания исходных данных, а также для построения и анализа гистограммы. Можно также использовать любой другой программный инструмент, позволяющий строить гистограммы.


Сетевые коммуникации

Общение в сети ничем особенно не отличается от обычного, прямого общения между людьми. Это такое же общение, то есть обмен словами, мыслями или эмоциями между людьми. Вы сможете практически познакомиться с общими правилами общения в сети на примере такого вроде бы простого действия, как составление отзыва. Если честно выполнить все предложенные задания, можно будет узнать что-то новое — о других и о себе.


Бизнес-аналитика. Сводные таблицы. Часть 1

Сводные таблицы — средство оперативного анализа данных с помощью статистических методов сводки и группировки. Обобщенные итоговые показатели подсчитываются в виде сумм и средних значений. Настройка сводных таблиц делается визуально, без программирования. Каждый метод анализа данных вначале рассматривается на примере смоделированных данных, а затем с использованием реальных данных из интернета.


Бизнес-аналитика. Сводные таблицы. Часть 2

Данная работа посвящена дальнейшему изучению методов бизнес-аналитики на примере «продвинутых» возможностей функций сводных таблиц. Мы продолжаем использовать общий подход к практическому освоению программного пакета: моделирование и исследование. Мы поработаем с генератором случайных чисел и сформируем реалистичные наборы данных для анализа.


Рекомендуем почитать
Пурпурный. Как один человек изобрел цвет, изменивший мир

Это история об Уильяме Перкине, который случайно изобрел пурпурный цвет. И навсегда изменил мир вокруг себя. До 1856 года красители были исключительно натуральными – их получали из насекомых, моллюсков, корней и листьев, а искусственное окрашивание было кропотливым и дорогим. Но в 1856 году все изменилось. Английский химик, работая над лекарством от малярии в своей домашней лаборатории, случайно открыл способ массового производства красителей на фабриках. Этот эксперимент – или даже ошибка – произвел революцию в моде, химии и промышленности. Эта книга – удивительный рассказ о том, как иногда даже самая маленькая вещь может менять и иметь такое продолжительное и важное воздействие. В формате PDF A4 сохранён издательский дизайн.


Школьное образование и политика британских партий (1870–1997 гг.)

В монографии рассматривается проблема школьного образования в ходе реформ Консервативной, Либеральной и Лейбористской партий с 1870 г. по 1997 г. Охарактеризованы и систематизированы разные типы государственных школ, частных заведений и церковных школ разных конфессий. Повышенное внимание уделено инициативе британских церквей, и в первую очередь государственной Церкви Англии, создавшей основу начального обучения в Англии в XVIII в. и опекавшей специальные заведения для детей с ограниченными возможностями, а также благотворительные женские школы.


Метод солнечных обращений

В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.


Затаенное имя - Тайнопись в 'Слове о полку Игореве'

В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.


Крестоносцы, Они же татары

В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.


Электрошокеры - осторожно, злая собака!

В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.