Корреляционный и регрессионный анализ в Excel

Корреляционный и регрессионный анализ в Excel

Методические указания к выполнению лабораторной работы на тему «Корреляция и регрессия». Работа выполняется в пакете Microsoft Excel.

Жанры: Научная литература, Компьютерная литература
Серии: -
Всего страниц: 3
ISBN: -
Год издания: 2019
Формат: Полный

Корреляционный и регрессионный анализ в Excel читать онлайн бесплатно

Шрифт
Интервал

© Валентин Юльевич Арьков, 2019


ISBN 978-5-0050-4576-8

Создано в интеллектуальной издательской системе Ridero

Предисловие

Данная лабораторная работа позволяет освоить базовые методы исследования взаимосвязей в электронной таблице — корреляционный и регрессионный анализ.

При выполнении лабораторной работы используются знания и навыки, полученные на предыдущих занятиях.

Условные обозначения:

— жирный шрифт — названия функций и пунктов меню;

— КНОПКИ на экране компьютера;

— КЛАВИШИ на клавиатуре компьютера.

Описывается работа в англоязычной версии Microsoft Excel из пакета Office 365. В тексте приводятся названия пунктов меню и функций на английском и на русском языках. На рисунках используется английская версия пакета.

Введение

В данной лабораторной работе рассматривается корреляционная зависимость, или корреляция [1—4].

В работе для изучения взаимосвязи используются методы корреляционного и регрессионного анализа, а также сводка и группировка данных. Работа выполняется в пакете Excel [5].

Корреляционный анализ позволяет оценить степень тесноты связи. Регрессионный анализ используется для построения линейных и нелинейных моделей.

На первом этапе исходные данные получают путём имитационного моделирования. На втором этапе проводится анализ реальных данных.

Требования к оформлению отчёта приведены в описании предыдущей лабораторной работы [6].

Общие сведения

Корреляция — это связь между двумя случайными величинами, которые часто называют следующим образом:

X — факторный признак;

Y — результативный признак.

Изображение исходных данных называется диаграммой разброса. Каждая пара чисел X и Y изображается отдельной точкой. Точки между собой не соединяют.

Пример диаграммы разброса для корреляционной зависимости показан на рисунке ниже.


Корреляция

Варианты задания

Варианты заданий представлены в таблицах.

В каждом варианте рассматриваются два набора данных — примеры линейной и нелинейной регрессии. Анализ проводится для обоих случаев.

Факторный признак Х — случайная величина с равномерным распределением.

Случайная составляющая Е — случайная величина со стандартным нормальным распределением (нулевое среднее и единичная дисперсия).

Результативный признак Y вычисляется по формуле.

Объём выборки n = 200.



На новом листе опишите вариант задания.


Зарисовки функций

Сделайте зарисовки общей формы зависимости и диаграммы разброса на бумаге. Вставьте зарисовку в отчёт.

Для построения линейной функции оцените значения на границах диапазона значений факторного признака. Оцените случайный разброс по правилу трёх сигм.


Зарисовка линейной функции


Для зарисовки графика параболы дополнительно определите координаты её вершины кривой и направление ветвей.

Выберите масштаб так, чтобы данные занимали всё поле графика. Метки на осях должны быть круглыми числами.


Зарисовка нелинейной функции

Исходные данные

Сгенерируйте исходные данные в соответствии c вариантом задания.

Вызовите надстройку:

Data Analysis

Анализ данных.


Используйте функцию:

Random Number Generation

Генерация случайных чисел.


Округлите сгенерированные числа до целых.

Задавайте разные начальные состояния генератора для получения фактора Х и случайной составляющей Е.

Для округления используйте функцию

ROUND (number, num_digits)

ОКРУГЛ (число; число разрядов).


Для округления до целых укажите нулевое число разрядов после запятой.

В отчёте опишите параметры генератора случайных чисел.

В дальнейшей работе используйте округлённые значения Х и Y.

Диаграмма разброса

Постройте диаграмму разброса:

Insert — Charts — Insert Scatter (X, Y) or Bubble Chart — Scatter — Scatter

Вставка — Диаграммы — Вставить точечную (X, Y) или пузырьковую диаграмму — Точечная — Точечная.

Настройте оформление графика. Задайте масштаб и информативные заголовки. Пример оформления показан на рисунке.


Оформление графика


В отчёте опишите внешний вид графиков.

Корреляционный анализ

Корреляционный анализ — это изучение степени тесноты связи.

Коэффициент линейной корреляции — это показатель степени линейной связи и разброса точек вокруг прямой линии. Знак коэффициента говорит о направлении связи, а величина коэффициента — о степени тесноты линейной зависимости.

Для вычисления коэффициента корреляции используйте следующие способы:

— надстройка Анализ данных;

— готовая функция CORREL;

— формулы, вводимые вручную.

Надстройка

Вызовите надстройку Анализ данных и выберите модуль Корреляция.

Задайте диапазоны исходных данных и укажите, что они расположены по столбцам:

Grouped By — Columns

Группирование — по столбцам.


С помощью надстройки получите таблицу коэффициентов линейной корреляции. Настройте ширину столбца, чтобы увеличить точность представления результата.

Опишите в отчёте полученные результаты.

Функция CORREL

Вычислите коэффициент корреляции с помощью следующей функции:

CORREL (array1, array2)

КОРРЕЛ (диапазон_x; диапазон_y).


В качестве аргументов функции укажите диапазоны ячеек факторного и результативного признаков.

Изучите внешний вид диаграмм разброса в зависимости от коэффициента корреляции. Для этого на новом листе сгенерируйте наборы данных и подберите значения множителя S в уравнении, чтобы получить следующие значения коэффициента корреляции:


Еще от автора Валентин Юльевич Арьков
Анализ и визуализация данных в электронных таблицах

Перед вами продолжение серии пособий, позволяющих познакомиться с основными технологиями бизнес-аналитики. Многое можно сделать в рамках электронной таблицы, которая превращается в интуитивно понятный интерфейс к продвинутым инструментам анализа данных. В данной работе мы рассмотрим создание реляционной модели и визуализацию иерархии в агрегированных данных с использованием специализированных надстроек.


Организация параллельных потоков. Часть 1

В данной лабораторной работе рассматриваются основы организации параллельных потоков с помощью стандартных вызовов операционной системы. В работе используется бесплатная интегрированная среда разработки. Приводятся примеры программ на языке Си.


Применение гистограмм в управлении качеством

Гистограмма — это один из самых простых инструментов статистического УПРАВЛЕНИЯ КАЧЕСТВОМ производства. В этой работе будет использоваться пакет Microsoft Excel для создания исходных данных, а также для построения и анализа гистограммы. Можно также использовать любой другой программный инструмент, позволяющий строить гистограммы.


Бизнес-аналитика. Извлечение, преобразование и загрузка данных

Системы бизнес-аналитики работают с различными источниками данных с помощью функций ETL (Extract-Transform-Load). Название ETL можно перевести как «извлечение, преобразование и загрузка данных». Имеется в виду загрузка в хранилище данных для дальнейшей обработки в системе бизнес-аналитики. В простейшем случае это загрузка данных в виде одной, объединённой, консолидированной таблицы. В данной работе мы познакомимся с основными этапами ETL на примере загрузки данных в электронные таблицы.


Анализ распределения в Excel

Учебное пособие позволяет освоить базовые методы статистического анализа распределения с помощью сводки и группировки данных в пакете Microsoft Excel. Практическое знакомство происходит подробно, шаг за шагом, с примерами и комментариями. Попутно можно улучшить навыки работы в Excel, что само по себе уже полезно как элемент современной компьютерной грамотности.


Организация параллельных потоков. Часть 2

При решении инженерных, экономических и научных задач используются высокопроизводительные вычисления — High Performance Computing или сокращённо HPC. Параллельные программы нужны для того, чтобы использовать вычислительные мощности многоядерных процессоров и графических ускорителей. В данной работе мы рассмотрим технологию автоматической организации параллельных потоков для многоядерных вычислительных машин.


Рекомендуем почитать
Маленькая птичка

Лоуренс Миддлвей полюбил Оливию с первого взгляда. Он просто не мог отвести глаз от этой своенравной огненно-рыжей незнакомки. Но добиться взаимности от независимой и гордой Оливии непросто даже такому красавцу и богачу, как Миддлвей. Да и сможет ли свободолюбивая маленькая птичка жить в золотой клетке?


Несколько слов о музыке

В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.


Альфа Эридана

Рассказ о космических буднях девятого тысячелетия. Герой рассказа, космонавт-релятивист, вернувшийся на Землю через шесть тысяч лет после старта, отправляется в новую экспедицию к Альфа Эридана.


Мой возлюбленный vampire…

Вампиры — таинственные, могущественные, опасные и невыразимо притягательные. Что, если однажды ты встретишь одного из них и влюбишься без оглядки, навсегда? Сможешь ли отказаться от родителей, друзей, привычной жизни? Станешь ли вечной подругой Рыцарю Ночи?..Герои этой книги сделали выбор. Но каждый по-своему…Читай в сборнике мистические повести Елены Усачёвой, Ярославы Лазаревой и Екатерины Неволиной!


На траверзе — Дакар

Послевоенные годы знаменуются решительным наступлением нашего морского рыболовства на открытые, ранее не охваченные промыслом районы Мирового океана. Одним из таких районов стала тропическая Атлантика, прилегающая к берегам Северо-западной Африки, где советские рыбаки в 1958 году впервые подняли свои вымпелы и с успехом приступили к новому для них промыслу замечательной деликатесной рыбы сардины. Но это было не простым делом и потребовало не только напряженного труда рыбаков, но и больших исследований ученых-специалистов.


Историческое образование, наука и историки сибирской периферии в годы сталинизма

Настоящая монография посвящена изучению системы исторического образования и исторической науки в рамках сибирского научно-образовательного комплекса второй половины 1920-х – первой половины 1950-х гг. Период сталинизма в истории нашей страны характеризуется определенной дихотомией. С одной стороны, это время диктатуры коммунистической партии во всех сферах жизни советского общества, политических репрессий и идеологических кампаний. С другой стороны, именно в эти годы были заложены базовые институциональные основы развития исторического образования, исторической науки, принципов взаимоотношения исторического сообщества с государством, которые определили это развитие на десятилетия вперед, в том числе сохранившись во многих чертах и до сегодняшнего времени.


Интеллигенция в поисках идентичности. Достоевский – Толстой

Монография посвящена проблеме самоидентификации русской интеллигенции, рассмотренной в историко-философском и историко-культурном срезах. Логически текст состоит из двух частей. В первой рассмотрено становление интеллигенции, начиная с XVIII века и по сегодняшний день, дана проблематизация важнейших тем и идей; вторая раскрывает своеобразную интеллектуальную, духовную, жизненную оппозицию Ф. М. Достоевского и Л. Н. Толстого по отношению к истории, статусу и судьбе русской интеллигенции. Оба писателя, будучи людьми диаметрально противоположных мировоззренческих взглядов, оказались “versus” интеллигентских приемов мышления, идеологии, базовых ценностей и моделей поведения.


Князь Евгений Николаевич Трубецкой – философ, богослов, христианин

Монография протоиерея Георгия Митрофанова, известного историка, доктора богословия, кандидата философских наук, заведующего кафедрой церковной истории Санкт-Петербургской духовной академии, написана на основе кандидатской диссертации автора «Творчество Е. Н. Трубецкого как опыт философского обоснования религиозного мировоззрения» (2008) и посвящена творчеству в области религиозной философии выдающегося отечественного мыслителя князя Евгения Николаевича Трубецкого (1863-1920). В монографии показано, что Е.


Технологии против Человека. Как мы будем жить, любить и думать в следующие 50 лет?

Эксперты пророчат, что следующие 50 лет будут определяться взаимоотношениями людей и технологий. Грядущие изобретения, несомненно, изменят нашу жизнь, вопрос состоит в том, до какой степени? Чего мы ждем от новых технологий и что хотим получить с их помощью? Как они изменят сферу медиа, экономику, здравоохранение, образование и нашу повседневную жизнь в целом? Ричард Уотсон призывает задуматься о современном обществе и представить, какой мир мы хотим создать в будущем. Он доступно и интересно исследует возможное влияние технологий на все сферы нашей жизни.


Лес. Как устроена лесная экосистема

Что такое, в сущности, лес, откуда у людей с ним такая тесная связь? Для человека это не просто источник сырья или зеленый фитнес-центр – лес может стать местом духовных исканий, служить исцелению и просвещению. Биолог, эколог и журналист Адриане Лохнер рассматривает лес с культурно-исторической и с научной точек зрения. Вы узнаете, как устроена лесная экосистема, познакомитесь с различными типами леса, характеризующимися по составу видов деревьев и по условиям окружающей среды, а также с видами лесопользования и с некоторыми аспектами охраны лесов. «Когда видишь зеленые вершины холмов, которые волнами катятся до горизонта, вдруг охватывает оптимизм.