Корреляционный и регрессионный анализ в Excel - [2]

Шрифт
Интервал

0,3

0,5

0,7

1,0.

Постройте диаграммы разброса. Укажите на них значения коэффициента корреляции и степень тесноты связи.

Формулы

Вычислите значение коэффициенты линейной корреляции с помощью формул. Используйте соотношение, приведённое ниже.


Коэффициент корреляции


Постройте вспомогательную таблицу и определите суммы, необходимые для расчётов. Для нахождения сумм используйте функцию экспресс-анализа.

Для вычисления коэффициента корреляции используйте функцию извлечения корня:

SQRT (number)

КОРЕНЬ (число).

Сравнение результатов

Скопируйте на новый лист значения коэффициента линейной корреляции, полученные разными способами.

Сделайте выводы о степени тесноты связи и качестве расчётов.

Регрессионный анализ

Регрессионный анализ сводится к построению линии, которая проходит в среднем по исходным точкам, а также к нахождению уравнения этой линии.

Уравнение линейной регрессии приводится ниже.


Линейная регрессия


Регрессионный анализ в Excel проводится следующими способами:

— встроенный элемент диаграммы;

— модуль Регрессия надстройки Анализ данных;

— готовая функция LINEST;

— решение системы нормальных уравнений с помощью формул.

Регрессия на диаграмме

Вызовите встроенную функцию графика, включив Линию тренда как элемент диаграммы разброса, как показано на рисунке:

Trendline — Linear

Линия тренда — Линейный.


Линия тренда


Включите вывод уравнения регрессии на поле графика:

Design — Add Chart Element — Trendline — More Trendline options — Format Trendline — Trendline options — Display Equation on chart

Конструктор — Добавить элемент диаграммы — Линия тренда — Дополнительные параметры линии тренда — Формат линии тренда — Параметры линии тренда — показывать уравнение на диаграмме.


Расположите уравнение на свободном месте графика.

Условное среднее

Рассчитайте условное среднее и нанесите его на диаграмму разброса. Это среднее для значений Y, для которых X попадает в заданный интервал.

Постройте таблицу для группировки данных:

— нижние границы интервалов по X;

— верхние границы интервалов по Х;

— условные средние значения X и Y.

Процедура группировки подробно обсуждается в предыдущей работе [6].

Используйте функцию нахождения условной суммы:

SUMIF (range, criteria, [sum_range])

СУММЕСЛИ (диапазон; критерий; [диапазон_суммирования]).


Первый и второй аргументы относятся к факторному признаку, третий аргумент — к результативному.

Примеры нахождения условных сумм приведены на рисунке.


Условные суммы


Для упрощения выражений можно проверять условие только по верхней границе интервала, а затем находить разность результатов для соседних интервалов.

Вычислите средние значения, поделив суммы на количество единиц в каждой группе.

Размер групп найдите с помощью следующей функции:

COUNTIF

СЧЕТЕСЛИ.


Примеры нахождения условных (групповых) средних для факторного признака приведены ниже.


Групповое среднее Х


Пример определения условного среднего для результативного признака показан на рисунке.


Условное среднее Y (X)


Постройте график условного среднего на диаграмме разброса в виде ломаной линии:

Scatter with Straight Lines

Точечная с прямыми отрезками и маркерами.


Используйте общий масштаб для всех графиков, отключив вспомогательную ось в комбинированной диаграмме.


Условное среднее на диаграмме разброса

Надстройка — линейная регрессия

Запустите надстройку Анализ данных и выберите модуль Регрессия.

Укажите расположение исходных данных — столбцов Y и Х. Снимите выбор следующего пункта:

Constant is Zero

Константа — ноль.


Изучите таблицу с полученными коэффициентами. Запишите уравнение регрессии.

Пользуясь полученным уравнением, нанесите линию регрессии на диаграмму разброса. Для этого определите координаты двух точек в соответствии с уравнением. Настройте оформление графика.


Линейная регрессия


Надстройка — нелинейная регрессия

С помощью надстройки постройте нелинейные уравнения регрессии второго и третьего порядков.


Уравнения регрессии


Постройте дополнительные столбцы для возведения значений факторного признака во вторую и третью степень.

Вызовите надстройку Анализ данных и выберите модуль Регрессия.

В качестве факторного признака укажите два столбца Х — Х>2 для параболы и три столбца Х — Х>2 — Х>3 для кубической параболы.

Для дальнейшего анализа используйте заголовки столбцов, выбрав следующий пункт

Labels

Метки.


Изучите полученные таблицы коэффициентов и запишите уравнения регрессии.

Для построения линии регрессии создайте вспомогательную таблицу и найдите координаты нескольких точек, чтобы получить гладкую линию. Нанесите линии регрессии на диаграмму разброса. Включите легенду на диаграмме.

Оцените относительный вклад (в процентах) каждой степени факторного признака Х в прогнозные значения результативного признака Y по уравнениям регрессии.

Функция LINEST

Получите оценки коэффициентов уравнений регрессии с помощью следующей функции:

LINEST (range_y, range_x)

ЛИНЕЙН (диапазон_y; диапазон_x).


При вводе функции массива используйте следующие шаги:

— введите формулу в одну ячейку;

— выделите диапазон ячеек;

— нажмите клавишу [F2];

— нажмите комбинацию клавиш [Ctrl + Shift + Enter].

Пример вызова функции LINEST показан на рисунке.


Функция


Еще от автора Валентин Юльевич Арьков
Анализ и визуализация данных в электронных таблицах

Перед вами продолжение серии пособий, позволяющих познакомиться с основными технологиями бизнес-аналитики. Многое можно сделать в рамках электронной таблицы, которая превращается в интуитивно понятный интерфейс к продвинутым инструментам анализа данных. В данной работе мы рассмотрим создание реляционной модели и визуализацию иерархии в агрегированных данных с использованием специализированных надстроек.


Организация параллельных потоков. Часть 1

В данной лабораторной работе рассматриваются основы организации параллельных потоков с помощью стандартных вызовов операционной системы. В работе используется бесплатная интегрированная среда разработки. Приводятся примеры программ на языке Си.


Применение гистограмм в управлении качеством

Гистограмма — это один из самых простых инструментов статистического УПРАВЛЕНИЯ КАЧЕСТВОМ производства. В этой работе будет использоваться пакет Microsoft Excel для создания исходных данных, а также для построения и анализа гистограммы. Можно также использовать любой другой программный инструмент, позволяющий строить гистограммы.


Бизнес-аналитика. Извлечение, преобразование и загрузка данных

Системы бизнес-аналитики работают с различными источниками данных с помощью функций ETL (Extract-Transform-Load). Название ETL можно перевести как «извлечение, преобразование и загрузка данных». Имеется в виду загрузка в хранилище данных для дальнейшей обработки в системе бизнес-аналитики. В простейшем случае это загрузка данных в виде одной, объединённой, консолидированной таблицы. В данной работе мы познакомимся с основными этапами ETL на примере загрузки данных в электронные таблицы.


Сетевые коммуникации

Общение в сети ничем особенно не отличается от обычного, прямого общения между людьми. Это такое же общение, то есть обмен словами, мыслями или эмоциями между людьми. Вы сможете практически познакомиться с общими правилами общения в сети на примере такого вроде бы простого действия, как составление отзыва. Если честно выполнить все предложенные задания, можно будет узнать что-то новое — о других и о себе.


Бизнес-аналитика. Сводные таблицы. Часть 2

Данная работа посвящена дальнейшему изучению методов бизнес-аналитики на примере «продвинутых» возможностей функций сводных таблиц. Мы продолжаем использовать общий подход к практическому освоению программного пакета: моделирование и исследование. Мы поработаем с генератором случайных чисел и сформируем реалистичные наборы данных для анализа.


Рекомендуем почитать
Журнал "Домашняя лаборатория", 2006 №12

Большой и увлекательный, научно-прикладной и образовательный, но некоммерческий интернет-журнал, созданный группой энтузиастов. Интернет-журнал содержит материалы, найденные в Интернет или написанные для Интернет. Основная тематика статей — то, что можно сделать самому, от садовых поделок до сверхпроводников, но есть и просто полезные материалы.


Парфянское царство

Крупнейший американский историк Нельсон Дибвойз по крупицам, основываясь на свидетельствах античных авторов, данных археологии и нумизматики, воссоздал историю одной из величайших империй древности — Парфянского царства. В лучшую пору своего существования Парфия вбирала в себя территории современных Ирана, Ирака, Афганистана, Пакистана и Туркменистана и соперничала с другой великой империей — Римской. Весной 53 года до н. э. парфяне в битве при Каррах нанесли жестокое поражение римской армии Марка Лициния Красса и к 40 году до н. э.


О науке без звериной серьёзности

О чем это? • о ключевых словах современной науки; • о самых страшных экспериментах; • о сущности цивилизации. «Любому человеку нужен просто разговор – о важном, научном. Это задача научных журналистов. И один из самых ярких, самых ясных, самых ответственных – Григорий Тарасевич». Александр Архангельский, телеведущий, писатель, профессор Высшей школы экономики «…Книга вызывает множество противоречивых чувств: с рядом моментов хочется спорить, от большинства историй смеялась в голос, а от некоторых глав становилось безумно грустно».


Рекордсмены запрещенного советского кино (1951-1991) в зеркале кинокритики зрительских мнений

В монографии дается широкая панорама мнений киноведов, кинокритиков и зрителей о полнометражных игровых советских фильмах (1951–1991), которые были на длительные сроки (свыше пяти лет) запрещены к показу в кинотеатрах и по телевидению. Для студентов вузов, аспирантов, преподавателей, учителей, широкой аудитории, интересующейся историей кинематографа.


Мы и планета

«Настоящий популярный справочник содержит данные о развитии народного хозяйства и о важнейших событиях в истории СССР за 50 лет. Во втором издании приведены данные за 1967 г., ряд разделов дополнен новыми материалами, некоторые данные уточнены в соответствии с новыми публикациями. Цифры по СССР сравниваются с данными, характеризующими состояние экономики капиталистических и социалистических стран, развитие мирового хозяйства. Цифровой материал наглядно свидетельствует об успехах Советского Союза в строительстве материально-технической базы коммунистического общества, в повышении благосостояния трудящихся, в успешном выполнении заданий пятилетнего плана. Статистические данные по Советскому Союзу приведены по материалам, опубликованным в официальных изданиях ЦСУ СССР, в центральных органах печати.


Чьи следы зашифрованы на плато Наска

В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.