Корреляционный и регрессионный анализ в Excel - [2]
0,3
0,5
0,7
1,0.
Постройте диаграммы разброса. Укажите на них значения коэффициента корреляции и степень тесноты связи.
Формулы
Вычислите значение коэффициенты линейной корреляции с помощью формул. Используйте соотношение, приведённое ниже.
Коэффициент корреляции
Постройте вспомогательную таблицу и определите суммы, необходимые для расчётов. Для нахождения сумм используйте функцию экспресс-анализа.
Для вычисления коэффициента корреляции используйте функцию извлечения корня:
SQRT (number)
КОРЕНЬ (число).
Сравнение результатов
Скопируйте на новый лист значения коэффициента линейной корреляции, полученные разными способами.
Сделайте выводы о степени тесноты связи и качестве расчётов.
Регрессионный анализ
Регрессионный анализ сводится к построению линии, которая проходит в среднем по исходным точкам, а также к нахождению уравнения этой линии.
Уравнение линейной регрессии приводится ниже.
Линейная регрессия
Регрессионный анализ в Excel проводится следующими способами:
— встроенный элемент диаграммы;
— модуль Регрессия надстройки Анализ данных;
— готовая функция LINEST;
— решение системы нормальных уравнений с помощью формул.
Регрессия на диаграмме
Вызовите встроенную функцию графика, включив Линию тренда как элемент диаграммы разброса, как показано на рисунке:
Trendline — Linear
Линия тренда — Линейный.
Линия тренда
Включите вывод уравнения регрессии на поле графика:
Design — Add Chart Element — Trendline — More Trendline options — Format Trendline — Trendline options — Display Equation on chart
Конструктор — Добавить элемент диаграммы — Линия тренда — Дополнительные параметры линии тренда — Формат линии тренда — Параметры линии тренда — показывать уравнение на диаграмме.
Расположите уравнение на свободном месте графика.
Условное среднее
Рассчитайте условное среднее и нанесите его на диаграмму разброса. Это среднее для значений Y, для которых X попадает в заданный интервал.
Постройте таблицу для группировки данных:
— нижние границы интервалов по X;
— верхние границы интервалов по Х;
— условные средние значения X и Y.
Процедура группировки подробно обсуждается в предыдущей работе [6].
Используйте функцию нахождения условной суммы:
SUMIF (range, criteria, [sum_range])
СУММЕСЛИ (диапазон; критерий; [диапазон_суммирования]).
Первый и второй аргументы относятся к факторному признаку, третий аргумент — к результативному.
Примеры нахождения условных сумм приведены на рисунке.
Условные суммы
Для упрощения выражений можно проверять условие только по верхней границе интервала, а затем находить разность результатов для соседних интервалов.
Вычислите средние значения, поделив суммы на количество единиц в каждой группе.
Размер групп найдите с помощью следующей функции:
COUNTIF
СЧЕТЕСЛИ.
Примеры нахождения условных (групповых) средних для факторного признака приведены ниже.
Групповое среднее Х
Пример определения условного среднего для результативного признака показан на рисунке.
Условное среднее Y (X)
Постройте график условного среднего на диаграмме разброса в виде ломаной линии:
Scatter with Straight Lines
Точечная с прямыми отрезками и маркерами.
Используйте общий масштаб для всех графиков, отключив вспомогательную ось в комбинированной диаграмме.
Условное среднее на диаграмме разброса
Надстройка — линейная регрессия
Запустите надстройку Анализ данных и выберите модуль Регрессия.
Укажите расположение исходных данных — столбцов Y и Х. Снимите выбор следующего пункта:
Constant is Zero
Константа — ноль.
Изучите таблицу с полученными коэффициентами. Запишите уравнение регрессии.
Пользуясь полученным уравнением, нанесите линию регрессии на диаграмму разброса. Для этого определите координаты двух точек в соответствии с уравнением. Настройте оформление графика.
Линейная регрессия
Надстройка — нелинейная регрессия
С помощью надстройки постройте нелинейные уравнения регрессии второго и третьего порядков.
Уравнения регрессии
Постройте дополнительные столбцы для возведения значений факторного признака во вторую и третью степень.
Вызовите надстройку Анализ данных и выберите модуль Регрессия.
В качестве факторного признака укажите два столбца Х — Х>2 для параболы и три столбца Х — Х>2 — Х>3 для кубической параболы.
Для дальнейшего анализа используйте заголовки столбцов, выбрав следующий пункт
Labels
Метки.
Изучите полученные таблицы коэффициентов и запишите уравнения регрессии.
Для построения линии регрессии создайте вспомогательную таблицу и найдите координаты нескольких точек, чтобы получить гладкую линию. Нанесите линии регрессии на диаграмму разброса. Включите легенду на диаграмме.
Оцените относительный вклад (в процентах) каждой степени факторного признака Х в прогнозные значения результативного признака Y по уравнениям регрессии.
Функция LINEST
Получите оценки коэффициентов уравнений регрессии с помощью следующей функции:
LINEST (range_y, range_x)
ЛИНЕЙН (диапазон_y; диапазон_x).
При вводе функции массива используйте следующие шаги:
— введите формулу в одну ячейку;
— выделите диапазон ячеек;
— нажмите клавишу [F2];
— нажмите комбинацию клавиш [Ctrl + Shift + Enter].
Пример вызова функции LINEST показан на рисунке.
Функция
![Анализ и визуализация данных в электронных таблицах](/storage/book-covers/da/dace9e7ca56db3578a8d8e1c2818dd5c4533a796.jpg)
Перед вами продолжение серии пособий, позволяющих познакомиться с основными технологиями бизнес-аналитики. Многое можно сделать в рамках электронной таблицы, которая превращается в интуитивно понятный интерфейс к продвинутым инструментам анализа данных. В данной работе мы рассмотрим создание реляционной модели и визуализацию иерархии в агрегированных данных с использованием специализированных надстроек.
![Организация параллельных потоков. Часть 1](/storage/book-covers/76/76a00c91e9701e7b2d8f2681152926246f26ca57.jpg)
В данной лабораторной работе рассматриваются основы организации параллельных потоков с помощью стандартных вызовов операционной системы. В работе используется бесплатная интегрированная среда разработки. Приводятся примеры программ на языке Си.
![Применение гистограмм в управлении качеством](/storage/book-covers/5c/5ca303ea182ec86ac1b4bbd28295ae7ddd8ace17.jpg)
Гистограмма — это один из самых простых инструментов статистического УПРАВЛЕНИЯ КАЧЕСТВОМ производства. В этой работе будет использоваться пакет Microsoft Excel для создания исходных данных, а также для построения и анализа гистограммы. Можно также использовать любой другой программный инструмент, позволяющий строить гистограммы.
![Бизнес-аналитика. Извлечение, преобразование и загрузка данных](/storage/book-covers/8e/8e2277955a215770165fc3e74215d279f613edb0.jpg)
Системы бизнес-аналитики работают с различными источниками данных с помощью функций ETL (Extract-Transform-Load). Название ETL можно перевести как «извлечение, преобразование и загрузка данных». Имеется в виду загрузка в хранилище данных для дальнейшей обработки в системе бизнес-аналитики. В простейшем случае это загрузка данных в виде одной, объединённой, консолидированной таблицы. В данной работе мы познакомимся с основными этапами ETL на примере загрузки данных в электронные таблицы.
![Сетевые коммуникации](/storage/book-covers/2c/2c446fc04c66a49ebe5542be580f8aa2e7acbf1f.jpg)
Общение в сети ничем особенно не отличается от обычного, прямого общения между людьми. Это такое же общение, то есть обмен словами, мыслями или эмоциями между людьми. Вы сможете практически познакомиться с общими правилами общения в сети на примере такого вроде бы простого действия, как составление отзыва. Если честно выполнить все предложенные задания, можно будет узнать что-то новое — о других и о себе.
![Бизнес-аналитика. Сводные таблицы. Часть 2](/storage/book-covers/33/331d0f23f5864d37c94ff5c61186aec63926ea2a.jpg)
Данная работа посвящена дальнейшему изучению методов бизнес-аналитики на примере «продвинутых» возможностей функций сводных таблиц. Мы продолжаем использовать общий подход к практическому освоению программного пакета: моделирование и исследование. Мы поработаем с генератором случайных чисел и сформируем реалистичные наборы данных для анализа.
![Журнал "Домашняя лаборатория", 2006 №12](/storage/book-covers/a6/a6733267496a65cd411f9c072a73a063665c203a.jpg)
Большой и увлекательный, научно-прикладной и образовательный, но некоммерческий интернет-журнал, созданный группой энтузиастов. Интернет-журнал содержит материалы, найденные в Интернет или написанные для Интернет. Основная тематика статей — то, что можно сделать самому, от садовых поделок до сверхпроводников, но есть и просто полезные материалы.
![Парфянское царство](/storage/book-covers/2f/2f4bfca0e1310f56db880338352b416176e85832.jpg)
Крупнейший американский историк Нельсон Дибвойз по крупицам, основываясь на свидетельствах античных авторов, данных археологии и нумизматики, воссоздал историю одной из величайших империй древности — Парфянского царства. В лучшую пору своего существования Парфия вбирала в себя территории современных Ирана, Ирака, Афганистана, Пакистана и Туркменистана и соперничала с другой великой империей — Римской. Весной 53 года до н. э. парфяне в битве при Каррах нанесли жестокое поражение римской армии Марка Лициния Красса и к 40 году до н. э.
![О науке без звериной серьёзности](/storage/book-covers/73/7306aa2474122e99f8152922037d85f58b76b18f.jpg)
О чем это? • о ключевых словах современной науки; • о самых страшных экспериментах; • о сущности цивилизации. «Любому человеку нужен просто разговор – о важном, научном. Это задача научных журналистов. И один из самых ярких, самых ясных, самых ответственных – Григорий Тарасевич». Александр Архангельский, телеведущий, писатель, профессор Высшей школы экономики «…Книга вызывает множество противоречивых чувств: с рядом моментов хочется спорить, от большинства историй смеялась в голос, а от некоторых глав становилось безумно грустно».
![Рекордсмены запрещенного советского кино (1951-1991) в зеркале кинокритики зрительских мнений](/storage/book-covers/59/594daae5c387192ab5c716752bcb868452f028ca.jpg)
В монографии дается широкая панорама мнений киноведов, кинокритиков и зрителей о полнометражных игровых советских фильмах (1951–1991), которые были на длительные сроки (свыше пяти лет) запрещены к показу в кинотеатрах и по телевидению. Для студентов вузов, аспирантов, преподавателей, учителей, широкой аудитории, интересующейся историей кинематографа.
![Мы и планета](/storage/book-covers/36/36fdab19b181550685f1d064a6ab48376ecb3aea.jpg)
«Настоящий популярный справочник содержит данные о развитии народного хозяйства и о важнейших событиях в истории СССР за 50 лет. Во втором издании приведены данные за 1967 г., ряд разделов дополнен новыми материалами, некоторые данные уточнены в соответствии с новыми публикациями. Цифры по СССР сравниваются с данными, характеризующими состояние экономики капиталистических и социалистических стран, развитие мирового хозяйства. Цифровой материал наглядно свидетельствует об успехах Советского Союза в строительстве материально-технической базы коммунистического общества, в повышении благосостояния трудящихся, в успешном выполнении заданий пятилетнего плана. Статистические данные по Советскому Союзу приведены по материалам, опубликованным в официальных изданиях ЦСУ СССР, в центральных органах печати.
![Чьи следы зашифрованы на плато Наска](/build/oblozhka.dc6e36b8.jpg)
В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.