Компьютерный практикум Анализ данных Вариант 4 Ответ
.docxМИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ ДНР
ГОУ ВПО «ДОНЕЦКАЯ АКАДЕМИЯ УПРАВЛЕНИЯ И ГОСУДАРСТВЕННОЙ СЛУЖБЫ ПРИ ГЛАВЕ ДНР»
Кафедра информационных технологий
Индивидуальная работа №1
по теме: «Анализ данных в MS EXCEL»
Вариант № 4
Выполнил: студент группы МП-20
Быковский Б.М.
Проверил: к.э.н., доцент Стешенко И.В.
Донецк, 2021 год
Оглавление
Описательная статистика 4
Оценка взаимосвязи 4
Корреляция 4
Регрессия 5
Множественная линейная регрессия 6
График зависимости 7
Предсказ 8
Тенденция 9
Описательная статистика
Рис.1 Описательная статистика
Выполнена описательная статистика совокупности данных стоимости помещения.
(Рисунок 1,2). При помощи Сервис – Анализ данных – Описательная статистика.
Оценка взаимосвязи
Корреляция
Рис. 2 Корреляция
На рисунке 2 выполнена оценка взаимосвязи и взаимное влияние прибыли от объема продаж. Прибыль к объему продаж, равна 0,9 что находится близко к нулю, это значит, что зависимость между данными величинами сильная, и носит линейный характер.
Рис. 3 Корреляция с учётом цены за шт.
- коэффициент корреляции объёма продаж равен 1;
- цена за шт. сильно связана с объёмом продаж, коэффициент корреляции равен 0,85;
- прибыль сильно связана с объёмом продаж и равняется 0,98
- прибыль сильно связана с ценой за штуку (коэффициент корреляции 0,81);
Регрессия
Рис. 4 Регрессия
Прибыль = 0,13264+ Объем продаж
у = 0,13264х – 2922,18
Для анализа адекватности полученного уравнения линейной регрессии в MS Excel используют параметры (см. рис. 4): коэффициент множественной корреляции (множественный R); коэффициент детерминации (R-квадрат); критерий Фишера (F-статистика); критерий Стьюдента (t-статистика).
Множественной корреляции R=0,982 говорит о сильной степени связи переменных общая площадь помещения и стоимость помещения. Однако, характер этой связи пока неясен.
Величина квадрата R2(RI) составляет 96,4%, что говорит о том, что имеющиеся статистические данные с высокой степенью точности описаны полученным уравнением регрессии.
F-статистика (критерий Фишера) F=163,168; df=1,6; p=0,326, то есть вероятность отвергнуть верную гипотезу о незначимости коэффициента при независимой переменной составляет 0,32%.
Значение t-статистики (критерий Стьюдента). В задаче для свободного члена t= -1,069; p=0,32, то есть вероятность отвергнуть верную гипотезу о незначимости свободного члена находится близко к нулю. Для коэффициента при неизвестной t=12,773; p=1,413, то есть вероятность отвергнуть верную гипотезу о незначимости коэффициента при неизвестной составляет 1,4%.
Таким образом, проанализировав все четыре вышеназванных параметра можно сделать вывод об адекватности полученного уравнения линейной регрессии.
Множественная линейная регрессия
Рис. 5
По этим результатам может быть построено следующее уравнение регрессии:
CP = 0,14174 – 1357,8 + 25049,348
или
y = 0,14174x1 – 13,57,8x2 + 25049,348
Коэффициент множественной корреляции R = 0,982 говорит о средней степени связи переменных ЦЕНА ЗА ШТУКУ, лет и ПРИБЫЛЬ. Однако, характер этой связи пока неясен.
Коэффициент детерминации R2(RI) 96,6%, что говорит о том, что имеющиеся статистические данные с высокой степенью точности могут быть описаны полученным уравнением регрессии.
F-статистика. Для задачи F=71,607; df=2,5; p=0,669, вероятность отвергнуть верную гипотезу о незначимости коэффициента при независимой переменной составляет 0,66%.
t-статистика t=0,453; p=0,669, то есть вероятность отвергнуть верную гипотезу о незначимости свободного члена практически равна нулю. Для коэффициента при неизвестной t=6717; p=0,001, то есть вероятность отвергнуть верную гипотезу о незначимости коэффициента при неизвестной составляет 0,001%. Для коэффициента при неизвестной t=-0,506; p=0,633, то есть вероятность отвергнуть верную гипотезу о незначимости коэффициента при неизвестной составляет 0,63%.
График зависимости
Рис. 6 Линейная
Рис. 7 Полиоминальная линия тренда 4-й степени
На рисунке 7 изображена полиоминальная линия тренда четвёртой степени. Эта линия тренда немногим лучше описывает процесс, чем линейная так как R2 больше приближен к единице по сравнению с линейной. А если быть точнее, то R2 =0,97.
Рис. 8 Прогнозирующая линия
На рисунке 8 изображена линия тренда с прогнозом прибыли при объёме продаж 390000, 400000, 450000, 500000. Из рисунка видно, что прогноз, который строится по предшествующим данным при увеличении объёма продаж, показывает стабильное повышение прибыли.
Предсказ
Рис. 9 Предсказ
На рисунке 9 сделан ПРЕДСКАЗ() для прогнозирования прибыли при новом объёме продаж 390000, 400000, 450000, 500000.
Тенденция
Рис. 10 Тенденция
Используя массив и формулу ТЕНДЕНЦИЯ() (рис. 10) была спрогнозирована прибыль при новом объёме продаж 390000, 400000, 450000, 500000 с учетом цены за штуку.