21. Оценка надежности результатов множественной регрессии и корреляции. Частный f-критерий
Значимость уравнения множественной регрессии в целом, также как и в парной регрессии, оценивается с помощью F-критерия Фишера:
где D факт - факторная сумма квадратов на одну степень свободы;
D ост - остаточная сумма квадратов на одну степень свободы;
R2 -индекс множественной детерминации;
m -число параметров при переменных х
п - число наблюдений.
Оценивается значимость не только уравнения в целом, но и фактора, дополнительно включенного в регрессионную модель. Необходимость такой оценки связана с тем, что не каждый фактор, вошедший в модель, может существенно увеличивать долю объясненной вариации результативного признака. Кроме того, при наличии в модели нескольких факторов они могут вводиться в модель в разной последовательности. Ввиду корреляции между факторами значимость одного и того же фактора может быть разной в зависимости от последовательности его введения в модель. Мерой для оценки включения фактора в модель служит частный F-критерий.
Частный F-критерий построен на сравнении прироста факторной дисперсии, обусловленного влиянием дополнительно включенного фактора, с остаточной дисперсией на одну степень свободы по регрессионной модели в целом. Если оцениваем значимость влияния фактора xi как дополнительно включенного в модель фактора, то используем следующую формулу:
где - коэффициент множественной детерминации для модели с полным набором факторов; - тот же показатель, но без включения в модель фактора xi; п - число наблюдений; т - число параметров в модели (без свободного члена).
В числителе формулы показан прирост доли объясненной вариации у за счет дополнительного включения в модель соответствующего фактора xi .
В знаменателе доля остаточной вариации по регрессионной модели, включающей полный набор факторов. Если числитель и знаменатель Fx умножить на или, что то же самое, на nσ2y, то получим соотношение прироста факторной (объясненной) суммы квадратов отклонений к остаточной сумме квадратов. Чтобы получить величину F-критерия, необходимо эти суммы квадратов отклонений разделить на соответствующее число степеней свободы. Т.к. прирост факторной суммы квадратов отклонений обусловлен дополнительным включением в модель одного исследуемого фактора х i, то число степеней свободы для него равно 1. Для остаточной суммы квадратов отклонений по регрессионной модели число степеней свободы, как уже было рассмотрено ранее, равно: п - т - 1. Соотношение числа степеней свободы приведено в формуле частного F-критерия в виде дроби: (n - m - 1)/1.
Фактическое значение частного F-критерия сравнивается с табличным при заданном уровне значимости и числе степеней свободы: 1 и п - т - 1. Если фактическое значение Fx превышает Fкрит то дополнительное включение фактора хi в модель статистически оправданно и коэффициент чистой регрессии bi , при факторе хi статистически значим. Если же фактическое значение Fx меньше табличного, то дополнительное включение в модель фактора хi не увеличивает существенно долю объясненной вариации признака у, следовательно, нецелесообразно его включение в модель; коэффициент регрессии при данном факторе в этом случае статистически незначим.
С помощью частного F-критерия можно проверить значимость всех коэффициентов регрессии в предположении, что каждый соответствующий фактор хi вводился в уравнение множественной регрессии последним.
Оценка значимости коэффициентов чистой регрессии по t-критерию Стью-дента может быть проведена и без расчета частных F-критериев. В этом случае, как и в парной регрессии, для каждого фактора используется формула где bi - коэффициент чистой регрессии при факторе хi ;
Sbi - средняя квадратическая ошибка коэффициента регрессии bi
Для уравнения множественной регрессии
средняя квадратическая ошибка коэффициента регрессии может быть определена по следующей формуле:
Где -коэффициент детерминации для зависимости фактора xi со всеми
другими факторами уравнения множественной регрессии.
Чтобы воспользоваться данной формулой, необходимы матрица межфакторной корреляции и расчет по ней соответствующих коэффициентов детерминации . Так для уравнения
Для оценки значимости коэффициентов регрессии b1, b2, b3 необходим расчет 3 межфакторных коэффициентов детерминации , , .
Если учесть, что ,то можно убедиться, что