ЛБ_7
.docДисциплина: Теоретические основы выборочных исследований
Лабораторная работа №7
Анализ таблиц сопряженности
Таблицы сопряженности или кросстабуляции служат для описания связи двух или более номинальных (категориальных) переменных.
1. Построение таблиц сопряженности
1.1. Реализация в SPSS
Для составления таблиц сопряженности в программе SPSS необходимо выполнить следующую последовательность команд:
Analyze (Анализ) - Descriptive Statistics (Описательные статистики) –
Crosstabs (Кросстабуляции)
В результате откроется диалоговое окно (рис.1), в котором необходимо задать переменные, отражаемые в виде строк и в виде столбцов.
Рис.1. Диалоговое окно Crosstabs
Пример построения таблицы сопряженности для переменных food и diet представлен на рис.2.
Рис.2. Простая таблица сопряженности для переменных food и diet
Раздел Layer в диалоговом окне Crosstabs (рис.1.) позволяет создавать многоуровневые таблицы сопряженности для трех и более переменных.
Пример построения многоуровневой таблицы сопряженности для переменных food, diet и profit представлен на рис.3.
Рис.3. Многоуровневая таблица сопряженности для переменных food, diet и profit
1.2. Реализация в STATISTICA
Для составления таблиц сопряженности в программе STATISTICA необходимо выполнить следующую последовательность команд:
Statistics (Статистики) – Basic Statistics / Tables (Основные статистики и таблицы) – Tables and banners (Таблицы и заголовки)
В результате откроется диалоговое окно (рис.4.), в котором для построения простой таблицы сопряженности необходимо перейти на вкладку Stub-and-banner и указать переменные для анализа.
Рис.4. Диалоговое окно Crosstabulation tables
После нажатия кнопки ОК открывается окно результатов (рис.5).
Рис.5. Диалоговое окно Для
Затем, нажав на кнопку Stub-and-banner table, на экран будет выведена результирующая таблица.
Пример построения таблицы сопряженности для переменных food и diet представлен на рис.6.
Рис.6. Простая таблица сопряженности для переменных food и diet
Чтобы построить многоуровневую таблицу сопряженности, необходимо в диалоговом окне Crosstabulation tables (рис.4.) перейти на вкладку Crosstabulation и указать переменные для анализа. После нажатия кнопки ОК открывается окно результатов (рис.7.).
Рис.7. Диалоговое окно Crosstabulation tables Results
В диалоговом окне Crosstabulation tables Results, нажатием кнопки Review summary tables (Посмотреть таблицу результатов) или кнопки Summary открывается многоуровневая таблица сопряженности.
Пример построения многоуровневой таблицы сопряженности для переменных food, diet и profit представлен на рис.8.
Рис.8. Многоуровневая таблица сопряженности для переменных food, diet и profit
2. Критерий хи-квадрат.
Основной целью построения таблиц сопряженности является выявление взаимосвязи между двумя исследуемыми признаками или выявление соответствия совместного распределения теоретическому. Основным инструментом для проведения подобного рода исследований является тест хи-квадрат.
Для проведения теста хи-квадрат на соответствие реального распределения теоретическому, необходимо составить теоретическое распределение.
2.1. Реализация в SPSS
Для составления теоретического распределения в SPSS необходимо в диалоговом окне Crosstabs (рис.1.) воспользоваться кнопкой и Cells, после чего откроется диалоговое окно (рис.9.)
Рис.9. Диалоговое окно Crosstabs: Cell Display
Для выведения ожидаемых частот флажок из положения Observed нужно переместить в положение Expected – команда выведет на экран ожидаемые частоты для каждой ячейки в предположении, что переменные являются независимыми.
Результат выполнения команды представлен на рис.10.
Рис.10. Расчет ожидаемых частот
Для получения дополнительной информации для вывода на экран остатков (Redisual) в окне Cells выделить вид остатков, который нужен: обычные (Unstandartized), нормированные (Standartized) или уточненные нормированные (Adjusted standartized).
Раздел Percentage позволяет вывести относительные ожидаемые или наблюдаемые частоты, выраженные в процентах частоты, выраженные в процентах (команда Total). Или относительные частоты условного распределения (для распределения, составленного по столбцам (Column) или строкам (Row)).
На рис.11. представлена таблица сопряженности дополненная ожидаемыми частотами и значениями остатков.
Рис.11. Расширенный вид таблицы сопряженности
2.2. Реализация в STATISTICA
Для составления теоретического распределения в STATISTICA необходимо в диалоговом окне Crosstabulation tables Results (рис.5.) перейти на вкладку Options и установить флажок в поле Expected frequencies (Ожидаемы частоты).
Результат выполнения команды представлен на рис.12.
Рис.12. Расчет ожидаемых частот
Для получения дополнительной информации для вывода на экран остатков необходимо в диалоговом окне Crosstabulation tables Results (рис.5.) во вкладке Options установить фложок в поле Redisual frequencies.
Раздел Percentage позволяет вывести относительные ожидаемые или наблюдаемые частоты, выраженные в процентах частоты, выраженные в процентах (команда Total). Или относительные частоты условного распределения (для распределения, составленного по столбцам (Column) или строкам (Row)).
На рис.13. представлена таблица сопряженности дополненная ожидаемыми частотами и значениями остатков. Результат выводится отдельными таблицами.
Рис.13. Расширенный вид таблицы сопряженности
3. Расчет критерия хи-квадрат
Ответ на простейший вопрос о взаимосвязи переменных можно получить, вычислив критерий хи-квадрат. Для вычисления критерия хи-квадрат применяется формула Пирсона.
3.1. Реализация в SPSS
Для расчета хи-квадрат по формуле Пирсона в диалоговом окне Crosstabs (рис.1.), необходимо щелкнуть на кнопку Statistics, в результате чего откроется диалоговое окно (рис.14.), в котором необходимо выделить флажком команду Chi-square.
Рис.14. Диалоговое окно Crosstabs: Statistics
Пример расчета критерия хи – квадрат для переменных food и diet представлен на рис.15.
Рис.15. Расчет критерия хи-квадрат Пирсона
В нижней таблице приведены непосредственно результаты расчета критерия:
-
Pearson Chi-Square (Хи-квадрат по Пирсону),
-
Likelihood Ratio (Отношение правдоподобия),
-
Linear-by-Linear Association (Зависимость линейный-линейный),
-
N of Valid Cases (Объем выборки).
Визуальный анализ таблицы сопряженности говорит о том, что диету во время программы похудения скорее соблюдают те, кто на вопрос в анкете о правильном питании до программы похудения отвечал «затрудняюсь ответить» или «полностью не согласен».
Учитывая, что для числа степеней свободы и уровня значимости критическое значение критерия хи-квадрат равно , что меньше расчетного значения, можно говорить о том, что исследуемая зависимость подтверждается.
3.2. Реализация в STATISTICA
Для расчета хи-квадрат по формуле Пирсона в диалоговом окне Crosstabulation tables Results (рис.5.) во вкладке Options установить фложок в поле Pearson & M-L Chi-square, при этом обязательно должны быть рассчитаны ожидаемые частоты.
Пример расчета критерия хи – квадрат для переменных food и diet представлен на рис.16.
Рис.16. Расчет критерия хи-квадрат Пирсона
Результаты совпадают с теми, которые были получены при применении пакета SPSS.
4. Расчет критериев определяющих силу связи между явлениями
Помимо критерия хи-квадрат программа SPSS и STATISTICA позволяет рассчитывать значения таких критериев, как коэффициент контингенции, фи-критерий, критерий Крамера, лямбда-критерий и прочие.
4.1. Реализация в SPSS
Для того, чтобы рассчитать определяющие силу связи между явлениями, необходимо в диалоговом окне Crosstabs: Statistics (рис.14) установить соответствующие флажки.
Пример расчета фи-критерия (Phi) и критерия Крамера (Cramer’s V) представлены на рис.17.
Рис.17. Расчет фи-критерия и критерия Крамера
Значение критериев фи и Крамера принимает значение равное 0,49, что говорит об относительно сильной связи между переменными food и diet.
4.2. Реализация в STATISTICA
Для того, чтобы рассчитать определяющие силу связи между явлениями, необходимо в диалоговом окне Crosstabulation tables Results (рис.5.) во вкладке Options установить соответствующие фложки.
Индивидуальное задание
Все задания необходимо выполнить в трех пакетах: SPSS, STATISTICA, Excel.
-
Создайте таблицы сопряженности разного вида – простые и многоуровневые. Дополните простые таблицы информацией на Ваш выбор – данными об ожидаемых частотах в абсолютной или относительной форме и т.д.
-
Для двух простых таблиц сопряженности рассчитайте критерии хи-квадрат. Дайте пояснения полученному результату.
-
Рассчитайте коэффициент сопряженности Крамера и Фи-коэффициент. Дайте пояснения полученным результатам.
-
Проведите сравнительный анализ работы в трех пакетах.