Сравнение средних
В сравнении с этим местом, подвал Фредди Крюгера
выглядит как фабрика Вилли Вонки.
Вы решили, что хотите сравнивать. Это может показаться сложным,
но это только на первый взгляд :)
Где находится сравнение средних в SPSS?
Параметрические сравнения средних:
"Анализ" - "Сравнение средних" // Analyze - Compare Means

Непараметрические сравнения средних:
"Анализ" - "Непараметрические" // Analyze - Non-Parametric
Для начала определимся
А что собственно сравниваем?
Будете ли Вы сравнивать между собой разные группы людей
или же выраженность двух разных признаков у одной и той же группы людей, или, может быть, что-то другое?
Сравнить две группы людей по выраженности одного признака

• Т-тест для независимых выборок
• Тест U-Манна-Уитни
Сравнить несколько (больше 2-ух) групп людей по выраженности
одного признака
• Однофакторный дисперсионный анализ (АNOVA)
• Тест Краскла-Уоллиса
Сравнить, как два разных признака выражены в одной и той же
группе людей
• Т-тест для парных выборок
• Тест Уилкоксона

1
Параметрические методы сравнения средних
Подходят только для интервальных переменных,
про порядковые - в разделе 2

Т-тест для независимых выборок
Что требуется?

Интервальная переменная (помещается в поле зависимой переменной), среднее по которой будет сравниваться в двух группах, и номинальная переменная (помещается в поле группирующей переменной) с двумя значениями, по которой образуются группы. Не забудьте уточнить кодировку для ваших групп: просто укажите в соответствующем окне кодировки групп (обычно "1" и "2", или "1" и "0").

Строго говоря, Т-тест для независимых выборок требует нормальности распределения зависимой переменной. Т-тест можно использовать, допуская ненормальность распределения зависимой переменной, при большом масштабе измерения (больше 250-300 чел.).

Мне уже поплохело, но давайте продолжим...

На выходе вы получаете две таблицы - первая содержит в себе рассчитанные средние для двух групп, вторая - непосредственно Т-критерий. Сначала необходимо обратиться ко второй таблице.

Она состоит из двух колонок: в первой проверяется равенство дисперсий зависимой переменной в двух Ваших группах, а во второй колонке представлен, соответственно, сам критерий, рассчитанный для двух случаев - если дисперсии равны, и если они не равны.

Для начала определите, равны ли дисперсии зависимой переменной в двух Ваших группах. Для этого обратитесь к значению Sig. в первой колонке (критерий равенства дисперсий Ливиня).

H0: дисперсии в сравниваемых группах равны.
Если Sig. > α, то обратитесь к строчке, в которой предполагается равенство дисперсий; если Sig. < α, то ориентируйтесь на строку, где равенство дисперсий не предполагается.

Дело за малым. Теперь Вы знаете, на какую строчку смотреть. Перемещаемся ко второму столбцу - Т-критерий и его значимость. Из двух значений выбирайте то, которое соответствует результату проверки дисперсий. Соответственно,

H0: средние в сравниваемых группах равны.
Если Sig. > α, то средние равны и к таблице с значениями средних обращаться не имеет смысла; если Sig. < α, то ву-аля, поздравляю! есть значимые различия в значениях средних для двух групп.

Различия есть, а что дальше?

Дело лишь за грамотной и наглядной визуализацией в таблице и интерпретацией значений. Сами средние, которые различаются, представлены в таблице, выданной Т-тестом первой по счету.

Соответственно интерпретация: "С вероятностью 95% (или другой, на которой вы проводили тест) различия по сравниваему признаку (замените на то, что именно Вы сравнивали) в группах X и Y (укажите группы) значимы".

А далее содержательная интерпретация... То есть ответ на вопрос: "А почему эти группы различаются?"

Однофакторный дисперсионный анализ
Что требуется?

Все то же самое, что и для предыдущего теста (зависимая интервальная переменная - та, которую сравниваем), но группирующая номинальная переменная на этот раз может иметь сколько угодно категорий (по ней образуются группы людей для сравнения; убедитесь, что количество групп обеспечит вам возможность интерпретировать различия, т.е. больше 5-7 групп - будет уже сложно).

Обратите внимание!

ANOVA, в отличии от Т-теста, отображает результаты только для случая, когда дисперсии зависимой переменной в сравниваемых группах равны. При этом, отсутствует автоматическая проверка того, равны ли дисперсии. Эту проверку следует включить вручную в меню ANOVA: "Параметры" - "Проверка однородности дисперсии".

Если: Дисперсии однородны
т.е. Sig. > α по результатам теста Ливиня

Вас можно поздравить. Вы можете обратиться к таблице ANOVA.
H0: средние в сравниваемых группах равны. Если Sig. > α, то различия в значениях зависимой переменной незначимы; если Sig. < α, то существуют значимые различия.

В первом случае мы просто успокаиваемся и смиряем себя мыслью, что еще не все потеряно, и может даже и хорошо, что не различаются. Во втором случае алгоритм действий сложнее: следует обратиться к табличке средних (можно запросить ее в меню "Параметры") и оценить эти различия.

Этого зачастую недостаточно, поэтому проводятся апостериорные тесты (меню "Апостериорные"), по результатам которых устанавливается, в каких именно группах средние значимо различаются. Соответственно, следует выбирать тесты из первого окошка, где предполагается равенство дисперсий. У меня есть три любимых: Бонферонни, Тьюки и Дункан.

Если: Дисперсии неоднородны, неравны
т.е. Sig. < α по результатам теста Ливиня

Аааа! Все плохо. Нет, на самом деле, терпимо. Сейчас поправим, не переживайте. В меню ANOVA в разделе "Параметры" предусмотрено два аналога ANOVA для случая, если дисперсии не равны. Это тест Брауна-Форсайта и тест Уэлча. Эти тесты проверяют одну и ту же нулевую гипотезу и очень часто согласуются между собой:

H0: средние в сравниваемых группах равны. Если Sig. > α, то различия в значениях зависимой переменной незначимы; если Sig. < α, то существуют значимые различия.

Если различий в группах нет, то можно остановиться. Если различия есть, то прекрасно, необходимо уточнить между какими именно группами средние различаются. Для этого используются апостериорные тесты (меню "Апостериорные"), при этом выбирается вторая рамочка - для случая, если дисперсии неравны. Я предпочитаю выбирать тесты Тамхейна и Геймс-Хоуэлла.



Т-тест для парных выборок
Что требуется?

Т-критерий для парных выборок необходим тогда, когда сравнивается два разных признака в одной и той же выборке (группе). Два сравниваемых признака должны быть представлены интервальными переменными с одинаковыми шкалами (если шкалы различны - сравнение средних будет некорректным).
*Если вы вдруг хотите сравнить два признака не во всей выборке, а только в одной группе (например, сравнить частоту потребления клубничного и ванильного мороженого, но только в группе женщин) - отберите подходящие наблюдения через Данные - Отобрать наблюдения.

Механизм сравнения

Соответственно, поместите обе переменные в окошко для парного сравнения. Вы можете задать одновременно несколько пар для сравнения. Вы получите три таблицы: средние, корреляцию и Т-критерий.

Обратитесь к Т-критерию:
H0: средние сравниваемых переменных равны. Если Sig. > α, то различия в значениях зависимых переменных незначимы; если Sig. < α, то существуют значимые различия.

В первом случае, мы признаем, что оба признака выражены сравнительно одинаково, а во-втором обращаемся к таблице средних, чтобы уточнить направленность различий. Статистический вывод: "С вероятностью 95% выраженность двух признаков в рассмотренной группе статистически (не-)различается".

И содержательно интерпретируем :)

2
Непараметрические методы
сравнения средних
Подходят для порядковых переменных
Тест U-Манна-Уитни
Что требуется?

Категориальная переменная в качестве зависимой (то, что сравниваем) и дихотомическая номинальная переменная, выступающая в качестве группирующей (та, по которой образуются группы людей для сравнения; не забудьте уточнить кодировку групп в специальном окошке).

Как интерпретировать?

Выдается несколько таблиц: ряды и статистика критерия. В рамках теста проверяется H0: Средние ранги в двух группах равны. Если Sig. > α, то различия по сравниваемому признаку в двух группах незначимы; если Sig. < α, то существуют значимые различия.

Соответственно, если различий нет, то мы признаем это и успокаиваемся.

Различия есть, а что дальше?

Если различия есть, обращаемся к средним рангам, чтобы определить направление различий. Обратите внимание на кодировку переменной - больший средний ранг свидетельствует о большей выраженности большей кодировки, и наоборот.

* Полезно бывает запустить через основные (не устаревшие) диалоговые окна, чтобы получить сине-зеленую табличку с частотой тех или иных рангов для двух групп. Эта табличка может помочь обогатить содержательную интерпретацию.

И конечно, содержательно интерпретируем.

Тест Краскла-Уоллиса
Что требуется?

Краскл-Уоллис - аналог ANOVA для категориальных переменных. Требуется одна порядковая переменная в качестве зависимой (то, что будем сравнивать) и номинальная группирующая, по которой будут образовываться группы для сравнения (категорий может быть больше 2-ух).

Как интерпретировать?

Выдается несколько таблиц: ряды и статистика критерия. В рамках теста проверяется H0: Средние ранги в сравниваемых группах равны. Если Sig. > α, то различия по сравниваемому признаку в группах незначимы; если Sig. < α, то существуют значимые различия.

Соответственно, если различий нет, то мы признаем это и успокаиваемся.

Различия есть, а что дальше?

Если различия есть, необходимо понять, различия между какими именно группами статистически значимы. Для этого тест запускается через основное (не устаревшие) окно, двойной клик по информационному полю с отклонением гипотезы вызывает подробную информацию о результатах. Внизу во вкладке "Вид" - "Парные сравнения" приведен рисунок и таблица попарных сравнений.

В таблице H0: Статистически значимых различий нет. Соответственно, если Sig. > α, то в сравниваемой паре нет значимых различий; если Sig. < α, то существуют значимые различия.

Попарные сравнения и их направленность необходимо содержательно проинтерпретировать и ву-аля :)

* Еще иногда полезной оказывается бокс-плот, выдаваемый в основном поле ("Просмотр критерия независимых выборок") подробной информации о результатах. Для каждой группы там выдается средний ранг и разброс, соответственно. Это помогает проследить общую тенденцию.

Тест Уилкоксона
Что требуется?

Тест Уилкоксона - аналог Т-критерия для парных выборок. Соответственно, требования очень похожи: две сравниваемые переменные, измеренные одной и той же порядковой шкалой. Помещаем обе переменные в окошко для сравнения, чтобы они образовывали пару. При необходимости, можно сравнивать несколько пар одновременно.

Как интерпретировать?
Выдается две таблички: ряды и статистика критерия. Сначала, как обычно, обращаемся к статистике критерия.

H0: Средние ранги по двум переменным равны. Соответственно, если Sig. > α, то в значениях сравниваемой пары переменных нет значимых различий; если Sig. < α, то существуют значимые различия.

Различия есть, что дальше?

Если есть значимые различия, обратитесь к количеству положительных и отрицательных рангов. Чем больше N, тем чаще соответственно встречается та или иная ситуация. Рядом с количеством N указан индекс, к которому есть пояснения внизу таблицы. Соответственно, выбирайте индекс, который соответствует большему N - это и есть направленность различий.
Не забывайте о кодировке зависимых переменных :)
This site was made on Tilda — a website builder that helps to create a website without any code
Create a website