Содержание
Несмотря на то что данные методы (особенно обобщенная линейная модель) достаточно сложны для изучения, их применение позволяет поднять аналитическую работу на существенно более высокий уровень. Для иллюстрации процесса построения графиков предположим, что по результатам трехфакторного дисперсионного анализа была установлена статистическая значимость взаимодействия между переменными q3 (Пол) и q4 (Возраст). В окне Profile Plots мы поместили переменную с наименьшим числом категорий q3 в поле Horizontal Axis, а переменную q4 — в поле Separate Lines.
- В заключение настоящего раздела необходимо особо отметить, что графики взаимодействий могут эффективно применяться только при числе взаимодействий 2 (q1 ´ q2) или 3 (q1 ´ q2 ´ q3).
- 3.18 можно было бы заключить, что женщины покупают глазированные сырки в больших объемах по сравнению с мужчинами.
- Предположим, что мы оцениваем различия в частоте посещения игровых клубов между посетителями заведений марки Х и других марок.
- Если будут выявлены существенные различия в анкетах интервьюеров, то высока вероятность фальсификации (тем интервьюером, анкеты которого наиболее сильно отличаются от остальных).
- В окне Options выберите параметр Homogeneity Tests и в соответствующее поле поместите переменные с двумя категориями, для которых следует рассчитать средние значения (q80 — Пол и все взаимодействия, в которых она участвует).
- Итак, в первой части таблицы мы видим сравнение различий между каждой из четырех возрастных категорий с остальными категориями.
В окне Options выберите параметр Homogeneity Tests и в соответствующее поле поместите переменные с двумя категориями, для которых следует рассчитать средние значения (q80 — Пол и все взаимодействия, в которых она участвует). Остальные диалоговые окна аналогичны рассмотренным для одномерного дисперсионного анализа, поэтому мы не приводим их второй раз. В диалоговом окне Model можно задать и другие значения, но для большинства задач маркетинговых исследований достаточно оставлять все эти значения по умолчанию.
Эту кнопку следует использовать в тех ситуациях, когда обнаружено статистически значимое взаимодействие между факторами. После таблицы Tests of Between-Subjects Effects следуют расчеты средних значений для дихотомической переменной q3 (Пол) и для взаимодействия q3 ´ q4 (рис. 3.18). В нашем случае ни переменная q3, ни ее взаимодействие с q4 не являются статистически значимыми, поэтому данные таблицы бесполезны.
2. Дисперсионный анализ
Поэтому при ограничениях, налагаемых аппаратным обеспечением компьютера, следует отказаться от использования полнофакторных моделей в пользу определяемых пользователем . Если ограничения жесткие, можно выполнить только исследования влияния независимых переменных на зависимую по отдельности (в терминологии SPSS, Main effects)1. Рассмотрим теперь ситуацию, когда необходимо исследовать сразу две независимые переменные (и взаимодействия между ними), то есть выполнить двухфакторный одномерный дисперсионный анализ.
При этом из столбца Mean Difference можно видеть, насколько отличается среднее значение той или иной группы от среднего значения других групп (звездочками отмечены значимые различия при 95%-ном доверительном уровне)1. Для одномерного дисперсионного анализа существует только одна зависимая переменная; для многомерного — несколько. Также в этом разделе мы рассмотрим одномерный дисперсионный анализ с повторными измерениями 1.
Глава 3. Анализ различий
Мужчины в возрасте до 18 лет имеют наименьшую кратность покупок и по сравнению со всеми другими половозрастными группами. Мужчины в возрасте 19–35 лет характеризуются наивысшей кратностью покупок сырков среди всех возрастных https://deveducation.com/ групп мужчин. Можно заметить, что ситуация с женщинами в двух рассматриваемых возрастных группах диаметрально противоположная. Мужчины младше 18 лет имеют наименьшую кратность покупок; женщины младше 18 лет — наивысшую.
В целом они аналогичны результатам, отображаемым при одномерном дисперсионном анализе, однако данные результаты значительно обширнее и содержат несколько дополнительных таблиц. Так как настоящее пособие посвящено сугубо практическим задачам использования SPSS в маркетинговых исследованиях, мы рассмотрим только ту часть результатов, которая необходима на практике. Наиболее простым для интерпретации случаем является ситуация, в которой по горизонтальной оси располагается дихотомическая переменная (например, переменная Пол). Если линии на отрезке между двумя категориями данной переменной не пересекаются — различий нет; если пересекаются — различия есть. 3.22 представлен пример максимальных различий (линии пересекаются под прямым углом); на рис. Итак, в данной главе мы рассмотрели статистические методы, применяемые для анализа различий между целевыми группами респондентов.
Если дихотомических переменных нет, следует выбрать переменную с наименьшим четным количеством категорий и перекодировать данные категории в дихотомию. Для горизонтальной оси следует выбирать именно данную (уже дихотомическую) переменную. Данный способ работает далеко не всегда, ведь часто различия между взаимодействиями факторов находятся именно в тех категориях, которые будут перекодированы (сокращены). 3.2 приведены основные характеристики переменных, участвующих в различных видах дисперсионного анализа. Итак, в первой таблице, Paired Samples Statistics, вы видите рассчитанные средние значения для обеих тестируемых переменных.
1.1. Т-тесты для независимых выборок
Теперь щелкните на кнопке Add, чтобы подтвердить построение графика с заданными параметрами. Так, если предположить, что влияние переменной Пол статистически значимо, из рис. 3.18 можно было бы заключить, что женщины покупают глазированные сырки в больших объемах по сравнению с мужчинами. Случается, что по результатам таблицы Tests of Between-Subjects Effects некая переменная оказывается незначимой, однако в таблице Multiple Comparisons отдельные уровни этой переменной значимо отличаются друг от друга. В такой ситуации все равно следует признать рассматриваемую переменную незначимой и в дальнейшем игнорировать связанные с нею апостериорные тесты. Прежде всего мы проведем однофакторный одномерный дисперсионный анализ и установим, насколько значимо различается кратность покупок в различных возрастных группах респондентов (1 — младше 18 лет; 2 — 19–35 лет; 3 — 36–60 лет; 4 — старше 60 лет).
Данная таблица является центральной в выводимых результатах дисперсионного анализа и показывает наличие/отсутствие значимых различий между категориями исследуемых переменных. Первое, на что следует обратить внимание при анализе описываемой таблицы, — это величина R2, отражающая долю совокупной дисперсии в зависимой переменной, описываемой статистической моделью. Другими словами, это та часть вариации зависимой переменной, которую можно объяснить на основании независимой переменной. Естественно, Мультивариантное тестирование что чем меньше независимых переменных, тем меньше величина R2, и наоборот. Итак, вы задали все переменные для исследования и можете использовать кнопки, расположенные в нижней части этого диалогового окна, — так же, как вы делали это при одномерном дисперсионном анализе (см. раздел 3.2.1). В окне Post Hoc задайте апостериорные тесты Scheffe (для равных дисперсий) и Tumhale (для неравных дисперсий) для переменных, имеющих более двух категорий (в нашем случае это только q74 — Возраст).
2.1. Одномерный дисперсионный анализ
Так, в нашем случае респонденты оценили питание в авиакомпании Y в среднем на 0,4 балла выше, чем в авиакомпании Х. Если после этого вы щелкнете на кнопке OK, то получите только одну таблицу, из которой можно узнать лишь о наличии/отсутствии значимых различий между возрастными группами. T-тесты для спаренных выборок применяются в случае, когда на различные вопросы отвечает одна и та же группа респондентов. После того как SPSS завершит расчет t-теста, в окне SPSS Viewer появятся две таблицы с результатами (рис. 3.8).
2.3. Многомерный дисперсионный анализ
В нашем случае единственная независимая переменная Возраст имеет больше двух категорий , и поэтому специально выводить для нее средние значения нет смысла (они будут выведены в таблице Homogenous Subsets). Установить равенство/неравенство дисперсий позволяет тест Levene, вывод которого на экран мы покажем ниже. В общем случае мы не знаем, равны ли дисперсии и, соответственно, какую группу статистических тестов следует использовать. Поэтому рекомендуется сразу вывести тесты для равных и неравных дисперсий, чтобы сократить количество итераций при проведении дисперсионного анализа. SPSS предлагает много различных дополнительных тестов, помогающих определить различия между группами исследуемых переменных.
1.1. Т-тесты для независимых выборок
Разница между реальным и тестируемым значениями (в нашем случае — 0,1 балла) отражается в столбце Mean Difference. Линейное распределение может показывать, что данные группы респондентов действительно различаются (например, мужчин в выборке в два раза больше, чем женщин). Однако визуального различия между категориями недостаточно для того, чтобы с уверенностью констатировать наличие статистически значимого различия. На установление статистической значимости различий между целевыми группами респондентов и направлены процедуры, объединенные под названием «Анализ различий». По оси ординат здесь (вертикальная ось) располагаются средние значения кратности покупок глазированных сырков каждой из рассматриваемых половозрастных групп. Так, мужчины младше 18 лет характеризуются существенно меньшей кратностью покупок сырков, чем женщины младше 18 лет.
Завершают вывод результатов двухфакторного анализа таблицы с расчетами апостериорных тестов. В нашем случае они практически такие же, как в предыдущем примере, поскольку переменная Возраст сохранила свою значимость (см. рис. 3.14 и 3.15). Однако при интерпретации таблицы Multiple Comparisons следует помнить о неравенстве дисперсий.
Поэтому значимость различий между отдельными возрастными группами надо устанавливать на основании второй части таблицы Tamhane. Выше мы упомянули о специальном тесте, позволяющем установить равенство/неравенство дисперсий. На необходимость проведения данного теста (так же как и многих других) можно указать в диалоговом окне Options, вызываемом одноименной кнопкой в главном диалоговом окне Univariate (рис. 3.11). Для однофакторного дисперсионного анализа можно ограничиться только одним тестом Levene на равенство дисперсий (параметр Homogeneity tests). Как было сказано выше, одномерный дисперсионный анализ исследует влияние одной или нескольких независимых переменных на одну зависимую. Одномерный дисперсионный анализ может быть однофакторным (one-way ANOVA) или многофакторным (n-way ANOVA).