WikiDer > Модерация (статистика)
В статистика и регрессивный анализ, На модерации возникает, когда связь между двумя переменными зависит от третьей переменной. Третья переменная называется переменная модератора или просто Модератор.[1] Эффект модерирующей переменной статистически характеризуется как взаимодействие;[1] это категоричный (например, пол, этническая принадлежность, класс) или количественный (например, уровень вознаграждения) Переменная что влияет на направление и / или силу отношений между зависимые и независимые переменные. В частности, в корреляционный В рамках анализа модератор - это третья переменная, которая влияет на корреляцию нулевого порядка между двумя другими переменными или значение наклона зависимой переменной от независимой переменной. В дисперсионный анализ (ANOVA), базовый эффект модератора может быть представлен как взаимодействие между фокусом независимый переменная и коэффициент, определяющий соответствующие условия его работы.[2]
Пример
Анализ модерации в поведенческие науки предполагает использование линейный множественный регрессионный анализ или же причинное моделирование.[1] Чтобы количественно оценить влияние модерирующей переменной в множественном регрессионном анализе, случайная переменная Y на Икс, в модель добавляется дополнительный член. Этот термин представляет собой взаимодействие между Икс и предлагаемая регулирующая переменная.[1]
Таким образом, для ответа Y и две переменные Икс1 и модерирующая переменная Икс2,:
В этом случае роль Икс2 в качестве модерирующей переменной достигается путем оценки б3, оценка параметра для члена взаимодействия.[1] Видеть линейная регрессия для обсуждения статистической оценки оценок параметров в регрессионном анализе.
Мультиколлинеарность в умеренной регрессии
В модерированном регрессионном анализе новый взаимодействие предсказатель () рассчитывается. Однако новый член взаимодействия будет коррелирован с двумя основными членами эффекта, используемыми для его расчета. Это проблема мультиколлинеарность в умеренной регрессии. Мультиколлинеарность приводит к тому, что коэффициенты оцениваются более высокими стандартные ошибки и, следовательно, большая неопределенность.
Среднее центрирование (вычитание исходных оценок из среднего) было предложено как средство от мультиколлинеарности. Однако центрирование среднего значения не требуется в любом регрессионном анализе, поскольку используется корреляционная матрица, а данные уже центрированы после вычисления корреляций. Корреляции выводятся из перекрестного произведения двух стандартных оценок (Z-оценок) или статистических моментов (отсюда и название: корреляция продукта Пирсона и момента). См. Также статью Kromrey & Foster-Johnson (1998) о «Центрирование среднего в умеренной регрессии: много шума из ничего».
Апостериорное исследование взаимодействий
Подобно простому анализу основных эффектов в ANOVA, при апостериорном исследовании взаимодействий в регрессии мы исследуем простой наклон одной независимой переменной при конкретных значениях другой независимой переменной. Ниже приведен пример проверки двусторонних взаимодействий. Далее следует уравнение регрессии с двумя переменными A и B и членом взаимодействия A * B,
будет рассмотрено.[3]
Две категориальные независимые переменные
Если обе независимые переменные являются категориальными переменными, мы можем анализировать результаты регрессии для одной независимой переменной на определенном уровне другой независимой переменной. Например, предположим, что и A, и B представляют собой переменные с одним фиктивным кодом (0,1), и что A представляет этническую принадлежность (0 = американцы европейского происхождения, 1 = выходцы из Восточной Азии), а B представляет состояние в исследовании (0 = контроль, 1 = экспериментальный). Затем эффект взаимодействия показывает, различается ли влияние состояния на зависимую переменную Y для американцев европейского происхождения и выходцев из Восточной Азии и отличается ли влияние этнического статуса для этих двух условий. Коэффициент A показывает влияние этнической принадлежности на Y для контрольного условия, а коэффициент B показывает эффект наложения экспериментальных условий на европейско-американских участников.
Чтобы выяснить, есть ли какие-либо существенные различия между европейскими американцами и выходцами из Восточной Азии в экспериментальных условиях, мы можем просто запустить анализ с переменной состояния, закодированной в обратном порядке (0 = экспериментальный, 1 = контроль), так что коэффициент этнической принадлежности представляет собой влияние этнической принадлежности на Y в экспериментальных условиях. Аналогичным образом, если мы хотим увидеть, оказывает ли лечение эффект на участников из Восточной Азии, мы можем изменить код переменной этнической принадлежности (0 = выходцы из Восточной Азии, 1 = американцы европейского происхождения).
Одна категориальная и одна непрерывная независимые переменные
Если первая независимая переменная является категориальной переменной (например, пол), а вторая - непрерывной переменной (например, баллы по шкале удовлетворенности жизнью (SWLS)), то b1 представляет собой разницу в зависимой переменной между мужчинами и женщинами, когда удовлетворение жизнью равно нулю. Однако нулевой балл по шкале удовлетворенности жизнью не имеет смысла, поскольку диапазон баллов составляет от 7 до 35. Именно здесь вступает в силу центрирование. Если мы вычтем среднее значение балла SWLS для выборки из баллов каждого участника, Среднее значение полученной центрированной оценки SWLS равно нулю. При повторном запуске анализа b1 теперь представляет собой разницу между мужчинами и женщинами на среднем уровне оценки SWLS для выборки.
Cohen et al. (2003) рекомендовали использовать следующее, чтобы исследовать простое влияние пола на зависимую переменную (Y) на трех уровнях непрерывной независимой переменной: высоком (одно стандартное отклонение выше среднего), умеренном (в среднем) и низком ( на одно стандартное отклонение ниже среднего).[4] Если оценки непрерывной переменной не стандартизированы, можно просто вычислить эти три значения, добавив или вычтя одно стандартное отклонение исходных оценок; если баллы непрерывной переменной стандартизированы, можно рассчитать три значения следующим образом: высокий = стандартизованный балл минус 1, средний (средний = 0), низкий = стандартизованный балл плюс 1. Затем можно исследовать влияние пола от зависимой переменной (Y) при высоком, среднем и низком уровне оценки SWLS. Как и в случае с двумя категориальными независимыми переменными, б2 представляет влияние оценки SWLS на зависимую переменную для женщин. Путем обратного кодирования гендерной переменной можно получить влияние оценки SWLS на зависимую переменную для мужчин.
Кодирование с умеренной регрессией
При рассмотрении категориальных переменных, таких как этнические группы и экспериментальные методы лечения, как независимых переменных в модерированной регрессии, необходимо кодировать переменные так, чтобы каждая кодовая переменная представляла конкретный параметр категориальной переменной. Есть три основных способа кодирования: кодирование фиктивных переменных, кодирование эффектов и кодирование контраста. Ниже приводится введение в эти системы кодирования.[5][6]
Фиктивное кодирование используется, когда у кого-то есть контрольная группа или одно конкретное условие (например, контрольная группа в эксперименте), которую нужно сравнить с каждой из других экспериментальных групп. В этом случае точка пересечения представляет собой среднее значение контрольной группы, а каждый из нестандартизованных коэффициентов регрессии представляет собой разницу в зависимой переменной между одной из экспериментальных групп и средним значением контрольной группы (или контрольной группы). Эта система кодирования аналогична анализу ANOVA и подходит, когда исследователи имеют определенную контрольную группу и хотят сравнить с ней каждую из других групп.
Кодирование эффектов используется, когда у кого-то нет конкретной группы сравнения или контроля и нет запланированных ортогональных контрастов. Перехват - это большое среднее (среднее всех условий). Коэффициент регрессии - это разница между средним значением одной группы и средним значением всех средних значений группы (например, средним значением группы A минус средним значением всех групп). Эта система кодирования подходит, когда группы представляют естественные категории.
Кодирование контраста используется, когда есть серия ортогональных контрастов или групповых сравнений, которые необходимо исследовать. В этом случае точка пересечения представляет собой невзвешенное среднее значение отдельных групповых средних. Нестандартизованный коэффициент регрессии представляет собой разницу между невзвешенным средним значением одной группы (A) и невзвешенным средним значением другой группы (B), где A и B представляют собой два противоположных набора групп. Эта система кодирования подходит, когда исследователи имеют априорную гипотезу относительно конкретных различий между средними значениями группы.
Две непрерывные независимые переменные
Если обе независимые переменные являются непрерывными, для интерпретации полезно либо центрировать, либо стандартизировать независимые переменные, Икс и Z. (Центрирование включает вычитание общего среднего балла по выборке из исходного балла; стандартизация делает то же самое, с последующим делением на общее стандартное отклонение выборки.) Путем центрирования или стандартизации независимых переменных коэффициент Икс или же Z можно интерпретировать как влияние этой переменной на Y на среднем уровне другой независимой переменной.[7]
Чтобы исследовать эффект взаимодействия, часто бывает полезно построить график эффекта Икс на Y при низких и высоких значениях Z (некоторые люди предпочитают также отображать эффект при умеренных значениях Z, но в этом нет необходимости). Часто значения Z для этого выбираются значения на одно стандартное отклонение выше и ниже среднего, но можно использовать любые разумные значения (а в некоторых случаях можно выбрать более значимые значения). Сюжет обычно строится путем оценки значений Y для высоких и низких значений обоих Икс и Zи создав две линии, чтобы представить эффект Икс на Y при двух значениях Z. Иногда это дополняется простым анализом наклона, который определяет, насколько Икс на Y является статистически значимый при определенных значенияхZ. Существуют различные интернет-инструменты, которые помогают исследователям строить и интерпретировать такие двусторонние взаимодействия.[8]
Взаимодействие на более высоком уровне
Принципы двустороннего взаимодействия применимы, когда мы хотим изучить трехстороннее взаимодействие или взаимодействие более высокого уровня. Например, если у нас есть трехстороннее взаимодействие между А, B, и C, уравнение регрессии будет следующим:
Ложные эффекты высшего порядка
Стоит отметить, что надежность членов высшего порядка зависит от надежности членов более низкого порядка. Например, если надежность для переменной A составляет 0,70, а надежность для переменной B равна 0,80, то надежность для переменной взаимодействия A * B составляет 0,70 × 0,80 = 0,56. В этом случае низкая надежность члена взаимодействия приводит к малой мощности; поэтому, возможно, мы не сможем найти эффекты взаимодействия между A и B, которые действительно существуют. Решение этой проблемы - использовать высоконадежные меры для каждой независимой переменной.
Еще одно предостережение для интерпретации эффектов взаимодействия заключается в том, что, когда переменная A и переменная B сильно коррелированы, тогда член A * B будет сильно коррелировать с пропущенная переменная А2; следовательно, то, что кажется значительным эффектом замедления, на самом деле может быть значительным нелинейным эффектом только A. Если это так, стоит протестировать модель нелинейной регрессии, добавив нелинейные члены в отдельные переменные в модерируемый регрессионный анализ, чтобы увидеть, остаются ли взаимодействия значимыми. Если эффект взаимодействия A * B все еще значительный, мы с большей уверенностью скажем, что действительно существует эффект замедления; однако, если эффект взаимодействия перестанет быть значительным после добавления нелинейного члена, мы будем менее уверены в существовании эффекта замедления, и предпочтение будет отдано нелинейной модели, поскольку она более экономична.
Смотрите также
Рекомендации
- ^ а б c d е Коэн, Джейкоб; Коэн, Патрисия; Леона С. Айкен; Запад, Стивен Х. (2003). Прикладной множественный регрессионный / корреляционный анализ для поведенческих наук. Хиллсдейл, Нью-Джерси: L. Erlbaum Associates. ISBN 0-8058-2223-2.
- ^ Барон Р. М. и Кенни Д. А. (1986). «Различие переменных модератора и посредника в социально-психологическом исследовании: концептуальные, стратегические и статистические соображения», Журнал личности и социальной психологии, 5 (6), 1173–1182 (стр. 1174)
- ^ Тейлор, Алан. «Тестирование и интерпретация взаимодействий в регрессии - в двух словах» (PDF).
- ^ Коэн Джейкоб; Коэн Патрисия; West Stephen G .; Айкен Леона С. Прикладной множественный регрессионный / корреляционный анализ для поведенческих наук (3-е изд.). Махва, Нью-Джерси [u.a.]: Эрлбаум. С. 255–301. ISBN 0-8058-2223-2.
- ^ Айкен Л.С., Вест., С.Г. (1996). Множественное регрессионное тестирование и интерпретация (1. мягкая обложка. Ред.). Ньюбери-Парк, Калифорния [u.a.]: Sage Publications, Inc. ISBN 0-7619-0712-2.CS1 maint: несколько имен: список авторов (связь)
- ^ Коэн Джейкоб; Коэн Патрисия; West Stephen G .; Айкен Леона С. (2003). Прикладной множественный регрессионный / корреляционный анализ для поведенческих наук (3-е изд.). Махва, Нью-Джерси [u.a.]: Эрлбаум. С. 302–353. ISBN 0-8058-2223-2.
- ^ Доусон, Дж. Ф. (2013). Модерация управленческих исследований: что, почему, когда и как. Журнал бизнеса и психологии. Дои: 10.1007 / s10869-013-9308-7.
- ^ http://www.jeremydawson.co.uk/slopes.htm
- Хейс, А. Ф., и Маттес, Дж. (2009). «Вычислительные процедуры для исследования взаимодействий в OLS и логистической регрессии: реализации SPSS и SAS». Методы исследования поведения, Vol. 41. С. 924–936.