WikiDer > Автоматическое обнаружение взаимодействия по хи-квадрат
Автоматическое обнаружение взаимодействия по хи-квадрат (ЧЭЙД) это Древо решений метод, основанный на скорректированном тестировании значимости (Бонферрони тестирование). Этот метод был разработан в Южной Африке и опубликован в 1980 году Гордоном В. Кассом, защитившим докторскую диссертацию по этой теме. CHAID можно использовать для прогнозирования (аналогично регрессивный анализ(эта версия CHAID изначально была известна как XAID), а также классификации и обнаружения взаимодействия между переменными. CHAID основан на формальном расширении американских процедур AID (автоматическое обнаружение взаимодействия) и THAID (автоматическое обнаружение взаимодействия THeta) 1960-х и 1970-х годов, которые, в свою очередь, были расширением более ранних исследований, в том числе проведенных в Великобритании в США. 1950-е годы.
На практике CHAID часто используется в контексте прямой маркетинг для отбора групп потребителей и прогнозирования того, как их реакция на некоторые переменные влияет на другие переменные, хотя другие ранние приложения были в области медицинских и психиатрических исследований.
Как и другие деревья решений, преимущества CHAID заключаются в том, что его выходные данные наглядны и легко интерпретируются. Поскольку по умолчанию используется многовариантное разбиение, для эффективной работы требуются довольно большие размеры выборки, поскольку при малых размерах выборки группы респондентов могут быстро стать слишком маленькими для надежного анализа.
Одним из важных преимуществ CHAID перед альтернативами, такими как множественная регрессия, является то, что он непараметрический.
Смотрите также
- Распределение хи-квадрат
- Модель скрытого класса
- Структурное моделирование уравнение
- Сегмент рынка
- Изучение дерева решений
- Множественные сравнения
Эта статья включает Список ссылок, связанное чтение или внешняя ссылка, но его источники остаются неясными, потому что в нем отсутствует встроенные цитаты. (Июль 2010 г.) (Узнайте, как и когда удалить этот шаблон сообщения) |
Рекомендации
дальнейшее чтение
- Belson, William A .; Сопоставление и предсказание по принципу биологической классификации, Прикладная статистика, Vol. 8 (1959), стр. 65–75
- Морган, Джон А .; И Сонквист, Джеймс Н .; Проблемы при анализе данных опроса и предложения, Журнал Американской статистической ассоциации, Vol. 58 (1963), стр. 415–434
- Press, Laurence I .; Роджерс, Майлз С .; И Shure, Джеральд Х .; Интерактивный метод анализа многомерных данных, Бихевиоризм, Vol. 14 (1969), стр. 364–370
- Касс, Гордон В .; Исследовательский метод исследования больших объемов категориальных данных, Прикладная статистика, Vol. 29, № 2 (1980), стр. 119–127.
- Хокинс, Дуглас М.; и Касс, Гордон В .; Автоматическое обнаружение взаимодействия, в Хокинс, Дуглас М. (ред), Темы прикладного многомерного анализа, Cambridge University Press, Кембридж, 1982, стр. 269–302.
- Hooton, Thomas M .; Хейли, Роберт В .; Калвер, Дэвид Х .; Уайт, Джон В .; Морган, У. Мид; И Кэрролл, Раймонд Дж .; Совместные ассоциации множественных факторов риска с возникновением нозокомиальных инфекций, Американский журнал медицины, Vol. 70, (1981), стр. 960–970.
- Бринк, Сюзанна; И Ван Шалквик, Дирк Дж .; Ферритин сыворотки и средний корпускулярный объем как предикторы запасов железа в костном мозге, Южноафриканский медицинский журнал, Vol. 61, (1982), стр. 432–434.
- McKenzie, Dean P .; МакГорри, Патрик Д .; Уоллес, Крис С .; Low, Lee H .; Кополов, Дэвид Л .; И Сингх, Брюс С .; Построение минимального диагностического дерева решений, Методы информации в медицине, Vol. 32 (1993), стр. 161–166.
- Мэджидсон, Джей; Подход CHAID к моделированию сегментации: автоматическое обнаружение взаимодействия хи-квадрат, в Bagozzi, Ричард П. (редактор); Передовые методы маркетинговых исследований, Блэквелл, Оксфорд, Великобритания, 1994, стр. 118–159.
- Хокинс, Дуглас М .; Янг, С. С .; И Росинко, А .; Анализ большого набора данных структура-активность с использованием рекурсивного разбиения, Количественные отношения структура-деятельность, Vol. 16, (1997), стр. 296–302.
Источники
- Luchman, J.N .; CHAID: модуль Stata для автоматического определения взаимодействия по хи-квадрат, Доступно бесплатно скачатьили введите в Stata: ssc install chaid.
- Luchman, J.N .; CHAIDFOREST: модуль Stata для проведения случайной классификации ансамблей лесов на основе автоматического обнаружения взаимодействий хи-квадрат (CHAID) в качестве базового обучающегося, Доступно бесплатно скачатьили введите в Stata: ssc install chaidforest.