WikiDer > Полная пространственная случайность
эта статья требует внимания специалиста по статистике.Июнь 2009 г.) ( |
Полная пространственная случайность (CSR) описывает точечный процесс посредством чего точечные события происходят в пределах данной области исследования совершенно случайным образом. Это синоним однородного пространственный пуассоновский процесс.[1] Такой процесс моделируется одним параметром. , то есть плотность точек в определенной области. Термин полная пространственная случайность обычно используется в прикладной статистике в контексте изучения определенных точечных паттернов, тогда как в большинстве других статистических контекстов он относится к концепции пространственного процесса Пуассона.[1]
Модель
Данные в виде набора точек, неравномерно распределенных в определенной области пространства, возникают во многих различных контекстах; Примеры включают расположение деревьев в лесу, птичьих гнезд, ядер в тканях, больных людей из группы риска. Мы называем любой такой набор данных пространственным точечным шаблоном и называем местоположения событиями, чтобы отличить их от произвольных точек рассматриваемого региона. Гипотеза полной пространственной случайности для пространственного точечного паттерна утверждает, что количество событий в любом регионе следует за распределение Пуассона с заданным средним числом на одно подразделение. События паттерна независимо и равномерно распределены в пространстве; Другими словами, события с одинаковой вероятностью произойдут где угодно и не будут взаимодействовать друг с другом.
«Униформа» используется в смысле следующего равномерное распределение вероятностей по изучаемому региону, а не в смысле «равномерно» рассредоточены по изучаемому региону.[2] Между событиями нет взаимодействий, поскольку интенсивность событий не меняется по плоскости. Например, предположение о независимости будет нарушено, если наличие одного события либо поощряет, либо препятствует возникновению других событий в окрестностях.
Распределение
Вероятность найти именно точки в районе с плотностью событий следовательно является:
Первый момент которого, средний количество точек в области, просто . Это значение интуитивно понятно, так как это параметр скорости Пуассона.
Вероятность обнаружения сосед любой заданной точки на некотором радиальном расстоянии является:
где это количество измерений, - параметр, зависящий от плотности, определяемый как и это гамма-функция, который, когда его аргумент является целым числом, является просто факториал функция.
Ожидаемая стоимость может быть получен с помощью гамма-функции с использованием статистических моментов. Первый момент - это среднее расстояние между случайно распределенными частицами в Габаритные размеры.
Приложения
Изучение CSR важно для сравнения измеренных точечных данных из экспериментальных источников. Как метод статистического тестирования, тест CSR имеет множество приложений в социальные науки и в астрономических исследованиях.[3] КСО часто является стандартом, по которому тестируются наборы данных. В общих чертах описан один из подходов к проверке гипотезы CSR:[4]
- Использовать статистика которые являются функцией расстояния от каждого события до следующего ближайшего события.
- Сначала сосредоточьтесь на конкретном событии и сформулируйте метод проверки того, являются ли событие и следующее ближайшее событие значительно близкими (или далекими).
- Затем рассмотрите все события и сформулируйте метод проверки того, является ли среднее расстояние от каждого события до следующего ближайшего события значительно коротким (или длинным).
В случаях, когда аналитическое вычисление тестовой статистики затруднено, численные методы, такие как Метод Монте-Карло используется моделирование, моделируя случайный процесс большое количество раз.[4]
использованная литература
- ^ а б О. Маймон, Л. Рокач, Справочник по интеллектуальному анализу данных и обнаружению знаний , Второе издание, Springer 2010, страницы 851-852
- ^ Л. А. Уоллер, К. А. Готуэй, Прикладная пространственная статистика для данных общественного здравоохранения, том 1 Уайли Чичестер, 2004 г., страницы 119–121, 123–127, 137, 139–141, 146–148, 150–151, 157, 203.
- ^ «Статистика Венеры: кратеры и катастрофы».
- ^ а б А. Окабе, К. Сугихара, «Пространственный анализ по сетям - статистические и вычислительные методы», том 1, Вили Чичестер, 2012 г., страницы 135-136
дальнейшее чтение
- Диггл, П. Дж. (2003). Статистический анализ шаблонов пространственных точек (2-е изд.). Нью-Йорк: Academic Press. ISBN 0340740701.