WikiDer > Правило случайного принятия решения - Википедия
В статистических теория принятия решений, а правило рандомизированного решения или же смешанное правило принятия решений это правило принятия решения который связывает вероятности с детерминированными правилами принятия решений. В задачах с конечными решениями рандомизированные решающие правила определяют набор рисков какой выпуклый корпус точек риска нерандомизированных правил принятия решений.
Поскольку для рандомизированных правил Байеса всегда существуют нерандомизированные альтернативы, рандомизация не требуется. Байесовская статистика, несмотря на то что частотник Статистическая теория иногда требует использования рандомизированных правил для удовлетворения таких условий оптимальности, как минимакс, особенно при выводе доверительные интервалы и проверка гипотез о дискретные распределения вероятностей.
Определение и толкование
Позволять быть набором нерандомизированных правил принятия решений с соответствующими вероятностями . Тогда рандомизированное решающее правило определяется как и связанные с ним функция риска является .[1] Это правило можно рассматривать как случайное эксперимент в котором правила решения выбираются с вероятностями соответственно.[2]
В качестве альтернативы, случайное правило принятия решения может назначать вероятности непосредственно элементам пространства действий. для каждого члена выборочного пространства. Более формально обозначает вероятность того, что действие выбран. При таком подходе его функция потерь также определяется непосредственно как: .[3]
Таким образом, введение рандомизированных правил принятия решений создает большее пространство для принятия решений, из которого статистик может выбрать свое решение. Поскольку нерандомизированные решающие правила являются частным случаем рандомизированных решающих правил, в которых одно решение или действие имеет вероятность 1, исходное пространство решений является правильным подмножеством нового пространства решений .[4]
Выбор рандомизированных правил принятия решений
Как и нерандомизированные решающие правила, рандомизированные решающие правила могут удовлетворять благоприятным свойствам, таким как допустимость, минимаксность и байесовский подход. Это будет проиллюстрировано в случае задачи с конечным решением, т.е. задачи, в которой пространство параметров представляет собой конечный набор, скажем, Множество рисков, в дальнейшем обозначаемое как , - это набор всех векторов, в которых каждая запись является значением функция риска связанный со случайным правилом принятия решений по определенному параметру: он содержит все векторы вида . Обратите внимание, что по определению правила рандомизированного принятия решения набор рисков - это выпуклый корпус рисков .[5]
В случае, когда пространство параметров имеет только два элемента и , это подмножество , поэтому его можно нарисовать относительно осей координат и соответствующие риски под и соответственно.[6] Пример показан справа.
Допустимость
An допустимое правило принятия решения - это правило, в котором не доминирует какое-либо другое правило принятия решения, то есть не существует правила принятия решения, которое имеет равный или меньший риск для всех параметров и строго более низкий риск, чем для некоторых параметров. В задаче с конечным решением точка риска допустимого правила принятия решения имеет либо более низкие координаты x, либо координаты y, чем все другие точки риска, либо, более формально, это набор правил с точками риска вида такой, что . Таким образом, левая часть нижней границы множества рисков представляет собой набор допустимых решающих правил.[6][7]
Минимакс
Минимаксное правило Байеса сводит к минимуму риск супремума. среди всех решающих правил в . Иногда в этом отношении правило рандомизированного решения может работать лучше, чем все другие правила нерандомизированного решения.[1]
В задаче конечного решения с двумя возможными параметрами правило минимакса можно найти, рассматривая семейство квадратов .[8] Значение за самый маленький из таких квадратов, который касается - минимаксный риск, а соответствующая точка или точки на множестве рисков - это минимаксное правило.
Если набор рисков пересекает линию , то допустимое решающее правило, лежащее на прямой, минимаксно. Если или же выполняется для каждой точки в наборе рисков, то правило минимакса может быть либо крайней точкой (т. е. нерандомизированным правилом принятия решения), либо линией, соединяющей две крайние точки (нерандомизированные правила принятия решения).[9][6]
Байесовский
Рандомизированное правило Байеса - это правило, имеющее нижнюю границу Байесовский риск среди всех решающих правил. В особом случае, когда пространство параметров состоит из двух элементов, строка , куда и обозначают априорные вероятности и соответственно, семейство точек с байесовским риском . Таким образом, минимальный байесовский риск для проблемы решения является наименьшим. так, чтобы линия касалась набора рисков.[10][11] Эта линия может касаться только одной крайней точки набора рисков, т.е. соответствовать нерандомизированному правилу принятия решений, или перекрываться со всей стороной набора рисков, то есть соответствовать двум нерандомизированным правилам принятия решений и правилам рандомизированного принятия решений, объединяющим их. Это иллюстрируется тремя ситуациями ниже:
Поскольку разные априорные значения приводят к разным наклонам, набор всех правил, которые являются байесовскими по отношению к некоторым априорным, совпадает с набором допустимых правил.[12]
Обратите внимание, что невозможна ситуация, когда нерандомизированное правило Байеса не существует, но существует случайное правило Байеса. Существование рандомизированного правила Байеса подразумевает существование нерандомизированного правила Байеса. Это также верно в общем случае, даже с бесконечным пространством параметров, бесконечным байесовским риском и независимо от того, может ли быть достигнут бесконечный байесовский риск.[3][12] Это поддерживает интуитивное представление о том, что статистику не нужно использовать рандомизацию для принятия статистических решений.[4]
На практике
Поскольку у рандомизированных правил Байеса всегда есть нерандомизированные альтернативы, они не нужны в Байесовская статистика. Однако в частотной статистике рандомизированные правила теоретически необходимы в определенных ситуациях,[13] и считались полезными на практике, когда они были впервые изобретены: Эгон Пирсон прогнозируют, что они «не встретят резких возражений».[14] Однако в настоящее время немногие статистики действительно применяют их.[14][15]
Рандомизированный тест
В обычной формулировке тест отношения правдоподобия, то нулевая гипотеза отклоняется всякий раз, когда отношение правдоподобия меньше некоторой константы , и принимается иначе. Однако это иногда проблематично, когда является дискретный при нулевой гипотезе, когда возможно.
Решение состоит в том, чтобы определить функция тестирования , значение которой является вероятностью принятия нулевой гипотезы:[16][17]
Это можно интерпретировать как подбрасывание необъективной монеты с вероятностью возвращать головы всякий раз, когда и отвергая нулевую гипотезу, если кричит.[15]
Обобщенная форма Лемма Неймана-Пирсона заявляет, что этот тест имеет максимальную мощность среди всех тестов на одном уровне значимости , что такой тест должен существовать для любого уровня значимости , и что тест уникален в нормальных ситуациях.[18]
В качестве примера рассмотрим случай, когда базовое распределение Бернулли с вероятностью , и мы хотели бы проверить нулевую гипотезу против альтернативной гипотезы . Естественно выбрать несколько такой, что , и отклонять нуль всякий раз, когда , куда это тестовая статистика. Однако, чтобы учесть случаи, когда , определяем тестовую функцию:
куда выбирается так, что .
Рандомизированные доверительные интервалы
Аналогичная проблема возникает при построении доверительных интервалов. Например, Интервал Клоппера-Пирсона всегда консервативен из-за дискретного характера биномиального распределения. Альтернативой является определение верхнего и нижнего доверительных интервалов. и путем решения следующих уравнений:[14]
куда это однородная случайная величина на (0, 1).
Смотрите также
Сноски
- ^ а б Янг и Смит, стр. 11
- ^ Бикель и Доксум, с. 28
- ^ а б Пармиджани, стр. 132
- ^ а б ДеГрут, стр.128-129.
- ^ Бикель и Доксум, стр.29
- ^ а б c Янг и Смит, стр.12
- ^ Бикель и Доксум, с. 32
- ^ Бикель и Доксум, стр.30
- ^ Янг и Смит, стр.14–16.
- ^ Янг и Смит, стр. 13
- ^ Бикель и Доксум, стр. 29–30.
- ^ а б Бикель и Доксум, стр.31
- ^ Роберт, стр.66
- ^ а б c Агрести и Готтард, стр.367
- ^ а б Бикель и Доксум, с.224.
- ^ Янг и Смит, стр.68.
- ^ Роберт, стр.243
- ^ Янг и Смит, стр.68.
Библиография
- Агрести, Алан; Готтард, Анна (2005). «Комментарий: рандомизированные доверительные интервалы и подход среднего значения» (PDF). Статистическая наука. 5 (4): 367–371. Дои:10.1214/088342305000000403.
- Бикель, Питер Дж .; Доксум, Челл А. (2001). Математическая статистика: основные идеи и избранные темы (2-е изд.). Река Аппер Сэдл, штат Нью-Джерси: Прентис-Холл. ISBN 978-0138503635.
- ДеГрут, Моррис Х. (2004). Оптимальные статистические решения. Хобокен, штат Нью-Джерси: Wiley-Interscience. ISBN 978-0471680291.
- Пармиджани, Джованни; Иноуэ, Лурдес Ю. Т. (2009). Теория принятия решений: принципы и подходы. Чичестер, Западный Суссекс: Джон Вили и сыновья. ISBN 9780470746684.
- Роберт, Кристиан П. (2007). Байесовский выбор: от основ теории принятия решений до вычислительной реализации. Нью-Йорк: Спрингер. ISBN 9780387715988.
- Young, G.A .; Смит, Р.Л. (2005). Основы статистического вывода. Кембридж: Издательство Кембриджского университета. ISBN 9780521548663.