Дефицит (статистика)

Количественный способ сравнения статистических моделей

В статистике дефицит — это мера сравнения статистической модели с другой статистической моделью. Эта концепция была введена в 1960-х годах французским математиком Люсьеном Ле Камом , который использовал ее для доказательства приближенной версии теоремы Блэквелла–Шермана–Штейна. [1] [2] Тесно связана с расстоянием Ле Кама , псевдометрикой максимального дефицита между двумя статистическими моделями. Если дефицит модели по отношению к равен нулю, то говорят, что лучше , информативнее или сильнее, чем . Э {\displaystyle {\mathcal {E}}} F {\displaystyle {\mathcal {F}}} E {\displaystyle {\mathcal {E}}} F {\displaystyle {\mathcal {F}}}

Введение

Ле Кам определил статистическую модель более абстрактно, чем вероятностное пространство с семейством вероятностных мер. Он также не использовал термин «статистическая модель», а вместо этого использовал термин «эксперимент». В своей публикации 1964 года он представил статистический эксперимент для набора параметров как тройку , состоящую из набора , векторной решетки с единицей и семейства нормализованных положительных функционалов на . [3] [4] В своей книге 1986 года он опустил и . [5] Эта статья следует его определению 1986 года и использует его терминологию, чтобы подчеркнуть обобщение. Θ {\displaystyle \Theta } ( X , E , ( P θ ) θ Θ ) {\displaystyle (X,E,(P_{\theta })_{\theta \in \Theta })} X {\displaystyle X} E {\displaystyle E} I {\displaystyle I} ( P θ ) θ Θ {\displaystyle (P_{\theta })_{\theta \in \Theta }} E {\displaystyle E} E {\displaystyle E} X {\displaystyle X}

Формулировка

Основные понятия

Пусть будет параметрическим пространством. Дано абстрактное L 1 -пространство (т.е. банахова решетка, такая что для элементов также выполняется), состоящее из линейных положительных функционалов . Эксперимент - это отображение вида , такое что . - полоса, индуцированная и поэтому мы используем обозначение . Для обозначим . Топологическое сопряженное к L-пространству с сопряженной нормой называется абстрактным M-пространством . Это также решетка с единицей, определенной через для . Θ {\displaystyle \Theta } ( L , ) {\displaystyle (L,\|\cdot \|)} x , y 0 {\displaystyle x,y\geq 0} x + y = x + y {\displaystyle \|x+y\|=\|x\|+\|y\|} { P θ : θ Θ } {\displaystyle \{P_{\theta }:\theta \in \Theta \}} E {\displaystyle {\mathcal {E}}} E : Θ L {\displaystyle {\mathcal {E}}:\Theta \to L} θ P θ {\displaystyle \theta \mapsto P_{\theta }} P θ = 1 {\displaystyle \|P_{\theta }\|=1} L {\displaystyle L} { P θ : θ Θ } {\displaystyle \{P_{\theta }:\theta \in \Theta \}} L ( E ) {\displaystyle L({\mathcal {E}})} μ L ( E ) {\displaystyle \mu \in L({\mathcal {E}})} μ + = μ 0 = max ( μ , 0 ) {\displaystyle \mu ^{+}=\mu \vee 0=\max(\mu ,0)} M {\displaystyle M} u M = sup { | u , μ | ; μ L 1 } {\displaystyle \|u\|_{M}=\sup\{|\langle u,\mu \rangle |;\|\mu \|_{L}\leq 1\}} I μ = μ + L μ L {\displaystyle I\mu =\|\mu ^{+}\|_{L}-\|\mu ^{-}\|_{L}} μ L {\displaystyle \mu \in L}

Пусть и будут двумя L-пространствами двух экспериментов и , тогда положительное, сохраняющее норму линейное отображение, т.е. для всех , называется переходом. Сопряженный к переходу — это положительное линейное отображение из дуального пространства в дуальное пространство , такое, что единица является образом единицы ist. [5] L ( A ) {\displaystyle L(A)} L ( B ) {\displaystyle L(B)} A {\displaystyle A} B {\displaystyle B} T μ + = μ + {\displaystyle \|T\mu ^{+}\|=\|\mu ^{+}\|} μ L ( A ) {\displaystyle \mu \in L(A)} M B {\displaystyle M_{B}} L ( B ) {\displaystyle L(B)} M A {\displaystyle M_{A}} L ( A ) {\displaystyle L(A)} M A {\displaystyle M_{A}} M B {\displaystyle M_{B}}

Дефицит

Пусть — пространство параметров, а и — два эксперимента, индексированные как . Пусть и обозначают соответствующие L-пространства, а — множество всех переходов из в . Θ {\displaystyle \Theta } E : θ P θ {\displaystyle {\mathcal {E}}:\theta \to P_{\theta }} F : θ Q θ {\displaystyle {\mathcal {F}}:\theta \to Q_{\theta }} Θ {\displaystyle \Theta } L ( E ) {\displaystyle L({\mathcal {E}})} L ( F ) {\displaystyle L({\mathcal {F}})} T {\displaystyle {\mathcal {T}}} L ( E ) {\displaystyle L({\mathcal {E}})} L ( F ) {\displaystyle L({\mathcal {F}})}

Дефицит по отношению к — это число , определяемое через inf sup : δ ( E , F ) {\displaystyle \delta ({\mathcal {E}},{\mathcal {F}})} E {\displaystyle {\mathcal {E}}} F {\displaystyle {\mathcal {F}}}

δ ( E , F ) := inf T T sup θ Θ 1 2 Q θ T P θ TV , {\displaystyle \delta ({\mathcal {E}},{\mathcal {F}}):=\inf \limits _{T\in {\mathcal {T}}}\sup \limits _{\theta \in \Theta }{\tfrac {1}{2}}\|Q_{\theta }-TP_{\theta }\|_{\text{TV}},} [6]

где обозначена общая норма вариации . Фактор используется только для вычислительных целей и иногда опускается. TV {\displaystyle \|\cdot \|_{\text{TV}}} μ TV = μ + + μ {\displaystyle \|\mu \|_{\text{TV}}=\mu ^{+}+\mu ^{-}} 1 2 {\displaystyle {\tfrac {1}{2}}}

Расстояние Ле Кама

Расстояние Ле Кама — это следующая псевдометрика

Δ ( E , F ) := max ( δ ( E , F ) , δ ( F , E ) ) . {\displaystyle \Delta ({\mathcal {E}},{\mathcal {F}}):=\operatorname {max} \left(\delta ({\mathcal {E}},{\mathcal {F}}),\delta ({\mathcal {F}},{\mathcal {E}})\right).}

Это индуцирует отношение эквивалентности и когда , то говорят, что и эквивалентны . Эквивалентный класс также называется типом . Δ ( E , F ) = 0 {\displaystyle \Delta ({\mathcal {E}},{\mathcal {F}})=0} E {\displaystyle {\mathcal {E}}} F {\displaystyle {\mathcal {F}}} C E {\displaystyle C_{\mathcal {E}}} E {\displaystyle {\mathcal {E}}} E {\displaystyle {\mathcal {E}}}

Часто интересуются семействами экспериментов с и с . Если как , то говорят, что и асимптотически эквивалентны . ( E n ) n {\displaystyle ({\mathcal {E}}_{n})_{n}} { P n , θ : θ Θ n } {\displaystyle \{P_{n,\theta }\colon \theta \in \Theta _{n}\}} ( F n ) n {\displaystyle ({\mathcal {F}}_{n})_{n}} { Q n , θ : θ Θ n } {\displaystyle \{Q_{n,\theta }\colon \theta \in \Theta _{n}\}} Δ ( E n , F n ) = 0 {\displaystyle \Delta ({\mathcal {E}}_{n},{\mathcal {F}}_{n})=0} n {\displaystyle n\to \infty } ( E n ) {\displaystyle ({\mathcal {E}}_{n})} ( F n ) {\displaystyle ({\mathcal {F}}_{n})}

Пусть будет параметрическим пространством и будет множеством всех типов, которые индуцируются , тогда расстояние Ле Кама является полным относительно . Условие индуцирует частичный порядок на , можно сказать, что он лучше или более информативен или сильнее , чем . [6] Θ {\displaystyle \Theta } E ( Θ ) {\displaystyle E(\Theta )} Θ {\displaystyle \Theta } Δ {\displaystyle \Delta } E ( Θ ) {\displaystyle E(\Theta )} δ ( E , F ) = 0 {\displaystyle \delta ({\mathcal {E}},{\mathcal {F}})=0} E ( Θ ) {\displaystyle E(\Theta )} E {\displaystyle {\mathcal {E}}} F {\displaystyle {\mathcal {F}}}

Ссылки

  1. ^ Le Cam, Lucien (1964). «Достаточность и приближенная достаточность». Annals of Mathematical Statistics . 35 (4). Institute of Mathematical Statistics : 1429. doi : 10.1214/aoms/1177700372 .
  2. ^ Торгерсен, Эрик (1991). Сравнение статистических экспериментов . Cambridge University Press, Соединенное Королевство. С.  222–257 . doi :10.1017/CBO9780511666353.
  3. ^ Le Cam, Lucien (1964). «Достаточность и приближенная достаточность». Annals of Mathematical Statistics . 35 (4). Institute of Mathematical Statistics : 1421. doi : 10.1214/aoms/1177700372 .
  4. ^ Ван дер Ваарт, Аад (2002). «Статистическая работа Люсьена Ле Кама». Анналы статистики . 30 (3): 631–82 . JSTOR  2699973.
  5. ^ ab Le Cam, Lucien (1986). Асимптотические методы в статистической теории принятия решений . Springer Series in Statistics. Springer, New York. С.  1– 5. doi :10.1007/978-1-4612-4946-7.
  6. ^ ab Le Cam, Lucien (1986). Асимптотические методы в статистической теории принятия решений . Springer Series in Statistics. Springer, New York. С.  18– 19. doi :10.1007/978-1-4612-4946-7.

Библиография

  • Le Cam, Lucien (1986). Асимптотические методы в статистической теории принятия решений . Springer Series in Statistics. Springer, New York. doi :10.1007/978-1-4612-4946-7.
  • Le Cam, Lucien (1964). «Достаточность и приближенная достаточность». Annals of Mathematical Statistics . 35 (4). Institute of Mathematical Statistics : 1419– 1455. doi : 10.1214/aoms/1177700372 .
  • Торгерсен, Эрик (1991). Сравнение статистических экспериментов . Cambridge University Press, Соединенное Королевство. doi :10.1017/CBO9780511666353.
Retrieved from "https://en.wikipedia.org/w/index.php?title=Deficiency_(statistics)&oldid=1266772693#Le_Cam_distance"