Количественный способ сравнения статистических моделей
В статистике дефицит — это мера сравнения статистической модели с другой статистической моделью. Эта концепция была введена в 1960-х годах французским математиком Люсьеном Ле Камом , который использовал ее для доказательства приближенной версии теоремы Блэквелла–Шермана–Штейна. [1] [2] Тесно связана с расстоянием Ле Кама , псевдометрикой максимального дефицита между двумя статистическими моделями. Если дефицит модели по отношению к равен нулю, то говорят, что лучше , информативнее или сильнее, чем .
Введение
Ле Кам определил статистическую модель более абстрактно, чем вероятностное пространство с семейством вероятностных мер. Он также не использовал термин «статистическая модель», а вместо этого использовал термин «эксперимент». В своей публикации 1964 года он представил статистический эксперимент для набора параметров как тройку , состоящую из набора , векторной решетки с единицей и семейства нормализованных положительных функционалов на . [3] [4] В своей книге 1986 года он опустил и . [5]
Эта статья следует его определению 1986 года и использует его терминологию, чтобы подчеркнуть обобщение.
Формулировка
Основные понятия
Пусть будет параметрическим пространством. Дано абстрактное L 1 -пространство (т.е. банахова решетка, такая что для элементов также выполняется), состоящее из линейных положительных функционалов . Эксперимент - это отображение вида , такое что . - полоса, индуцированная и поэтому мы используем обозначение . Для обозначим . Топологическое сопряженное к L-пространству с сопряженной нормой называется абстрактным M-пространством . Это также решетка с единицей, определенной через для .
Пусть и будут двумя L-пространствами двух экспериментов и , тогда положительное, сохраняющее норму линейное отображение, т.е. для всех , называется переходом. Сопряженный к переходу — это положительное линейное отображение из дуального пространства в дуальное пространство , такое, что единица является образом единицы ist. [5]
Дефицит
Пусть — пространство параметров, а и — два эксперимента, индексированные как . Пусть и обозначают соответствующие L-пространства, а — множество всех переходов из в .
Дефицит по отношению к — это число , определяемое через inf sup :
[6]
где обозначена общая норма вариации . Фактор используется только для вычислительных целей и иногда опускается.
Расстояние Ле Кама
Расстояние Ле Кама — это следующая псевдометрика
Это индуцирует отношение эквивалентности и когда , то говорят, что и эквивалентны . Эквивалентный класс также называется типом .
Часто интересуются семействами экспериментов с и с . Если как , то говорят, что и асимптотически эквивалентны .
Пусть будет параметрическим пространством и будет множеством всех типов, которые индуцируются , тогда расстояние Ле Кама является полным относительно . Условие индуцирует частичный порядок на , можно сказать, что он лучше или более информативен или сильнее , чем . [6]
^ Ван дер Ваарт, Аад (2002). «Статистическая работа Люсьена Ле Кама». Анналы статистики . 30 (3): 631–82 . JSTOR 2699973.
^ ab Le Cam, Lucien (1986). Асимптотические методы в статистической теории принятия решений . Springer Series in Statistics. Springer, New York. С. 1– 5. doi :10.1007/978-1-4612-4946-7.
^ ab Le Cam, Lucien (1986). Асимптотические методы в статистической теории принятия решений . Springer Series in Statistics. Springer, New York. С. 18– 19. doi :10.1007/978-1-4612-4946-7.
Библиография
Le Cam, Lucien (1986). Асимптотические методы в статистической теории принятия решений . Springer Series in Statistics. Springer, New York. doi :10.1007/978-1-4612-4946-7.