Состоятельная оценка параметра: определение и проверка

Состоятельная оценка параметра - это статистическая оценка, которая сходится по вероятности к истинному значению параметра при неограниченном росте объёма выборки. Иными словами, чем больше данных мы собираем, тем точнее такая оценка «попадает» в неизвестное число, которое мы пытаемся восстановить. Это одно из базовых требований математической статистики: бессмысленно пользоваться правилом, которое даже на бесконечной выборке не приближается к правде. Ниже разберём строгое определение, отличие от несмещённости, достаточные условия состоятельности, роль закона больших чисел и типовые приёмы проверки конкретных оценок.
Что такое оценка параметра
Пусть имеется выборка из распределения, зависящего от неизвестного параметра . Оценкой называют любую функцию от выборки , которой мы пользуемся вместо настоящего значения . Например, выборочное среднее - это оценка математического ожидания.
Поскольку выборка случайна, сама оценка тоже случайная величина: на разных выборках она принимает разные значения. Поэтому говорить о «правильности» одной конкретной оценки нельзя - нас интересует поведение последовательности оценок при росте . Состоятельность как раз и описывает это асимптотическое поведение.
Состоятельная оценка параметра: строгое определение
Оценка называется состоятельной, если она сходится по вероятности к истинному значению параметра :
Распишем это определение явно. Для любого сколь угодно малого вероятность отклонения оценки от истинного значения больше чем на стремится к нулю:
Содержательно это означает: увеличивая выборку, мы можем сделать вероятность «грубой ошибки» сколь угодно малой. Чтобы быстро проверить конкретную оценку на состоятельность по этому определению, удобно сначала собрать все известные факты в один запрос - для этого ниже есть интерактивный помощник.
Сильная и слабая состоятельность
Определение через сходимость по вероятности задаёт слабую состоятельность - её обычно и подразумевают, когда говорят просто «состоятельная оценка». Существует и более сильное требование.
Оценка называется сильно состоятельной, если она сходится к почти наверное:
Сходимость почти наверное влечёт сходимость по вероятности, поэтому всякая сильно состоятельная оценка является и слабо состоятельной, но не наоборот. На практике для большинства классических оценок (выборочное среднее, выборочная дисперсия) выполняется именно сильная состоятельность, что гарантируется усиленным законом больших чисел.
Чем состоятельность отличается от несмещённости
Состоятельность и несмещённость - два разных свойства, и их часто путают. Оценка несмещённая, если её математическое ожидание равно параметру при любом объёме выборки:
Это свойство «в среднем», относящееся к фиксированному . Состоятельность же - асимптотическое свойство, описывающее предел при . Эти свойства не вытекают одно из другого:
- Оценка может быть несмещённой, но несостоятельной (например, - всегда несмещённая оценка среднего, но её дисперсия не убывает, и сходимости нет).
- Оценка может быть смещённой, но состоятельной (например, выборочная дисперсия с делением на систематически занижена, но смещение исчезает при росте ).
Полезный частный критерий: если асимптотически несмещённая () и её дисперсия стремится к нулю (), то оценка состоятельна. Этот результат - прямое следствие неравенства Чебышёва.
Достаточное условие состоятельности через дисперсию
Самый удобный практический инструмент проверки опирается на неравенство Маркова и неравенство Чебышёва. Пусть оценка асимптотически несмещённая. Применим неравенство Чебышёва:
Если и , то правая часть стремится к нулю, а значит . Сформулируем достаточное условие компактно:
Это самая частая схема проверки на состоятельность: достаточно вычислить математическое ожидание оценки и её дисперсию, а затем перейти к пределу. Подчеркнём, что условие лишь достаточное - состоятельная оценка может иметь и не убывающую к нулю дисперсию, если используются более тонкие предельные теоремы.
Закон больших чисел как источник состоятельности
Главный «поставщик» состоятельных оценок - закон больших чисел (ЗБЧ). Слабый закон больших чисел утверждает, что для независимых одинаково распределённых величин с конечным математическим ожиданием выборочное среднее сходится по вероятности к :
Отсюда сразу следует, что - состоятельная оценка математического ожидания. Усиленный закон больших чисел даёт сходимость почти наверное, то есть и сильную состоятельность. Метод моментов как раз эксплуатирует ЗБЧ: выборочные моменты состоятельно оценивают теоретические, а значит и непрерывные функции от них (по теореме о непрерывном отображении) дают состоятельные оценки исходных параметров.
Примеры проверки оценок на состоятельность
Рассмотрим распределение Бернулли с параметром . Оценка (доля «успехов») несмещённая, а её дисперсия равна . По достаточному условию оценка состоятельна.
Для нормального распределения выборочная дисперсия
несмещённая, а её дисперсия имеет порядок и стремится к нулю - оценка дисперсии состоятельна. Версия с делением на смещена, но смещение убывает как , поэтому она тоже состоятельна. Оценки максимального правдоподобия при выполнении условий регулярности также состоятельны - это одна из причин их повсеместного использования.
Частые ошибки
- Путают состоятельность и несмещённость. Несмещённость - свойство при каждом фиксированном , состоятельность - поведение в пределе. Одно не влечёт другое.
- Считают убывание дисперсии необходимым. вместе с асимптотической несмещённостью - лишь достаточное условие, а не критерий.
- Забывают проверить асимптотическую несмещённость. Если сходится не к , а к другому числу, то даже при нулевом пределе дисперсии оценка сходится «не туда».
- Применяют ЗБЧ без проверки условий. Для классического закона больших чисел нужны конечное математическое ожидание (для дисперсионного варианта - и конечная дисперсия) и независимость; при тяжёлых хвостах оценка может оказаться несостоятельной.
- Путают сходимость по вероятности и почти наверное. Слабая и сильная состоятельность - разные свойства; первое слабее второго.
FAQ
Может ли оценка быть состоятельной, но смещённой? Да. Классический пример - выборочная дисперсия с делением на : она систематически занижена при любом , но смещение убывает как , поэтому оценка остаётся состоятельной.
Что проверять в первую очередь, чтобы доказать состоятельность? Удобнее всего использовать достаточное условие: показать, что (асимптотическая несмещённость) и . Если оба предела выполняются, оценка состоятельна по неравенству Чебышёва.
Гарантирует ли метод максимального правдоподобия состоятельность? При выполнении условий регулярности (идентифицируемость, гладкость функции правдоподобия, конечность информации Фишера) оценки максимального правдоподобия состоятельны. Без этих условий гарантии нет.
Коротко
Состоятельная оценка параметра - оценка, сходящаяся по вероятности к истинному значению при , то есть . Это асимптотическое свойство, не совпадающее с несмещённостью: смещённая оценка может быть состоятельной и наоборот. Самый ходовой способ проверки - достаточное условие через неравенство Чебышёва: асимптотическая несмещённость плюс стремление дисперсии к нулю. Главный источник состоятельных оценок - закон больших чисел, благодаря которому выборочные среднее и моменты сходятся к теоретическим, а вместе с условиями регулярности состоятельны и оценки максимального правдоподобия.
Читайте также

Достаточная статистика: что это и критерий факторизации
Достаточная статистика простыми словами: строгое определение через условное распределение и критерий факторизации Неймана-Фишера, разбор связи с правдоподобием и примеры.

Метод моментов: оценивание параметров распределения
Метод моментов оценивание параметров: суть приёма, приравнивание выборочных и теоретических моментов, пошаговый алгоритм, примеры для нормального, показательного и равномерного распределений, свойства и ошибки.

Неравенство Крамера-Рао: нижняя граница дисперсии
Неравенство Крамера-Рао: строгая формулировка нижней границы дисперсии несмещённой оценки, информация Фишера, условия регулярности, эффективные оценки и примеры вычисления границы.