Тест Глейзера: проверка гетероскедастичности МНК

Гетероскедастичность - одно из наиболее распространённых нарушений предпосылок классического МНК: дисперсия случайной ошибки меняется от наблюдения к наблюдению, а не остаётся постоянной. При этом коэффициенты регрессии остаются несмещёнными, но перестают быть эффективными, а стандартные ошибки оказываются некорректными - - и -критерии теряют надёжность. Тест Глейзера, предложенный в 1969 году, предлагает элегантный способ диагностики: вместо квадратов остатков он регрессирует их абсолютные значения на объясняющую переменную в трёх разных функциональных формах, что делает метод нечувствительным к выбросам. Протестируйте свою модель с помощью инструмента ниже.
Что такое гетероскедастичность и зачем её выявлять
В классической линейной регрессии предполагается гомоскедастичность: для всех . Нарушение этого условия - гетероскедастичность:
Типичный пример - модель потребительских расходов в зависимости от дохода: у домохозяйств с высоким доходом разброс расходов значительно шире, чем у малообеспеченных. На графике «остатки против подогнанных значений» это проявляется как «воронка»: разброс остатков нарастает по мере увеличения или фактора .
Последствия игнорирования гетероскедастичности:
- МНК-оценки несмещённы и состоятельны, но не являются наилучшими линейными несмещёнными (BLUE по теореме Гаусса-Маркова).
- Стандартные ошибки коэффициентов смещены (обычно занижены при нарастающей дисперсии).
- -статистики завышаются, что ведёт к ложному выводу о значимости переменных.
- Доверительные интервалы сужаются, теряя достоверность.
Диагностику гетероскедастичности проводят несколькими методами: визуальным анализом остатков, тестом Глейзера, тестом Бройша-Пагана, тестом Уайта. Тест Глейзера занимает особое место благодаря использованию абсолютных значений остатков.
Идея теста Глейзера: почему абсолютные остатки
Роберт Глейзер предложил в 1969 году регрессировать не квадраты остатков (как в тестах Бройша-Пагана и Уайта), а их абсолютные значения на объясняющую переменную в различных функциональных формах. Это принципиальное отличие: устойчивее к выбросам, поскольку не возводит большие остатки в квадрат, тем самым не раздувает их вклад непропорционально.
Нулевая гипотеза теста: : дисперсия не зависит от (гомоскедастичность). Альтернатива : дисперсия систематически связана с .
Логика: если гомоскедастичность выполняется, не должны демонстрировать никакой систематической зависимости от . Если же коэффициент во вспомогательной регрессии на оказывается значимым - это свидетельство гетероскедастичности.

Три формы вспомогательной регрессии
Ключевая особенность теста Глейзера состоит в том, что он не ограничивается одной функциональной формой связи между и . Глейзер предложил проверять три спецификации:
Форма 1 (линейная):
Используется, когда предполагается, что стандартное отклонение ошибки растёт пропорционально фактору. Характерна для моделей, где .
Форма 2 (корневая):
Подходит, когда дисперсия растёт медленнее, чем , - например, в моделях с более сглаженной зависимостью отклонения от масштаба фактора.
Форма 3 (обратная):
Применяется при убывающей гетероскедастичности - разброс остатков уменьшается с ростом , как бывает при агрегировании данных (у крупных фирм средние показатели стабильнее).
На практике исследователь оценивает все три или выбирает форму на основе экономической логики и визуального анализа остатков.
Алгоритм проведения теста
Процедура теста Глейзера состоит из пяти шагов.
Шаг 1. Оцените исходную регрессионную модель методом МНК. Получите остатки:
Шаг 2. Вычислите абсолютные значения остатков .
Шаг 3. Оцените вспомогательную регрессию выбранной формы МНК:
где - одна из трёх функциональных форм (, или ).
Шаг 4. Проверьте значимость коэффициента по стандартному -критерию:
где - стандартная ошибка оценки. Число степеней свободы: .
Шаг 5. Если - нулевая гипотеза отвергается: гетероскедастичность значима. Коэффициент указывает на характер связи между дисперсией и фактором.

Интерпретация результатов
Если коэффициент во вспомогательной регрессии значим, это указывает на конкретный тип гетероскедастичности, что напрямую подсказывает метод коррекции:
- Значим в форме : . Взвешенный МНК с весами устраняет нарушение.
- Значим в форме : . Взвешенный МНК с весами .
- Значим в форме : . Взвешенный МНК с весами .
Если ни одна из трёх форм не даёт значимого результата, тест Глейзера не обнаруживает гетероскедастичности. Однако это не исключает её полностью - нелинейные формы зависимости дисперсии, не предусмотренные тремя спецификациями, могут остаться незамеченными.
Всегда проверяйте несколько форм вспомогательной регрессии и сопровождайте тест Глейзера визуальным анализом графика |e_i| против x_i. Если форма зависимости нелинейная - рассмотрите тест Уайта с квадратами и произведениями факторов.
Пример расчёта
Рассмотрим модель зарплаты в зависимости от стажа: , наблюдений. МНК даёт остатки . Берём их абсолютные значения и строим три вспомогательных регрессии.
Для линейной формы получаем: , , . При , . Поскольку , гипотеза гомоскедастичности отвергается. Форма подтверждается.
Для корневой формы : - незначима. Для обратной формы: - незначима.
Вывод: гетероскедастичность имеет линейный характер. Применяем взвешенный МНК с весами .
Сравнение с тестом Бройша-Пагана и тестом Уайта
Три теста направлены на одну и ту же проблему, но используют разные вспомогательные регрессии.
Тест Глейзера регрессирует - это делает его устойчивее к выбросам, чем тесты, использующие . С другой стороны, линейная связь с не является строгим следствием теории дисперсии, что иногда критикуется в методологическом плане.
Тест Бройша-Пагана регрессирует нормированные квадраты остатков на и использует -статистику с степенями свободы. Он теоретически строже основан, но чувствительнее к отклонениям от нормальности ошибок (модификация Кенкера снимает эту проблему).
Тест Уайта добавляет в вспомогательную регрессию квадраты и попарные произведения , что делает его универсальным для нелинейной гетероскедастичности, но сильно увеличивает число степеней свободы при нескольких факторах.
| Характеристика | Тест Глейзера | Тест Бройша-Пагана | Тест Уайта |
|---|---|---|---|
| Зависимая переменная вспомогательной регрессии | |||
| Критерий значимости | -тест | ||
| Форм вспомогательной регрессии | 3 варианта | 1 | 1 (с крест-множителями) |
| Устойчивость к выбросам | Высокая | Средняя | Средняя |
| Диагностика формы нарушения | Явная | Нет | Нет |
Практическое правило: начинайте с визуальной диагностики и теста Глейзера (позволяет сразу выбрать форму коррекции); при нескольких факторах дополняйте тестом Бройша-Пагана.
Коррекция гетероскедастичности
Если тест Глейзера подтвердил гетероскедастичность, доступны три основных подхода к коррекции.
Взвешенный МНК (WLS / GLS). Наиболее эффективен, когда форма гетероскедастичности известна из теста. Каждое наблюдение умножается на вес , где оценка берётся из подогнанных значений вспомогательной регрессии Глейзера. Например, при линейной форме: . После взвешивания выполняется обычный МНК на трансформированных переменных.
Робастные стандартные ошибки Уайта (HC). Не меняет МНК-оценки коэффициентов, но пересчитывает их дисперсии с поправкой на гетероскедастичность. Быстрый и универсальный метод: в R - coeftest(model, vcov = hccm(model, type = "HC3")), в Stata - regress y x, vce(robust).
Преобразование переменных. Логарифмирование вместо часто стабилизирует дисперсию при мультипликативных ошибках. Подходит для моделей заработной платы, цен, объёмов производства.
При выборе WLS убедитесь, что форма гетероскедастичности задана верно: неправильная спецификация весов может привести к менее эффективным оценкам, чем обычный МНК. Робастные ошибки Уайта (HC) являются более безопасным выбором при неопределённости формы нарушения.
Ограничения теста Глейзера
При всей практичности метод имеет ряд известных ограничений.
Во-первых, тест обнаруживает только монотонную связь дисперсии с фактором в рамках трёх предложенных спецификаций. Если истинная форма гетероскедастичности иная (например, U-образная или зависит от нескольких факторов), тест может не отвергнуть нулевую гипотезу.
Во-вторых, при малых выборках () оценки ненадёжны, и мощность теста снижается. При вывод о значимости -статистики следует трактовать с осторожностью.
В-третьих, тест разработан для случая одного объясняющего фактора. При нескольких факторах () неясно, какой именно подставлять во вспомогательную регрессию; на практике тест повторяют для каждого фактора по отдельности. Это множественное тестирование увеличивает вероятность ошибки первого рода.
В-четвёртых, теоретически использование вместо менее обосновано с точки зрения теории максимального правдоподобия, что критикуется в методологической литературе.
Для более строгой диагностики при нескольких факторах предпочтителен тест Бройша-Пагана или тест Уайта. Тест Глейзера особенно ценен, когда экономическая теория подсказывает конкретный фактор-источник нарушения и позволяет выбрать форму коррекции.
Частые ошибки
- Не вычислять абсолютные значения. Тест Глейзера работает с , а не с или . Регрессия «сырых» остатков не выявит гетероскедастичность, поскольку знаки случайны и гасят друг друга.
- Проверять только одну форму вспомогательной регрессии. Если проверить лишь линейную форму и она не значима, это не исключает корневую или обратную зависимость дисперсии от фактора.
- Путать степени свободы. В -тесте вспомогательной регрессии число степеней свободы (один регрессор без константы).
- Применять тест к нескольким факторам без корректировки. При тестировании каждого из факторов по отдельности вероятность хотя бы одного ложноположительного вывода составляет . При и это уже ~14%.
- Не сопровождать тест визуальным анализом. График против наглядно показывает форму зависимости и помогает выбрать нужную спецификацию до формальной проверки.
FAQ
Чем тест Глейзера лучше теста Бройша-Пагана? Тест Глейзера устойчивее к выбросам, так как использует вместо - большие остатки не раздуваются возведением в квадрат. Кроме того, три формы вспомогательной регрессии позволяют сразу выявить тип нарушения и выбрать адекватный вес для взвешенного МНК. Тест Бройша-Пагана теоретически строже и легко обобщается на несколько факторов через -статистику.
Что делать, если все три формы дают значимый результат? Выберите форму с наибольшим вспомогательной регрессии или наибольшей -статистикой. Эта спецификация лучше всего описывает природу гетероскедастичности и подсказывает оптимальные веса для WLS. При сомнениях используйте универсальный метод - робастные ошибки Уайта.
Применим ли тест Глейзера к временным рядам? С осторожностью. Тест разрабатывался для поперечных данных. В случае временных рядов гетероскедастичность нередко сочетается с автокорреляцией, и стандартный -тест вспомогательной регрессии будет некорректен. Для временных рядов предпочтительнее условные гетероскедастичные модели класса ARCH/GARCH.
Коротко
Тест Глейзера проверяет гетероскедастичность через вспомогательную регрессию абсолютных значений остатков на функцию объясняющего фактора в трёх формах: , , . Значимость коэффициента по -критерию указывает на связь дисперсии ошибок с фактором. Форма значимой спецификации прямо подсказывает тип гетероскедастичности и выбор весов для взвешенного МНК. Метод устойчивее к выбросам по сравнению с тестами, использующими квадраты остатков, но ограничен одним фактором и монотонными формами нарушения. При нескольких факторах дополняйте тест Глейзера тестом Бройша-Пагана или робастными ошибками Уайта.
Читайте также

Стандартная ошибка коэффициента регрессии: формула и расчёт
Что такое стандартная ошибка коэффициента регрессии, как вывести формулу, рассчитать вручную и интерпретировать в эконометрике. Примеры и частые ошибки.

Тест Бройша-Пагана: проверка гетероскедастичности
Тест Бройша-Пагана для гетероскедастичности: вспомогательная регрессия, статистика LM, хи-квадрат критерий, модификация Кенкера и коррекция МНК-модели.

Тест Бройша-Пагана: проверка гетероскедастичности
Тест Бройша-Пагана выявляет гетероскедастичность остатков регрессии. Разбираем формулу LM-статистики, интерпретацию p-значения, варианты теста и типичные ошибки.