EssayAI
Блог
Блог
Математика и алгоритмы

Тест Глейзера: проверка гетероскедастичности МНК

17 июня 2026Время чтения: 11 минут
#тест Глейзера#гетероскедастичность#эконометрика#регрессия#МНК
Тест Глейзера: проверка гетероскедастичности МНК

Гетероскедастичность - одно из наиболее распространённых нарушений предпосылок классического МНК: дисперсия случайной ошибки меняется от наблюдения к наблюдению, а не остаётся постоянной. При этом коэффициенты регрессии остаются несмещёнными, но перестают быть эффективными, а стандартные ошибки оказываются некорректными - tt- и FF-критерии теряют надёжность. Тест Глейзера, предложенный в 1969 году, предлагает элегантный способ диагностики: вместо квадратов остатков он регрессирует их абсолютные значения на объясняющую переменную в трёх разных функциональных формах, что делает метод нечувствительным к выбросам. Протестируйте свою модель с помощью инструмента ниже.

Что такое гетероскедастичность и зачем её выявлять

В классической линейной регрессии yi=β0+β1x1i++βkxki+εiy_i = \beta_0 + \beta_1 x_{1i} + \dots + \beta_k x_{ki} + \varepsilon_i предполагается гомоскедастичность: Var(εi)=σ2=const\operatorname{Var}(\varepsilon_i) = \sigma^2 = \text{const} для всех ii. Нарушение этого условия - гетероскедастичность:

Var(εi)=σi2,σi2σj2 при ij.\operatorname{Var}(\varepsilon_i) = \sigma_i^2, \quad \sigma_i^2 \neq \sigma_j^2 \text{ при } i \neq j.

Типичный пример - модель потребительских расходов в зависимости от дохода: у домохозяйств с высоким доходом разброс расходов значительно шире, чем у малообеспеченных. На графике «остатки против подогнанных значений» это проявляется как «воронка»: разброс остатков нарастает по мере увеличения y^i\hat{y}_i или фактора xix_i.

Последствия игнорирования гетероскедастичности:

  • МНК-оценки несмещённы и состоятельны, но не являются наилучшими линейными несмещёнными (BLUE по теореме Гаусса-Маркова).
  • Стандартные ошибки коэффициентов смещены (обычно занижены при нарастающей дисперсии).
  • tt-статистики завышаются, что ведёт к ложному выводу о значимости переменных.
  • Доверительные интервалы сужаются, теряя достоверность.

Диагностику гетероскедастичности проводят несколькими методами: визуальным анализом остатков, тестом Глейзера, тестом Бройша-Пагана, тестом Уайта. Тест Глейзера занимает особое место благодаря использованию абсолютных значений остатков.

Идея теста Глейзера: почему абсолютные остатки

Роберт Глейзер предложил в 1969 году регрессировать не квадраты остатков ei2e_i^2 (как в тестах Бройша-Пагана и Уайта), а их абсолютные значения ei|e_i| на объясняющую переменную xix_i в различных функциональных формах. Это принципиальное отличие: ei|e_i| устойчивее к выбросам, поскольку не возводит большие остатки в квадрат, тем самым не раздувает их вклад непропорционально.

Нулевая гипотеза теста: H0H_0: дисперсия σi2\sigma_i^2 не зависит от xix_i (гомоскедастичность). Альтернатива H1H_1: дисперсия систематически связана с xix_i.

Логика: если гомоскедастичность выполняется, ei|e_i| не должны демонстрировать никакой систематической зависимости от xix_i. Если же коэффициент bb во вспомогательной регрессии ei|e_i| на f(xi)f(x_i) оказывается значимым - это свидетельство гетероскедастичности.

Три формы вспомогательной регрессии теста Глейзера: линейная, корень и обратная зависимость |e| от x
Три формы вспомогательной регрессии теста Глейзера: линейная, корень и обратная зависимость |e| от x

Три формы вспомогательной регрессии

Ключевая особенность теста Глейзера состоит в том, что он не ограничивается одной функциональной формой связи между ei|e_i| и xix_i. Глейзер предложил проверять три спецификации:

Форма 1 (линейная):

ei=α+βxi+ui|e_i| = \alpha + \beta x_i + u_i

Используется, когда предполагается, что стандартное отклонение ошибки растёт пропорционально фактору. Характерна для моделей, где σi=σxi\sigma_i = \sigma \cdot x_i.

Форма 2 (корневая):

ei=α+βxi+ui|e_i| = \alpha + \beta \sqrt{x_i} + u_i

Подходит, когда дисперсия растёт медленнее, чем xix_i, - например, в моделях с более сглаженной зависимостью отклонения от масштаба фактора.

Форма 3 (обратная):

ei=α+βxi+ui|e_i| = \alpha + \frac{\beta}{x_i} + u_i

Применяется при убывающей гетероскедастичности - разброс остатков уменьшается с ростом xix_i, как бывает при агрегировании данных (у крупных фирм средние показатели стабильнее).

На практике исследователь оценивает все три или выбирает форму на основе экономической логики и визуального анализа остатков.

Алгоритм проведения теста

Процедура теста Глейзера состоит из пяти шагов.

Шаг 1. Оцените исходную регрессионную модель методом МНК. Получите остатки:

ei=yiy^i,i=1,,n.e_i = y_i - \hat{y}_i, \quad i = 1, \dots, n.

Шаг 2. Вычислите абсолютные значения остатков ei|e_i|.

Шаг 3. Оцените вспомогательную регрессию выбранной формы МНК:

ei=α^+β^f(xi)+u^i,|e_i| = \hat{\alpha} + \hat{\beta} f(x_i) + \hat{u}_i,

где f(xi)f(x_i) - одна из трёх функциональных форм (xix_i, xi\sqrt{x_i} или 1/xi1/x_i).

Шаг 4. Проверьте значимость коэффициента β^\hat{\beta} по стандартному tt-критерию:

t=β^SE(β^),t = \frac{\hat{\beta}}{SE(\hat{\beta})},

где SE(β^)SE(\hat{\beta}) - стандартная ошибка оценки. Число степеней свободы: df=n2df = n - 2.

Шаг 5. Если t>tα/2,n2|t| > t_{\alpha/2, n-2} - нулевая гипотеза отвергается: гетероскедастичность значима. Коэффициент β^\hat{\beta} указывает на характер связи между дисперсией и фактором.

Алгоритм теста Глейзера: пять шагов от остатков МНК до заключения о гетероскедастичности
Алгоритм теста Глейзера: пять шагов от остатков МНК до заключения о гетероскедастичности

Интерпретация результатов

Если коэффициент β^\hat{\beta} во вспомогательной регрессии значим, это указывает на конкретный тип гетероскедастичности, что напрямую подсказывает метод коррекции:

  • Значим β^\hat{\beta} в форме ei=α+βxi|e_i| = \alpha + \beta x_i: σi2xi2\sigma_i^2 \propto x_i^2. Взвешенный МНК с весами wi=1/xi2w_i = 1/x_i^2 устраняет нарушение.
  • Значим β^\hat{\beta} в форме ei=α+βxi|e_i| = \alpha + \beta \sqrt{x_i}: σi2xi\sigma_i^2 \propto x_i. Взвешенный МНК с весами wi=1/xiw_i = 1/x_i.
  • Значим β^\hat{\beta} в форме ei=α+β/xi|e_i| = \alpha + \beta / x_i: σi21/xi2\sigma_i^2 \propto 1/x_i^2. Взвешенный МНК с весами wi=xi2w_i = x_i^2.

Если ни одна из трёх форм не даёт значимого результата, тест Глейзера не обнаруживает гетероскедастичности. Однако это не исключает её полностью - нелинейные формы зависимости дисперсии, не предусмотренные тремя спецификациями, могут остаться незамеченными.

Всегда проверяйте несколько форм вспомогательной регрессии и сопровождайте тест Глейзера визуальным анализом графика |e_i| против x_i. Если форма зависимости нелинейная - рассмотрите тест Уайта с квадратами и произведениями факторов.

Пример расчёта

Рассмотрим модель зарплаты в зависимости от стажа: Wi=β0+β1Si+εiW_i = \beta_0 + \beta_1 S_i + \varepsilon_i, n=20n = 20 наблюдений. МНК даёт остатки eie_i. Берём их абсолютные значения и строим три вспомогательных регрессии.

Для линейной формы ei=α^+β^Si|e_i| = \hat{\alpha} + \hat{\beta} S_i получаем: β^=0,43\hat{\beta} = 0{,}43, SE(β^)=0,18SE(\hat{\beta}) = 0{,}18, t=2,39t = 2{,}39. При α=0,05\alpha = 0{,}05, t0,025;18=2,101t_{0{,}025; 18} = 2{,}101. Поскольку 2,39>2,1012{,}39 > 2{,}101, гипотеза гомоскедастичности отвергается. Форма σi2Si2\sigma_i^2 \propto S_i^2 подтверждается.

Для корневой формы ei=α^+β^Si|e_i| = \hat{\alpha} + \hat{\beta}\sqrt{S_i}: t=1,87<2,101t = 1{,}87 < 2{,}101 - незначима. Для обратной формы: t=0,92t = -0{,}92 - незначима.

Вывод: гетероскедастичность имеет линейный характер. Применяем взвешенный МНК с весами wi=1/Si2w_i = 1/S_i^2.

Сравнение с тестом Бройша-Пагана и тестом Уайта

Три теста направлены на одну и ту же проблему, но используют разные вспомогательные регрессии.

Тест Глейзера регрессирует ei|e_i| - это делает его устойчивее к выбросам, чем тесты, использующие ei2e_i^2. С другой стороны, линейная связь ei|e_i| с f(xi)f(x_i) не является строгим следствием теории дисперсии, что иногда критикуется в методологическом плане.

Тест Бройша-Пагана регрессирует нормированные квадраты остатков pi=ei2/σ^ML2p_i = e_i^2 / \hat{\sigma}^2_{ML} на xjx_j и использует χ2\chi^2-статистику с kk степенями свободы. Он теоретически строже основан, но чувствительнее к отклонениям от нормальности ошибок (модификация Кенкера снимает эту проблему).

Тест Уайта добавляет в вспомогательную регрессию квадраты xj2x_j^2 и попарные произведения xjxlx_j \cdot x_l, что делает его универсальным для нелинейной гетероскедастичности, но сильно увеличивает число степеней свободы при нескольких факторах.

ХарактеристикаТест ГлейзераТест Бройша-ПаганаТест Уайта
Зависимая переменная вспомогательной регрессииei\|e_i\|ei2/σ^2e_i^2 / \hat{\sigma}^2ei2e_i^2
Критерий значимостиtt-тестχ2(k)\chi^2(k)χ2(p)\chi^2(p)
Форм вспомогательной регрессии3 варианта11 (с крест-множителями)
Устойчивость к выбросамВысокаяСредняяСредняя
Диагностика формы нарушенияЯвнаяНетНет

Практическое правило: начинайте с визуальной диагностики и теста Глейзера (позволяет сразу выбрать форму коррекции); при нескольких факторах дополняйте тестом Бройша-Пагана.

Коррекция гетероскедастичности

Если тест Глейзера подтвердил гетероскедастичность, доступны три основных подхода к коррекции.

Взвешенный МНК (WLS / GLS). Наиболее эффективен, когда форма гетероскедастичности известна из теста. Каждое наблюдение умножается на вес wi=1/σ^iw_i = 1/\hat{\sigma}_i, где оценка σ^i\hat{\sigma}_i берётся из подогнанных значений вспомогательной регрессии Глейзера. Например, при линейной форме: wi=1/α^+β^xiw_i = 1/\hat{\alpha} + \hat{\beta} x_i. После взвешивания выполняется обычный МНК на трансформированных переменных.

Робастные стандартные ошибки Уайта (HC). Не меняет МНК-оценки коэффициентов, но пересчитывает их дисперсии с поправкой на гетероскедастичность. Быстрый и универсальный метод: в R - coeftest(model, vcov = hccm(model, type = "HC3")), в Stata - regress y x, vce(robust).

Преобразование переменных. Логарифмирование lnyi\ln y_i вместо yiy_i часто стабилизирует дисперсию при мультипликативных ошибках. Подходит для моделей заработной платы, цен, объёмов производства.

При выборе WLS убедитесь, что форма гетероскедастичности задана верно: неправильная спецификация весов может привести к менее эффективным оценкам, чем обычный МНК. Робастные ошибки Уайта (HC) являются более безопасным выбором при неопределённости формы нарушения.

Ограничения теста Глейзера

При всей практичности метод имеет ряд известных ограничений.

Во-первых, тест обнаруживает только монотонную связь дисперсии с фактором xix_i в рамках трёх предложенных спецификаций. Если истинная форма гетероскедастичности иная (например, U-образная или зависит от нескольких факторов), тест может не отвергнуть нулевую гипотезу.

Во-вторых, при малых выборках (n<25n < 25) оценки ei|e_i| ненадёжны, и мощность теста снижается. При n<20n < 20 вывод о значимости tt-статистики следует трактовать с осторожностью.

В-третьих, тест разработан для случая одного объясняющего фактора. При нескольких факторах (k>1k > 1) неясно, какой именно xjx_j подставлять во вспомогательную регрессию; на практике тест повторяют для каждого фактора по отдельности. Это множественное тестирование увеличивает вероятность ошибки первого рода.

В-четвёртых, теоретически использование ei|e_i| вместо ei2e_i^2 менее обосновано с точки зрения теории максимального правдоподобия, что критикуется в методологической литературе.

Для более строгой диагностики при нескольких факторах предпочтителен тест Бройша-Пагана или тест Уайта. Тест Глейзера особенно ценен, когда экономическая теория подсказывает конкретный фактор-источник нарушения и позволяет выбрать форму коррекции.

Частые ошибки

  • Не вычислять абсолютные значения. Тест Глейзера работает с ei|e_i|, а не с eie_i или ei2e_i^2. Регрессия «сырых» остатков не выявит гетероскедастичность, поскольку знаки eie_i случайны и гасят друг друга.
  • Проверять только одну форму вспомогательной регрессии. Если проверить лишь линейную форму и она не значима, это не исключает корневую или обратную зависимость дисперсии от фактора.
  • Путать степени свободы. В tt-тесте вспомогательной регрессии ei=α+βf(x)|e_i| = \alpha + \beta f(x) число степеней свободы df=n2df = n - 2 (один регрессор без константы).
  • Применять тест к нескольким факторам без корректировки. При тестировании каждого из kk факторов по отдельности вероятность хотя бы одного ложноположительного вывода составляет 1(1α)k1-(1-\alpha)^k. При k=3k = 3 и α=0,05\alpha = 0{,}05 это уже ~14%.
  • Не сопровождать тест визуальным анализом. График ei|e_i| против xix_i наглядно показывает форму зависимости и помогает выбрать нужную спецификацию до формальной проверки.

FAQ

Чем тест Глейзера лучше теста Бройша-Пагана? Тест Глейзера устойчивее к выбросам, так как использует ei|e_i| вместо ei2e_i^2 - большие остатки не раздуваются возведением в квадрат. Кроме того, три формы вспомогательной регрессии позволяют сразу выявить тип нарушения и выбрать адекватный вес для взвешенного МНК. Тест Бройша-Пагана теоретически строже и легко обобщается на несколько факторов через χ2\chi^2-статистику.

Что делать, если все три формы дают значимый результат? Выберите форму с наибольшим R2R^2 вспомогательной регрессии или наибольшей tt-статистикой. Эта спецификация лучше всего описывает природу гетероскедастичности и подсказывает оптимальные веса для WLS. При сомнениях используйте универсальный метод - робастные ошибки Уайта.

Применим ли тест Глейзера к временным рядам? С осторожностью. Тест разрабатывался для поперечных данных. В случае временных рядов гетероскедастичность нередко сочетается с автокорреляцией, и стандартный tt-тест вспомогательной регрессии будет некорректен. Для временных рядов предпочтительнее условные гетероскедастичные модели класса ARCH/GARCH.

Коротко

Тест Глейзера проверяет гетероскедастичность через вспомогательную регрессию абсолютных значений остатков ei|e_i| на функцию объясняющего фактора в трёх формах: xix_i, xi\sqrt{x_i}, 1/xi1/x_i. Значимость коэффициента β^\hat{\beta} по tt-критерию указывает на связь дисперсии ошибок с фактором. Форма значимой спецификации прямо подсказывает тип гетероскедастичности и выбор весов для взвешенного МНК. Метод устойчивее к выбросам по сравнению с тестами, использующими квадраты остатков, но ограничен одним фактором и монотонными формами нарушения. При нескольких факторах дополняйте тест Глейзера тестом Бройша-Пагана или робастными ошибками Уайта.

Доверьте текст нейросети EssayAI

Открыть EssayAI

Бесплатно, на русском языке и без VPN

Читайте также