Тест Глейзера: проверка гетероскедастичности МНК

17 июня 2026Время чтения: 11 минут

#тест Глейзера#гетероскедастичность#эконометрика#регрессия#МНК

Гетероскедастичность - одно из наиболее распространённых нарушений предпосылок классического МНК: дисперсия случайной ошибки меняется от наблюдения к наблюдению, а не остаётся постоянной. При этом коэффициенты регрессии остаются несмещёнными, но перестают быть эффективными, а стандартные ошибки оказываются некорректными - $t$ - и $F$ -критерии теряют надёжность. Тест Глейзера, предложенный в 1969 году, предлагает элегантный способ диагностики: вместо квадратов остатков он регрессирует их абсолютные значения на объясняющую переменную в трёх разных функциональных формах, что делает метод нечувствительным к выбросам. Протестируйте свою модель с помощью инструмента ниже.

Что такое гетероскедастичность и зачем её выявлять

В классической линейной регрессии $y_i = \beta_0 + \beta_1 x_{1i} + \dots + \beta_k x_{ki} + \varepsilon_i$ предполагается гомоскедастичность: $\operatorname{Var}(\varepsilon_i) = \sigma^2 = \text{const}$ для всех $i$ . Нарушение этого условия - гетероскедастичность:

$\operatorname{Var}(\varepsilon_i) = \sigma_i^2, \quad \sigma_i^2 \neq \sigma_j^2 \text{ при } i \neq j.$

Типичный пример - модель потребительских расходов в зависимости от дохода: у домохозяйств с высоким доходом разброс расходов значительно шире, чем у малообеспеченных. На графике «остатки против подогнанных значений» это проявляется как «воронка»: разброс остатков нарастает по мере увеличения $\hat{y}_i$ или фактора $x_i$ .

Последствия игнорирования гетероскедастичности:

МНК-оценки несмещённы и состоятельны, но не являются наилучшими линейными несмещёнными (BLUE по теореме Гаусса-Маркова).
Стандартные ошибки коэффициентов смещены (обычно занижены при нарастающей дисперсии).
$t$ -статистики завышаются, что ведёт к ложному выводу о значимости переменных.
Доверительные интервалы сужаются, теряя достоверность.

Диагностику гетероскедастичности проводят несколькими методами: визуальным анализом остатков, тестом Глейзера, тестом Бройша-Пагана, тестом Уайта. Тест Глейзера занимает особое место благодаря использованию абсолютных значений остатков.

Идея теста Глейзера: почему абсолютные остатки

Роберт Глейзер предложил в 1969 году регрессировать не квадраты остатков $e_i^2$ (как в тестах Бройша-Пагана и Уайта), а их абсолютные значения $|e_i|$ на объясняющую переменную $x_i$ в различных функциональных формах. Это принципиальное отличие: $|e_i|$ устойчивее к выбросам, поскольку не возводит большие остатки в квадрат, тем самым не раздувает их вклад непропорционально.

Нулевая гипотеза теста: $H_0$ : дисперсия $\sigma_i^2$ не зависит от $x_i$ (гомоскедастичность). Альтернатива $H_1$ : дисперсия систематически связана с $x_i$ .

Логика: если гомоскедастичность выполняется, $|e_i|$ не должны демонстрировать никакой систематической зависимости от $x_i$ . Если же коэффициент $b$ во вспомогательной регрессии $|e_i|$ на $f(x_i)$ оказывается значимым - это свидетельство гетероскедастичности.

Три формы вспомогательной регрессии

Ключевая особенность теста Глейзера состоит в том, что он не ограничивается одной функциональной формой связи между $|e_i|$ и $x_i$ . Глейзер предложил проверять три спецификации:

Форма 1 (линейная):

$|e_i| = \alpha + \beta x_i + u_i$

Используется, когда предполагается, что стандартное отклонение ошибки растёт пропорционально фактору. Характерна для моделей, где $\sigma_i = \sigma \cdot x_i$ .

Форма 2 (корневая):

$|e_i| = \alpha + \beta \sqrt{x_i} + u_i$

Подходит, когда дисперсия растёт медленнее, чем $x_i$ , - например, в моделях с более сглаженной зависимостью отклонения от масштаба фактора.

Форма 3 (обратная):

$|e_i| = \alpha + \frac{\beta}{x_i} + u_i$

Применяется при убывающей гетероскедастичности - разброс остатков уменьшается с ростом $x_i$ , как бывает при агрегировании данных (у крупных фирм средние показатели стабильнее).

На практике исследователь оценивает все три или выбирает форму на основе экономической логики и визуального анализа остатков.

Алгоритм проведения теста

Процедура теста Глейзера состоит из пяти шагов.

Шаг 1. Оцените исходную регрессионную модель методом МНК. Получите остатки:

$e_i = y_i - \hat{y}_i, \quad i = 1, \dots, n.$

Шаг 2. Вычислите абсолютные значения остатков $|e_i|$ .

Шаг 3. Оцените вспомогательную регрессию выбранной формы МНК:

$|e_i| = \hat{\alpha} + \hat{\beta} f(x_i) + \hat{u}_i,$

где $f(x_i)$ - одна из трёх функциональных форм ( $x_i$ , $\sqrt{x_i}$ или $1/x_i$ ).

Шаг 4. Проверьте значимость коэффициента $\hat{\beta}$ по стандартному $t$ -критерию:

$t = \frac{\hat{\beta}}{SE(\hat{\beta})},$

где $SE(\hat{\beta})$ - стандартная ошибка оценки. Число степеней свободы: $df = n - 2$ .

Шаг 5. Если $|t| > t_{\alpha/2, n-2}$ - нулевая гипотеза отвергается: гетероскедастичность значима. Коэффициент $\hat{\beta}$ указывает на характер связи между дисперсией и фактором.

Алгоритм теста Глейзера: пять шагов от остатков МНК до заключения о гетероскедастичности

Интерпретация результатов

Если коэффициент $\hat{\beta}$ во вспомогательной регрессии значим, это указывает на конкретный тип гетероскедастичности, что напрямую подсказывает метод коррекции:

Значим $\hat{\beta}$ в форме $|e_i| = \alpha + \beta x_i$ : $\sigma_i^2 \propto x_i^2$ . Взвешенный МНК с весами $w_i = 1/x_i^2$ устраняет нарушение.
Значим $\hat{\beta}$ в форме $|e_i| = \alpha + \beta \sqrt{x_i}$ : $\sigma_i^2 \propto x_i$ . Взвешенный МНК с весами $w_i = 1/x_i$ .
Значим $\hat{\beta}$ в форме $|e_i| = \alpha + \beta / x_i$ : $\sigma_i^2 \propto 1/x_i^2$ . Взвешенный МНК с весами $w_i = x_i^2$ .

Если ни одна из трёх форм не даёт значимого результата, тест Глейзера не обнаруживает гетероскедастичности. Однако это не исключает её полностью - нелинейные формы зависимости дисперсии, не предусмотренные тремя спецификациями, могут остаться незамеченными.

Всегда проверяйте несколько форм вспомогательной регрессии и сопровождайте тест Глейзера визуальным анализом графика |e_i| против x_i. Если форма зависимости нелинейная - рассмотрите тест Уайта с квадратами и произведениями факторов.

Пример расчёта

Рассмотрим модель зарплаты в зависимости от стажа: $W_i = \beta_0 + \beta_1 S_i + \varepsilon_i$ , $n = 20$ наблюдений. МНК даёт остатки $e_i$ . Берём их абсолютные значения и строим три вспомогательных регрессии.

Для линейной формы $|e_i| = \hat{\alpha} + \hat{\beta} S_i$ получаем: $\hat{\beta} = 0{,}43$ , $SE(\hat{\beta}) = 0{,}18$ , $t = 2{,}39$ . При $\alpha = 0{,}05$ , $t_{0{,}025; 18} = 2{,}101$ . Поскольку $2{,}39 > 2{,}101$ , гипотеза гомоскедастичности отвергается. Форма $\sigma_i^2 \propto S_i^2$ подтверждается.

Для корневой формы $|e_i| = \hat{\alpha} + \hat{\beta}\sqrt{S_i}$ : $t = 1{,}87 < 2{,}101$ - незначима. Для обратной формы: $t = -0{,}92$ - незначима.

Вывод: гетероскедастичность имеет линейный характер. Применяем взвешенный МНК с весами $w_i = 1/S_i^2$ .

Сравнение с тестом Бройша-Пагана и тестом Уайта

Три теста направлены на одну и ту же проблему, но используют разные вспомогательные регрессии.

Тест Глейзера регрессирует $|e_i|$ - это делает его устойчивее к выбросам, чем тесты, использующие $e_i^2$ . С другой стороны, линейная связь $|e_i|$ с $f(x_i)$ не является строгим следствием теории дисперсии, что иногда критикуется в методологическом плане.

Тест Бройша-Пагана регрессирует нормированные квадраты остатков $p_i = e_i^2 / \hat{\sigma}^2_{ML}$ на $x_j$ и использует $\chi^2$ -статистику с $k$ степенями свободы. Он теоретически строже основан, но чувствительнее к отклонениям от нормальности ошибок (модификация Кенкера снимает эту проблему).

Тест Уайта добавляет в вспомогательную регрессию квадраты $x_j^2$ и попарные произведения $x_j \cdot x_l$ , что делает его универсальным для нелинейной гетероскедастичности, но сильно увеличивает число степеней свободы при нескольких факторах.

Характеристика	Тест Глейзера	Тест Бройша-Пагана	Тест Уайта
Зависимая переменная вспомогательной регрессии	$\\|e_i\\|$	$e_i^2 / \hat{\sigma}^2$	$e_i^2$
Критерий значимости	$t$ -тест	$\chi^2(k)$	$\chi^2(p)$
Форм вспомогательной регрессии	3 варианта	1	1 (с крест-множителями)
Устойчивость к выбросам	Высокая	Средняя	Средняя
Диагностика формы нарушения	Явная	Нет	Нет

Практическое правило: начинайте с визуальной диагностики и теста Глейзера (позволяет сразу выбрать форму коррекции); при нескольких факторах дополняйте тестом Бройша-Пагана.

Коррекция гетероскедастичности

Если тест Глейзера подтвердил гетероскедастичность, доступны три основных подхода к коррекции.

Взвешенный МНК (WLS / GLS). Наиболее эффективен, когда форма гетероскедастичности известна из теста. Каждое наблюдение умножается на вес $w_i = 1/\hat{\sigma}_i$ , где оценка $\hat{\sigma}_i$ берётся из подогнанных значений вспомогательной регрессии Глейзера. Например, при линейной форме: $w_i = 1/\hat{\alpha} + \hat{\beta} x_i$ . После взвешивания выполняется обычный МНК на трансформированных переменных.

Робастные стандартные ошибки Уайта (HC). Не меняет МНК-оценки коэффициентов, но пересчитывает их дисперсии с поправкой на гетероскедастичность. Быстрый и универсальный метод: в R - coeftest(model, vcov = hccm(model, type = "HC3")), в Stata - regress y x, vce(robust).

Преобразование переменных. Логарифмирование $\ln y_i$ вместо $y_i$ часто стабилизирует дисперсию при мультипликативных ошибках. Подходит для моделей заработной платы, цен, объёмов производства.

При выборе WLS убедитесь, что форма гетероскедастичности задана верно: неправильная спецификация весов может привести к менее эффективным оценкам, чем обычный МНК. Робастные ошибки Уайта (HC) являются более безопасным выбором при неопределённости формы нарушения.

Ограничения теста Глейзера

При всей практичности метод имеет ряд известных ограничений.

Во-первых, тест обнаруживает только монотонную связь дисперсии с фактором $x_i$ в рамках трёх предложенных спецификаций. Если истинная форма гетероскедастичности иная (например, U-образная или зависит от нескольких факторов), тест может не отвергнуть нулевую гипотезу.

Во-вторых, при малых выборках ( $n < 25$ ) оценки $|e_i|$ ненадёжны, и мощность теста снижается. При $n < 20$ вывод о значимости $t$ -статистики следует трактовать с осторожностью.

В-третьих, тест разработан для случая одного объясняющего фактора. При нескольких факторах ( $k > 1$ ) неясно, какой именно $x_j$ подставлять во вспомогательную регрессию; на практике тест повторяют для каждого фактора по отдельности. Это множественное тестирование увеличивает вероятность ошибки первого рода.

В-четвёртых, теоретически использование $|e_i|$ вместо $e_i^2$ менее обосновано с точки зрения теории максимального правдоподобия, что критикуется в методологической литературе.

Для более строгой диагностики при нескольких факторах предпочтителен тест Бройша-Пагана или тест Уайта. Тест Глейзера особенно ценен, когда экономическая теория подсказывает конкретный фактор-источник нарушения и позволяет выбрать форму коррекции.

Частые ошибки

Не вычислять абсолютные значения. Тест Глейзера работает с $|e_i|$ , а не с $e_i$ или $e_i^2$ . Регрессия «сырых» остатков не выявит гетероскедастичность, поскольку знаки $e_i$ случайны и гасят друг друга.
Проверять только одну форму вспомогательной регрессии. Если проверить лишь линейную форму и она не значима, это не исключает корневую или обратную зависимость дисперсии от фактора.
Путать степени свободы. В $t$ -тесте вспомогательной регрессии $|e_i| = \alpha + \beta f(x)$ число степеней свободы $df = n - 2$ (один регрессор без константы).
Применять тест к нескольким факторам без корректировки. При тестировании каждого из $k$ факторов по отдельности вероятность хотя бы одного ложноположительного вывода составляет $1-(1-\alpha)^k$ . При $k = 3$ и $\alpha = 0{,}05$ это уже ~14%.
Не сопровождать тест визуальным анализом. График $|e_i|$ против $x_i$ наглядно показывает форму зависимости и помогает выбрать нужную спецификацию до формальной проверки.

FAQ

Чем тест Глейзера лучше теста Бройша-Пагана? Тест Глейзера устойчивее к выбросам, так как использует $|e_i|$ вместо $e_i^2$ - большие остатки не раздуваются возведением в квадрат. Кроме того, три формы вспомогательной регрессии позволяют сразу выявить тип нарушения и выбрать адекватный вес для взвешенного МНК. Тест Бройша-Пагана теоретически строже и легко обобщается на несколько факторов через $\chi^2$ -статистику.

Что делать, если все три формы дают значимый результат? Выберите форму с наибольшим $R^2$ вспомогательной регрессии или наибольшей $t$ -статистикой. Эта спецификация лучше всего описывает природу гетероскедастичности и подсказывает оптимальные веса для WLS. При сомнениях используйте универсальный метод - робастные ошибки Уайта.

Применим ли тест Глейзера к временным рядам? С осторожностью. Тест разрабатывался для поперечных данных. В случае временных рядов гетероскедастичность нередко сочетается с автокорреляцией, и стандартный $t$ -тест вспомогательной регрессии будет некорректен. Для временных рядов предпочтительнее условные гетероскедастичные модели класса ARCH/GARCH.

Коротко

Тест Глейзера проверяет гетероскедастичность через вспомогательную регрессию абсолютных значений остатков $|e_i|$ на функцию объясняющего фактора в трёх формах: $x_i$ , $\sqrt{x_i}$ , $1/x_i$ . Значимость коэффициента $\hat{\beta}$ по $t$ -критерию указывает на связь дисперсии ошибок с фактором. Форма значимой спецификации прямо подсказывает тип гетероскедастичности и выбор весов для взвешенного МНК. Метод устойчивее к выбросам по сравнению с тестами, использующими квадраты остатков, но ограничен одним фактором и монотонными формами нарушения. При нескольких факторах дополняйте тест Глейзера тестом Бройша-Пагана или робастными ошибками Уайта.

Доверьте текст нейросети EssayAI

Открыть EssayAI

Бесплатно, на русском языке и без VPN