Средний уровень интервального ряда: формула и расчёт

Интервальный ряд распределения возникает всякий раз, когда признак (зарплата, возраст, балл теста) принимает слишком много значений, чтобы перечислять их по одному, -- их группируют в промежутки. Но как только данные сгруппированы, точные значения внутри каждого интервала уже недоступны: видна только частота попаданий в промежуток. Именно поэтому средний уровень интервального ряда считают не обычным средним арифметическим, а взвешенным -- через середины интервалов. Разберём формулу, составим расчётную таблицу и проверим результат на двух примерах. Чтобы сразу увидеть, как меняется среднее при изменении частот, воспользуйтесь калькулятором ниже.
Что такое средний уровень и зачем он нужен
Средний уровень -- это одна из мер центральной тенденции: он показывает, вокруг какого значения сосредоточено большинство наблюдений. Для дискретного ряда его вычисляют напрямую как среднее арифметическое всех значений. Для интервального ряда точные значения неизвестны -- есть лишь диапазоны и их частоты. Стандартное допущение: все значения внутри интервала распределены равномерно, а значит, их среднее совпадает с серединой промежутка.
Это допущение вводит небольшую погрешность, но она тем меньше, чем уже интервалы и чем равномернее наблюдения внутри них. На практике для большинства экономических и социальных данных погрешность пренебрежимо мала, и метод середин считается стандартным.
Формула среднего уровня интервального ряда
Пусть ряд содержит интервалов. Обозначим:
- и -- левая и правая границы -го интервала,
- -- середина интервала,
- -- частота (число наблюдений, попавших в интервал),
- -- общий объём выборки.
Тогда средний уровень интервального ряда:
Формула -- это взвешенное среднее арифметическое, где роль весов играют частоты . Интервал с большей частотой вносит больший вклад в итоговое среднее, и оно смещается в его сторону. Если все частоты равны, формула вырождается в простое среднее середин.
Расчётная таблица: как её правильно составить
Стандартный способ вычисления -- таблица из пяти столбцов:
| Интервал | Середина | Частота | Произведение | Накопленная частота |
|---|---|---|---|---|
| ... | ... | ... | ... | ... |
| Итого |
После заполнения таблицы делим сумму произведений на -- получаем .
Накопленные частоты в последнем столбце нужны не для , но пригодятся при нахождении медианы и моды интервального ряда -- они часто входят в одно задание.
Пример 1: средняя зарплата сотрудников
Дан ряд распределения 78 сотрудников по месячной зарплате (тыс. руб.):
| Интервал | |
|---|---|
| [20; 30) | 8 |
| [30; 40) | 15 |
| [40; 50) | 22 |
| [50; 60) | 18 |
| [60; 70) | 10 |
| [70; 80) | 5 |
Найдём середины и произведения:

Обратите внимание: наибольшая частота у интервала [40; 50), но среднее сдвинуто правее -- к 47,8 тыс. руб. -- из-за того, что интервалы с высокими зарплатами ([50;60), [60;70)) тоже достаточно насыщены.
Пример 2: средний балл теста
Результаты тестирования 52 студентов (баллы 0-100):
| Интервал | |
|---|---|
| [0; 20) | 4 |
| [20; 40) | 10 |
| [40; 60) | 18 |
| [60; 80) | 14 |
| [80; 100) | 6 |
Результат близок к середине шкалы -- группа показала средний уровень подготовки.
Связь с модой и медианой интервального ряда
Средний уровень, мода и медиана -- три разные меры центра. Для интервального ряда они, как правило, не совпадают.
- Мода -- середина наиболее частого интервала (modal class), уточнённая по интерполяции.
- Медиана -- значение, делящее накопленный ряд пополам: находят интервал, в котором накопленная частота впервые превысила , и уточняют формулой:
где -- левая граница медианного интервала, -- его ширина, -- накопленная частота до него, -- частота самого интервала.
При симметричном распределении среднее, мода и медиана совпадают. При правостороннем скосе (длинный хвост вправо): . Это типично для распределений зарплат и доходов.
Взвешенное среднее: когда частоты заменяются долями
Иногда таблица задана не частотами , а относительными частотами (долями) , при этом . Формула не меняется по существу:
Это прямо видно из исходной формулы: при делении числителя и знаменателя на получим то же самое. Важно: если в задаче даны проценты (например, 20%), их нужно перевести в доли (0,20) перед подстановкой.
Частые ошибки
- Использовать границы вместо середин. Самая распространённая ошибка -- брать или вместо . Середина -- это не левая и не правая граница интервала.
- Делить не на , а на . Делитель -- это сумма всех частот (), а не число интервалов (). Если и , то делят на 50.
- Игнорировать открытые крайние интервалы. Если первый интервал задан как «до 30» или последний как «80 и выше», его ширину берут равной смежным интервалам (экстраполяция). Молчать про это в ответе -- ошибка.
- Путать частоту и накопленную частоту. В столбце записывают частоту данного интервала, а не кумулятивную сумму. Кумулята нужна для медианы, но не для среднего.
- Округлять промежуточные произведения. Округляйте только итоговый ответ; промежуточные держите точными, иначе ошибка накопится.
FAQ
Почему для интервального ряда нельзя найти точное среднее? Потому что исходные данные потеряны при группировке: видно только, что в интервал [40; 50) попали 22 наблюдения, но неизвестно -- 40,1 или 49,8. Середина интервала -- лучшая несмещённая оценка при допущении о равномерном распределении внутри каждого промежутка.
Как быть, если интервалы разной ширины? Формула остаётся прежней: середину по-прежнему берут как , а ширина интервала в расчёт среднего не входит. Разная ширина влияет на высоту столбца гистограммы (там нужна плотность ), но не на среднее.
Чем средний уровень интервального ряда отличается от средней хронологической? Средняя хронологическая применяется к временным рядам уровней (например, остатки на начало каждого месяца) и учитывает длину периодов. Средний уровень интервального ряда -- это характеристика вариационного ряда (распределения признака), и здесь "уровень" в смысле "типичное значение признака", а не "значение показателя в момент времени".
Коротко
Средний уровень интервального ряда вычисляется по формуле взвешенной средней , где -- середина интервала, -- частота, -- общий объём выборки. Составьте таблицу (интервал, середина, частота, произведение), просуммируйте произведения и поделите на . Главные ошибки -- взять границу вместо середины и разделить на число интервалов вместо суммы частот. Калькулятор выше позволяет проверить любой ряд: измените частоты ползунками и получите среднее с расчётом.
Читайте также

Расчёт средней по интервальному ряду: пошагово
Как найти среднюю по интервальному ряду распределения: формула средней взвешенной, выбор середины интервала, открытые интервалы, примеры расчёта и типичные ошибки.

Группировка статистических данных: интервалы и ряды
Группировка статистических данных по интервалам: как выбрать число классов, ширину интервала по формуле Стёрджесса, построить вариационный ряд и гистограмму.

Мощность статистического критерия: формула и расчёт
Мощность статистического критерия 1-beta: как рассчитать через ошибку II рода, объём выборки и эффект-сайз. Формула для z-теста, целевой порог 80 %, примеры.