EssayAI
Блог
Блог
Математика и алгоритмы

Коэффициент вариации выборки: формула и расчёт

11 июня 2026Время чтения: 7 минут
#коэффициент вариации#выборка#стандартное отклонение#статистика#однородность
Коэффициент вариации выборки: формула и расчёт

Коэффициент вариации выборки - это относительная мера разброса данных: он показывает, насколько велико стандартное отклонение по сравнению со средним значением, и выражается в процентах. В отличие от самого стандартного отклонения, которое зависит от единиц измерения и масштаба, коэффициент вариации безразмерен, поэтому им удобно сравнивать разброс совершенно разных по природе совокупностей - рост и вес, зарплаты и оценки, время и температуру. Ниже разберём формулу, посчитаем коэффициент вариации по шагам, поймём порог однородности 33% и где чаще всего ошибаются в задачах. Чтобы сразу почувствовать связь среднего, разброса и итогового процента, впишите свою выборку в калькулятор ниже - он пересчитает среднее, выборочное стандартное отклонение и коэффициент вариации, а заодно покажет, по какую сторону порога однородности легла ваша совокупность.

Что показывает коэффициент вариации

Коэффициент вариации отвечает на вопрос: большой разброс или маленький относительно того, вокруг чего колеблются данные. Стандартное отклонение в три единицы - это много или мало? Если среднее равно пяти, то это огромный разброс; если среднее равно тысяче, то им можно пренебречь. Именно поэтому абсолютную меру разброса делят на среднее: получается относительная величина, которую можно сравнивать между разными признаками и разными выборками независимо от их единиц измерения и порядка величин.

Одно и то же стандартное отклонение откладывается вокруг растущего среднего: коридор плюс-минус s остаётся прежним по ширине, а доля, которую он занимает относительно среднего, сжимается, и коэффициент вариации падает

Из этого следует первое практическое правило: коэффициент вариации имеет смысл только для данных с положительным средним, измеренных в шкале отношений (есть естественный ноль). Для температуры по Цельсию или для оценок относительно среднего по группе его считать нельзя - при среднем, близком к нулю, величина теряет смысл и улетает в бесконечность.

Формула коэффициента вариации

Коэффициент вариации выборки VV - это отношение выборочного стандартного отклонения ss к выборочному среднему xˉ\bar{x}, умноженное на сто процентов:

V=sxˉ100%.V = \frac{s}{\bar{x}} \cdot 100\%.

Чтобы его посчитать, нужны две предварительные величины. Сначала выборочное среднее - сумма всех значений, делённая на их число:

xˉ=1ni=1nxi.\bar{x} = \frac{1}{n}\sum_{i=1}^{n} x_i.

Затем выборочное стандартное отклонение. Здесь важная деталь: для выборки в знаменателе дисперсии стоит n1n - 1, а не nn (поправка Бесселя, дающая несмещённую оценку дисперсии генеральной совокупности):

s2=1n1i=1n(xixˉ)2,s=s2.s^2 = \frac{1}{n-1}\sum_{i=1}^{n} (x_i - \bar{x})^2, \qquad s = \sqrt{s^2}.

Подставив ss и xˉ\bar{x} в первую формулу, получаем коэффициент вариации. Он всегда выражается в процентах и, в отличие от ss, не несёт единиц измерения: и для выборки в метрах, и для выборки в рублях VV будет просто числом процентов.

Столбцы значений выборки, синяя линия среднего и красный коридор плюс-минус одно стандартное отклонение: коэффициент вариации равен ширине коридора, делённой на высоту среднего
Столбцы значений выборки, синяя линия среднего и красный коридор плюс-минус одно стандартное отклонение: коэффициент вариации равен ширине коридора, делённой на высоту среднего

Геометрически удобно представлять так: проведите линию среднего, отложите вокруг неё коридор шириной в одно стандартное отклонение в каждую сторону. Коэффициент вариации - это во сколько раз половина ширины коридора меньше высоты линии среднего, переведённое в проценты. Узкий коридор у высокой линии - маленький VV, широкий коридор у низкой линии - большой.

Расчёт по шагам на примере

Возьмём учебную выборку из восьми чисел: 12, 15, 14, 10, 18, 16, 13, 17. Посчитаем коэффициент вариации строго по формуле.

Шаг первый - среднее. Сумма равна 12+15+14+10+18+16+13+17=11512 + 15 + 14 + 10 + 18 + 16 + 13 + 17 = 115, делим на n=8n = 8:

xˉ=1158=14,375.\bar{x} = \frac{115}{8} = 14{,}375.

Шаг второй - сумма квадратов отклонений от среднего. Для каждого значения берём разность с 14,37514{,}375, возводим в квадрат и складываем; получается 49,87549{,}875. Делим на n1=7n - 1 = 7 и извлекаем корень:

s2=49,8757=7,125,s=7,1252,67.s^2 = \frac{49{,}875}{7} = 7{,}125, \qquad s = \sqrt{7{,}125} \approx 2{,}67.

Шаг третий - сам коэффициент вариации:

V=sxˉ100%=2,6714,375100%18,6%.V = \frac{s}{\bar{x}} \cdot 100\% = \frac{2{,}67}{14{,}375} \cdot 100\% \approx 18{,}6\%.

Значение меньше 33%, поэтому выборку считают однородной: разброс невелик по сравнению со средним, и среднее хорошо её описывает. Калькулятор выше собирает ровно эту цепочку - попробуйте заменить одно число на резко выбивающееся и увидите, как VV сразу перешагивает порог.

Порог однородности 33 процента

В статистике коэффициент вариации используют не только как число, но и как критерий однородности совокупности. Общепринятое правило: если V<33%V < 33\%, совокупность считается однородной, а среднее - надёжной характеристикой; если V33%V \ge 33\%, совокупность неоднородна, и одно лишь среднее описывает её плохо. Иногда выделяют более дробную шкалу: до 10% - слабая вариация, 10-33% - умеренная, свыше 33% - сильная.

Это видно на пресетах калькулятора. Однородная выборка вроде 50, 51, 49, 52, 48, 50, 51, 49 даёт V2,6%V \approx 2{,}6\% - данные тесно сгруппированы вокруг среднего. А выборка с выбросом, например зарплаты 35, 40, 38, 42, 120, 37, 39, 41, даёт V59%V \approx 59\%: одно большое значение раздувает стандартное отклонение, среднее перестаёт быть типичным, и совокупность признаётся неоднородной.

Сравнение разброса двух выборок

Главная польза коэффициента вариации - честное сравнение разброса там, где стандартное отклонение обманывает. Пусть у одной выборки среднее 5050 и s=8s = 8, а у другой среднее 200200 и s=20s = 20. По стандартному отклонению вторая кажется разбросаннее (20>820 > 8). Но коэффициенты вариации говорят обратное: V1=8/50100%=16%V_1 = 8/50 \cdot 100\% = 16\%, а V2=20/200100%=10%V_2 = 20/200 \cdot 100\% = 10\%. Относительно своего среднего вторая выборка стабильнее. Именно так коэффициент вариации применяют в финансах (сравнение риска активов на единицу доходности), биологии (изменчивость признаков разного масштаба) и контроле качества.

Частые ошибки

  • Делитель n вместо n - 1. Для выборки дисперсия считается с делителем n1n - 1. Деление на nn даёт смещённую оценку и заниженный коэффициент вариации. Делитель nn берут только для всей генеральной совокупности.
  • Забыли умножить на 100%. Коэффициент вариации по определению выражают в процентах. Если оставить голую дробь s/xˉs/\bar{x}, получится не процент, а доля, и сравнение с порогом 33% сломается.
  • Расчёт при среднем около нуля или отрицательном. При xˉ0\bar{x} \to 0 коэффициент вариации улетает в бесконечность и теряет смысл. Для данных с возможным нулевым или отрицательным средним эту меру не применяют.
  • Путаница среднего и медианы. В формуле стоит именно среднее арифметическое, а не медиана. Подстановка медианы даёт другую величину, не являющуюся коэффициентом вариации.
  • Сравнение V для разных по природе шкал без оговорок. Коэффициент вариации безразмерен, но осмысленно сравнивать его стоит для величин в шкале отношений; для интервальных шкал (температура по Цельсию) вывод будет некорректным.

FAQ

Чему равен коэффициент вариации выборки 12, 15, 14, 10, 18, 16, 13, 17? Среднее равно 14,37514{,}375, выборочное стандартное отклонение 2,67\approx 2{,}67, поэтому V=2,67/14,375100%18,6%V = 2{,}67/14{,}375 \cdot 100\% \approx 18{,}6\%. Значение меньше 33%, значит, выборка однородна.

Почему в формуле для выборки делят на n - 1, а не на n? Деление на n1n - 1 (поправка Бесселя) даёт несмещённую оценку дисперсии генеральной совокупности по выборке: при делении на nn оценка систематически занижена. На nn делят, только когда обработана вся совокупность целиком.

Какой коэффициент вариации считается нормальным? Чёткой универсальной нормы нет, но в учебной статистике порогом однородности берут 33%: ниже - совокупность однородна, выше - неоднородна. Часто дополнительно выделяют слабую вариацию до 10% и умеренную 10-33%.

Коротко

Коэффициент вариации выборки - это отношение выборочного стандартного отклонения к среднему в процентах: V=s/xˉ100%V = s/\bar{x} \cdot 100\%, где ss считается с делителем n1n - 1. Он безразмерен и позволяет сравнивать разброс разных по масштабу и единицам данных. Порог 33% делит совокупности на однородные (V<33%V < 33\%, среднее надёжно) и неоднородные (V33%V \ge 33\%, среднее описывает данные плохо). Считать его имеет смысл только при положительном среднем в шкале отношений.

Доверьте текст нейросети EssayAI

Открыть EssayAI

Бесплатно, на русском языке и без VPN

Читайте также