EssayAI
Блог
Блог
Естественные науки

Индекс разнообразия Симпсона: формула и смысл

17 июня 2026Время чтения: 8 минут
#индекс Симпсона#биологическое разнообразие#видовое разнообразие#экология сообществ#альфа-разнообразие
Индекс разнообразия Симпсона: формула и смысл

Экологи давно заметили: простой подсчёт числа видов в сообществе даёт неполную картину. Два луга с одинаковым набором видов могут сильно различаться по структуре - на одном доминирует один вид, на другом все виды представлены примерно поровну. Именно для описания такого неравенства Эдвард Симпсон в 1949 году предложил меру, основанную на вероятности случайного выбора: насколько вероятно, что два произвольно взятых организма окажутся одного вида? Если вероятность высока - разнообразие мало; если мала - сообщество богато и равномерно. Давайте разберём эту логику до конца - и проверим на числах с помощью калькулятора.

История и вероятностная основа

Эдвард Хью Симпсон сформулировал свою меру в 1949 году в однополосной заметке в журнале Nature, ища способ описать концентрацию доминирования в криминологической статистике - и по совместительству в экологии. Идея простая: возьмите произвольно двух особей из сообщества. Какова вероятность, что они одного вида? Если сообщество состоит из одного вида - вероятность 1. Если из бесконечно большого числа равных видов - вероятность стремится к нулю.

Формула и вероятностная основа

Исходная мера Симпсона D выражает вероятность того, что два случайно выбранных организма принадлежат одному виду:

D=i=1Spi2D = \sum_{i=1}^{S} p_i^2

где SS - число видов, pi=ni/Np_i = n_i / N - относительное обилие вида ii, nin_i - численность, NN - суммарная численность. Значение DD меняется от 1S\frac{1}{S} (при абсолютном равенстве обилий) до 1 (доминирование одного вида).

Для конечных выборок Симпсон дал несмещённую версию:

D=ni(ni1)N(N1)D = \frac{\sum n_i(n_i - 1)}{N(N-1)}

Эта запись предпочтительна в полевой работе: она не требует вычисления относительных долей и корректирует смещение при малых NN.

Схема расчёта индекса Симпсона: виды и их доли
Схема расчёта индекса Симпсона: виды и их доли

Производные меры: 1-D и 1/D

Поскольку DD растёт при снижении разнообразия, экологи чаще используют производные, которые ведут себя интуитивно:

  • Индекс Симпсона разнообразия (Simpson Diversity Index): 1D1 - D. Принимает значения от 0 (один вид) до S1S\frac{S-1}{S} (максимальное равенство). Интерпретация: вероятность того, что два случайно выбранных организма принадлежат разным видам.
  • Обратный индекс Симпсона (Simpson's Reciprocal Index): 1/D1/D. Минимум = 1 (один вид), максимум = SS (полное равенство). Единицы этого значения удобно читать: «эффективное число видов» - сколько видов с равным обилием давали бы то же DD.

Обратный индекс 1/D1/D - наиболее интерпретируемая форма: его можно сравнивать между сообществами напрямую как «число экологически равнозначных видов».

Пример расчёта для сообщества из пяти видов с численностями n=(45,12,8,30,5)n = (45, 12, 8, 30, 5), N=100N = 100:

D=4544+1211+87+3029+5410099=1980+132+56+870+209900=305899000,309D = \frac{45 \cdot 44 + 12 \cdot 11 + 8 \cdot 7 + 30 \cdot 29 + 5 \cdot 4}{100 \cdot 99} = \frac{1980 + 132 + 56 + 870 + 20}{9900} = \frac{3058}{9900} \approx 0{,}309

Тогда 1D0,6911 - D \approx 0{,}691 и 1/D3,241/D \approx 3{,}24. Это означает: вероятность случайного совпадения двух организмов по виду около 31%, а «эффективное число видов» - лишь 3,2 из 5 реальных, что говорит о заметном неравенстве обилий.

Сравнение с индексом Шеннона

Индекс Шеннона-Уинера тоже часто используют для оценки разнообразия:

H=i=1SpilnpiH' = -\sum_{i=1}^{S} p_i \ln p_i

Различия принципиальны:

СвойствоИндекс Симпсона (1-D)Индекс Шеннона (H')
ОсноваВероятность совпаденияИнформационная энтропия
ЧувствительностьК доминирующим видамК редким видам
Диапазон0 - 10 - ln S
ЕдиницыБезразмерныйБит/нат

На практике: если вас интересует устойчивость сообщества к утрате доминантов - берите Симпсона; если важно уловить присутствие редких видов - Шеннона. При оценке альфа-разнообразия в охраняемых территориях обычно отчитываются обоими.

Биологический смысл: чувствительность к доминированию

Самое важное свойство DD: он квадратично взвешивает обилия. Это значит, что вид с долей 0,5 вносит в DD вклад 0,52=0,250{,}5^2 = 0{,}25, а два редких вида по 0,05 вместе всего 2×0,0025=0,0052 \times 0{,}0025 = 0{,}005. Девяносто семь процентов чувствительности DD приходится на самые обильные виды.

Следствие: если в луговом сообществе появился один доминирующий злак, индекс Симпсона отреагирует резко - даже если число видов не изменилось. Это делает его хорошим индикатором ранних стадий деградации сообщества, когда ещё не произошло вымирание видов, но началось перераспределение структуры в пользу одного доминанта.

Именно квадратичное взвешивание делает DD подходящим для задач экологического мониторинга типа «есть ли признаки нарушения структуры?». Если с прошлого года 1D1-D на участке снизился с 0,82 до 0,67 при том же числе видов - это сигнал опасного усиления доминирования, который надо исследовать дальше.

Сравнение: равномерное и доминантное сообщество
Сравнение: равномерное и доминантное сообщество

Применение в полевых исследованиях

Индекс Симпсона применяется в:

  • Мониторинге биоразнообразия заповедников и буферных зон (стандарт CBD, метрика альфа-разнообразия).
  • Оценке восстановления экосистем после нарушений: рост 1/D1/D во времени сигнализирует о сукцессии от доминантного к сбалансированному сообществу.
  • Сравнении местообитаний (луг vs. лес vs. опушка) при равных площадях выборки.
  • Микробиомных исследованиях: OTU-таблицы 16S-ампликонного секвенирования анализируются в R-пакете vegan функцией diversity(x, index = "simpson").
  • Паразитологии и медицинской экологии: разнообразие паразитофауны хозяев описывается теми же мерами; снижение 1D1-D кишечного микробиома ассоциируют с воспалительными заболеваниями кишечника.

В трофических каскадах индекс Симпсона нижнего трофического уровня служит предиктором устойчивости всей цепи: чем выше 1/D1/D продуцентов, тем сложнее хищнику создать «бутылочное горлышко».

Конкретный пример полевого применения: при мониторинге восстановления луга после пожара учётные площадки исследуются ежегодно. В первый год после пожара 1/D1,51/D \approx 1{,}5 (монодоминирование пожарного злака); к пятому году 1/D4,81/D \approx 4{,}8 (несколько содоминантов). Это объективный показатель успеха восстановления, не зависящий от субъективной оценки «выглядит зелёным».

При выборке менее 50 особей всегда используйте несмещённую формулу с $n_i(n_i-1)$, а не квадраты долей $p_i^2$ - иначе D будет систематически занижен.

Расчёт в R и Python

В R самый быстрый способ через пакет vegan:

library(vegan)
# x - вектор численностей видов
diversity(x, index = "simpson")   # возвращает 1-D
diversity(x, index = "invsimpson") # возвращает 1/D

Обратите внимание: diversity(x, index = "simpson") возвращает 1D1 - D, а не сам DD - исторически сложившееся соглашение пакета, которое регулярно путают в лабораторных работах.

В Python через вручную написанную несмещённую формулу:

import numpy as np

def simpson_d(counts):
    n = np.array(counts)
    N = n.sum()
    return (n * (n - 1)).sum() / (N * (N - 1))

counts = [45, 12, 8, 30, 5]
D = simpson_d(counts)
print(f"D = {D:.3f}, 1-D = {1-D:.3f}, 1/D = {1/D:.3f}")

Для работы с матрицами образцов (несколько участков одновременно) используют numpy с axis параметрами или pandas-транспонирование перед передачей в vegan-аналог skbio.diversity.alpha_diversity("simpson", ...) в Python (пакет scikit-bio).

Частые ошибки

  • Путают DD и 1D1-D: при росте разнообразия DD убывает, 1D1-D растёт. Всегда указывайте, какую именно форму вы сообщаете.
  • Используют pi2p_i^2 при малой выборке: для выборок менее 100 особей несмещённая версия с ni(ni1)n_i(n_i-1) обязательна.
  • Сравнивают сообщества с разными размерами выборки без рарефакции: при N1N2N_1 \ll N_2 оценки DD систематически смещены даже при одинаковой истинной структуре.
  • Игнорируют функциональное разнообразие: высокое 1/D1/D по видам не означает функционального богатства, если все виды одной гильдии (например, только злаки).
  • Трактуют индекс как «процент видов»: 1D=0,851-D = 0{,}85 - это не «85% видов», а вероятность, что два случайных организма разных видов.

FAQ

Чем отличается альфа- от бета-разнообразия и где здесь Симпсон? Альфа-разнообразие - внутри одного местообитания (участка выборки); именно его измеряет 1/D1/D. Бета-разнообразие - различия между участками (меры Жаккара, Серенсена). В логистических моделях популяций альфа-разнообразие связывают с вместимостью среды KK.

Можно ли применять индекс к данным секвенирования? Да, но нужна рарефакция или нормализация глубины прочтений. Пакет vegan делает рарефакцию автоматически через rarefy; после неё diversity(rarefied, "invsimpson") корректен.

Какое значение 1D1-D считается «хорошим» разнообразием? Нет универсального порога: это зависит от типа экосистемы. Для умеренных лугов типично 1D>0,81-D > 0{,}8; для боров 0,50{,}5-0,70{,}7 уже высокое значение. Сравнивать нужно однотипные сообщества.

Коротко

Индекс Симпсона DD измеряет вероятность случайного совпадения двух организмов по виду; чем она выше, тем ниже разнообразие. На практике используют производные 1D1-D (вероятность различия, 0 до 1) и 1/D1/D (эффективное число видов). Индекс квадратично чувствителен к доминантам и плохо реагирует на редкие виды - в отличие от индекса Шеннона. Для полевых выборок обязательна несмещённая форма через ni(ni1)n_i(n_i-1). Широко применяется в мониторинге биоразнообразия, оценке сукцессии и микробиомных исследованиях через пакет vegan.

Доверьте текст нейросети EssayAI

Открыть EssayAI

Бесплатно, на русском языке и без VPN

Читайте также