Формула Шеннона: количество информации в битах
Формула Шеннона отвечает на вопрос, который кажется странным до первого знакомства с теорией информации: как измерить информацию числом? Клод Шеннон в 1948 году предложил связать количество информации не с содержанием сообщения, а с его неожиданностью. Чем менее вероятен исход, тем больше информации несёт сообщение о том, что он наступил, а единицей измерения становится бит - ответ на один вопрос «да или нет». В этой статье разберём, как из этой идеи получаются формулы и , чем количество информации одного события отличается от энтропии источника , и где студенты чаще всего ошибаются в задачах. Чтобы сразу почувствовать связь вероятности и битов, покрути калькулятор ниже: он переводит число исходов и вероятность в количество информации и показывает кривую энтропии.
Что такое бит и количество информации
Бит - это количество информации, которое снимает неопределённость выбора из двух равновероятных вариантов. Подбросили монету, узнали результат - получили ровно 1 бит. Если вариантов больше, и все они равновероятны, информация одного сообщения вычисляется через двоичный логарифм числа исходов:
где - количество равновероятных исходов. Для монеты и бит. Для игрального кубика и бита. Логарифм здесь не случаен: он отражает, сколько раз нужно вдвое сузить множество вариантов, чтобы остался один. Каждый такой вопрос «да или нет» и есть один бит.
Именно поэтому количество информации измеряют в битах, а не в буквах или килобайтах: бит привязан к снятию неопределённости, а не к длине текста. Длинное сообщение из предсказуемых символов может нести меньше информации, чем одно неожиданное слово.
Формула Шеннона для одного события
Когда исходы неравновероятны, формула не годится - нужно учитывать вероятность конкретного события. Шеннон обобщил измерение информации так:
где - вероятность наступившего события. Знак минус появляется потому, что вероятность меньше единицы, а её логарифм отрицателен; информация же должна быть положительной. Для равновероятного случая эта формула совпадает с предыдущей: . Так две формулы оказываются одной и той же идеей, записанной по-разному.
Ключевая интуиция: редкое событие несёт больше информации. Сообщение «завтра в Сахаре выпал снег» удивляет сильнее и несёт больше бит, чем «завтра в Сахаре было солнечно». Если , то бит; если , то бита.

На графике видно: при уменьшении вероятности вдвое количество информации растёт ровно на 1 бит. Это прямое следствие свойства логарифма - каждое деление шанса пополам добавляет один двоичный вопрос.
Энтропия источника: среднее количество информации
Часто нас интересует не одно событие, а источник, который выдаёт символы с разными вероятностями. Тогда считают среднее количество информации на один символ - это и есть энтропия Шеннона:
где - вероятность -го символа. Энтропия - это усреднённое по всем исходам количество информации , взвешенное на их вероятности. Измеряется она в битах на символ и показывает, сколько в среднем бит нужно, чтобы закодировать один символ источника без потерь.
Для двоичного источника с двумя символами вероятности и , и формула упрощается:
Эта функция достигает максимума бит при - когда оба символа равновероятны и неопределённость максимальна. Если же один символ почти всегда выпадает ( или ), энтропия стремится к нулю: предсказуемый источник почти не несёт информации.
Чем количество информации отличается от энтропии
Это главная путаница темы. Количество информации относится к одному конкретному исходу - сколько бит мы узнали, увидев именно это событие. Энтропия относится к источнику в целом - сколько бит он выдаёт в среднем за символ. Энтропия равна математическому ожиданию количества информации: .
Поэтому для одного редкого события может быть большим (6-7 бит), а энтропия источника при этом маленькой: редкое событие даёт много информации, но случается так нечасто, что почти не влияет на среднее. В калькуляторе выше левая шкала показывает информацию отдельного события, а правая кривая - энтропию двоичного источника; сравните, как они ведут себя при движении ползунка вероятности.
Пример решения типовой задачи
Разберём стандартную формулировку: в коробке 32 одинаковых на вид шара, пронумерованных от 1 до 32. Наугад вынимают один шар. Сколько информации несёт сообщение о его номере?
Исходы равновероятны, их число , поэтому работает формула :
Проверим через вероятность одного исхода: , тогда
Оба пути дают одинаковый ответ - это и есть проверка согласованности. Содержательно 5 бит означают, что номер шара можно угадать за пять вопросов «да или нет», каждый раз деля диапазон пополам: «номер больше 16?», «больше 8 в оставшейся половине?» и так далее. Если бы шаров было неравновероятное число исходов, пришлось бы считать энтропию по полной формуле Шеннона, усредняя по всем вероятностям.
Частые ошибки
- Логарифм не по основанию 2. Если считать или , ответ получится в натах или дитах, а не в битах. Для битов нужен именно ; при отсутствии его на калькуляторе используйте .
- Забыли знак минус в . Вероятность меньше единицы даёт отрицательный логарифм, поэтому минус обязателен - количество информации всегда положительно.
- Путают количество информации и энтропию. - это бит одного события, - среднее на символ. Для задачи про один исход энтропию считать не нужно.
- Подставляют вероятности, не дающие в сумме единицу. В формуле энтропии все должны суммироваться в 1. Если сумма иная, распределение задано неверно и результат бессмысленен.
- Считают, что больше символов всегда больше информации. Информацию задаёт неопределённость, а не длина: предсказуемый поток символов несёт мало бит, даже если он длинный.
FAQ
Сколько информации в битах несёт сообщение о результате броска монеты? Монета даёт два равновероятных исхода, поэтому бит. Это и есть определение бита - снятие неопределённости выбора из двух равных вариантов.
Почему в формуле количества информации стоит логарифм по основанию 2? Основание 2 задаёт единицу измерения - бит, ответ на один вопрос «да или нет». Логарифм отражает, сколько раз нужно вдвое сузить множество вариантов, чтобы остался один; для равновероятных исходов это .
Чем формула Шеннона отличается от формулы Хартли? Формула Хартли работает только для равновероятных исходов. Формула Шеннона и энтропия обобщают её на случай разных вероятностей; при равных обе формулы совпадают.
Коротко
Формула Шеннона измеряет количество информации через неожиданность события: для равновероятных исходов , а для события с вероятностью - бит. Среднее количество информации источника задаёт энтропия , которая для двоичного источника достигает максимума 1 бит при равных шансах. Важно различать информацию одного события и энтропию источника: первая - это бит конкретного исхода, вторая - среднее по всем символам.
Читайте также

Правило Трутона: энтропия испарения и формула
Правило Трутона утверждает, что ΔS_исп = ΔH_исп / T_кип - 88 Дж/(моль·К) для нормальных жидкостей. Разбор формулы, примеры расчётов и причины отклонений.

Изменение энтропии при плавлении льда
Изменение энтропии при плавлении льда: формула ΔS = mλ/T, выбор температуры в кельвинах, учёт холодного льда и подробное решение типовой задачи по физике.

Изменение энтропии при изобарном процессе: формула
Как рассчитать изменение энтропии идеального газа при изобарном нагреве: формула deltaS = nu*Cp*ln(T2/T1), вывод через первое начало и T-S диаграмма с примерами задач.