EssayAI
Блог
Блог
Математика и алгоритмы

Парадокс двух конвертов: почему выгодно менять любой

19 июня 2026Время чтения: 7 минут
#парадокс двух конвертов#ожидаемая ценность#теория вероятностей#байесовский подход#теория принятия решений
Парадокс двух конвертов: почему выгодно менять любой

Перед вами два одинаковых конверта. В одном лежит вдвое больше денег, чем в другом, но какой из них «толще» - неизвестно. Вы выбрали один, заглянули внутрь и увидели сумму AA. Стоит ли поменять конверт на второй? Наивный расчёт ожидаемой ценности уверяет: менять выгодно всегда - а значит, и обратно, и снова, до бесконечности. Это и есть парадокс двух конвертов: безупречная на вид арифметика приводит к абсурду. Ниже разберём, где именно прячется ошибка, и соберём корректный байесовский ответ. Калькулятор ниже покажет, как «выигрыш 1,25A» рассыпается, стоит лишь задать честное априорное распределение.

Постановка задачи

Условие минимально и потому коварно. Есть два неразличимых конверта; в одном сумма xx, в другом 2x2x, причём само xx нам неизвестно. Мы наугад берём один конверт. Ведущий разрешает либо оставить выбранный, либо обменять на второй. Спрашивается: какая стратегия даёт больший ожидаемый выигрыш?

Интуиция подсказывает, что менять бессмысленно: оба конверта симметричны, мы не получили никакой новой информации. И эта интуиция верна. Проблема в том, что существует «доказательство» обратного, которое выглядит не менее убедительно.

Два запечатанных конверта на чаше весов в равновесии, подпись над схемой раскрывает суть симметрии задачи
Два запечатанных конверта на чаше весов в равновесии, подпись над схемой раскрывает суть симметрии задачи

Соблазнительное рассуждение

Пусть в нашем конверте лежит сумма AA. Рассуждаем так: с вероятностью одна вторая наш конверт - меньший, и тогда во втором лежит 2A2A; с вероятностью одна вторая наш - больший, и во втором лежит A/2A/2. Считаем ожидаемую ценность обмена:

E[другой]=122A+12A2=5A4=1,25A.\mathbb{E}[\text{другой}] = \frac{1}{2}\cdot 2A + \frac{1}{2}\cdot \frac{A}{2} = \frac{5A}{4} = 1{,}25\,A.

Получается, что после обмена мы в среднем выигрываем 0,25A0{,}25A - четверть содержимого. Значит, менять выгодно. Но точно так же можно было бы рассуждать и про второй конверт: открыв его и обозначив сумму за AA', мы снова получим 1,25A1{,}25A' в пользу обратного обмена. Стратегия «всегда меняй» загоняет нас в бесконечный цикл, где каждый шаг якобы прибылен. Это и есть логический парадокс: из верных, казалось бы, посылок следует абсурд.

Где спрятана ошибка

Ключевая подмена - в обозначении AA. В формуле 122A+12A2\tfrac{1}{2}\cdot 2A + \tfrac{1}{2}\cdot \tfrac{A}{2} символ AA играет сразу две несовместимые роли. В первом слагаемом AA - это меньшая из двух сумм (значит, во втором конверте 2A2A). Во втором слагаемом AA - уже большая сумма (во втором конверте A/2A/2). Это разные величины: в одном сценарии пара конвертов равна (A,2A)(A, 2A), в другом - (A/2,A)(A/2, A). Складывать ожидания так, будто AA во всех слагаемых одно и то же число, - нельзя.

Корректная переменная - это меньшая сумма xx. Если зафиксировать её, то пара всегда (x,2x)(x, 2x), а наш выбранный конверт с равной вероятностью содержит xx или 2x2x. Тогда ожидаемая ценность нашего конверта - 3x2\tfrac{3x}{2}, и ровно столько же даёт другой конверт: симметрия восстановлена, преимущества обмена нет.

Подвох в том, что «сумма в моём конверте равна A» - это не одно событие, а сразу два разных мира с разными парами конвертов. Условие на наблюдаемое A меняет вероятности, и они уже не равны 1/2.

Почему вероятности не равны 1/2

Тонкость глубже простой ошибки обозначений. Даже если честно открыть конверт и увидеть конкретное число AA, наивный расчёт предполагает, что условные вероятности «я держу меньший» и «я держу больший» по-прежнему равны одной второй. Это верно только при особом - и невозможном - априорном распределении сумм.

Обозначим через P(x)P(x) априорную вероятность того, что меньшая сумма равна xx. Увидев в конверте число AA, мы оказываемся в одной из двух ситуаций: либо меньшая сумма x=Ax = A (наш конверт меньший), либо меньшая сумма x=A/2x = A/2 (наш конверт больший, во втором лежит A/2A/2). По формуле Байеса вероятность того, что наш конверт меньший:

P(меньшийA)=P(A)P(A)+P(A/2).P(\text{меньший} \mid A) = \frac{P(A)}{P(A) + P(A/2)}.

Эта дробь равна одной второй только если P(A)=P(A/2)P(A) = P(A/2) для всех AA - то есть распределение должно быть одинаковым на всех масштабах, от копеек до триллионов. Такого распределения вероятностей не существует: его интеграл был бы бесконечным. Любое реальное (нормируемое) распределение где-то убывает, и в этой зоне обмен уже невыгоден.

Схема байесовского обновления: наблюдаемая сумма A раздваивает гипотезы о паре конвертов, подпись поясняет роль априорного распределения
Схема байесовского обновления: наблюдаемая сумма A раздваивает гипотезы о паре конвертов, подпись поясняет роль априорного распределения

Байесовское решение

Корректная стратегия зависит от того, что мы знаем о возможных суммах. Если у нас есть разумное априорное распределение P(x)P(x) (а оно всегда есть - деньги ограничены сверху), то, увидев AA, мы честно считаем ожидаемый выигрыш обмена:

E[обменA]=P(меньшийA)2A+P(большийA)A2.\mathbb{E}[\text{обмен} \mid A] = P(\text{меньший}\mid A)\cdot 2A + P(\text{больший}\mid A)\cdot \frac{A}{2}.

При малых AA (где P(A)P(A/2)P(A) \approx P(A/2), распределение ещё «плоское») обмен может быть слегка выгоден. Но при больших AA, ближе к верхней границе сумм, вероятность P(A/2)P(A/2) заметно превышает P(A)P(A) - значит, наш конверт скорее больший, и менять не стоит. В среднем по всем возможным AA выигрыши и проигрыши точно компенсируются: безусловное ожидание обмена равно нулю, как и требует симметрия.

Иначе говоря, информация в наблюдаемом AA реальна, но она работает не так, как в наивном расчёте: большое AA - слабый сигнал, что вам уже достался больший конверт. Это роднит задачу с другими сюжетами теории принятия решений, где правильный ответ требует явной вероятностной модели, а не «голой» симметрии.

Вариант с закрытым конвертом

Особый случай - когда конверт не вскрывают и сумму AA не наблюдают. Тогда никакой информации нет вообще, и парадокс исчезает на корню: оба конверта обмениваемы по определению, ожидаемая ценность каждого одинакова. Формально мы сравниваем E[наш]\mathbb{E}[\text{наш}] и E[второй]\mathbb{E}[\text{второй}] без всякого условия - и обе равны 32E[x]\tfrac{3}{2}\,\mathbb{E}[x].

Именно поэтому фраза «менять выгодно независимо от того, что в конверте» так подозрительна: если решение одинаково при любом AA, то знание AA не нужно - а раз оно не нужно, ситуация полностью симметрична и обмен ничего не даёт. Это рассуждение «от противного» само по себе разоблачает парадокс ещё до всякой арифметики.

Частые ошибки

  • Одна буква AA для двух разных сумм. Самая распространённая ловушка: в формуле 1,25A1{,}25A величина AA молча меняет смысл от слагаемого к слагаемому. Фиксируйте меньшую сумму xx - и парадокс исчезает.
  • Предположение, что P(меньшийA)=1/2P(\text{меньший}\mid A) = 1/2. Это равенство требует невозможного равномерного распределения на всей положительной оси. Любое реальное распределение делает его ложным при больших AA.
  • Смешение закрытого и открытого вариантов. В закрытом варианте информации нет и обмен нейтрален; в открытом - нужна байесовская модель. Это разные задачи, а не одна.
  • Игнорирование верхней границы сумм. В жизни деньги ограничены. Как только есть максимум, при суммах около него обмен заведомо невыгоден, и баланс сходится.
  • Вывод о бесконечном обмене. Если каждый обмен «выгоден», бесконечная цепочка обменов должна давать бесконечный выигрыш - явный признак, что в посылке ошибка, а не в мире.

FAQ

Так менять конверт или нет? Если вы не видели сумму - без разницы, ожидаемые ценности равны. Если видели AA - ответ зависит от вашего априорного представления о возможных суммах: при «больших» AA менять, как правило, не стоит.

Почему же расчёт даёт 1,25A, если это неверно? Потому что в нём AA незаметно обозначает то меньшую, то большую сумму. Это не корректное условное ожидание, а сумма двух величин из разных сценариев, выданная за одно число.

Существует ли распределение, при котором менять всегда выгодно? Нет нормируемого распределения с этим свойством. Можно построить «несобственные» конструкции с бесконечным матожиданием, но они не описывают реальную лотерею с конечными деньгами.

Чем это похоже на другие вероятностные парадоксы? Как и парадокс Монти Холла, задача показывает: интуиция о вероятностях ненадёжна, пока не выписана явная модель того, как устроен случайный выбор и что именно мы наблюдаем.

Коротко

Парадокс двух конвертов - это не загадка про деньги, а демонстрация того, как небрежное обозначение и молчаливое допущение о равных вероятностях рождают абсурдный вывод «меняй всегда». Стоит зафиксировать меньшую сумму xx или выписать честное априорное распределение P(x)P(x) - и симметрия возвращается: в закрытом варианте обмен нейтрален, в открытом им управляет байесовское обновление, а бесконечный обмен оказывается невозможным.

Доверьте текст нейросети EssayAI

Открыть EssayAI

Бесплатно, на русском языке и без VPN

Читайте также