EssayAI
Блог
Блог
Гуманитарные науки

Модель Штакельберга: лидер, последователь и обратная индукция

17 мая 2026Время чтения: 8 минут
#микроэкономика#модель Штакельберга#олигополия#лидер и последователь#обратная индукция
Модель Штакельберга: лидер, последователь и обратная индукция

Модель Штакельберга - модель олигополии с последовательным выбором объёмов: одна фирма (лидер) делает ход первой, а вторая (последователь) выбирает свой выпуск, уже видя решение лидера. Её предложил немецкий экономист Генрих фон Штакельберг в 1934 году как развитие идеи количественной конкуренции. Ключевое отличие от одновременного хода в модели Курно - асимметрия информации во времени: лидер знает, что его выбор наблюдаем, и закладывает в своё решение предсказуемую реакцию конкурента. Именно из этого вырастает центральный сюжет модели - преимущество первого хода.

Постановка: кто ходит первым

Рынок тот же, что в количественных моделях олигополии, меняется только порядок ходов.

  • Обратный спрос линейный: P(Q)=abQP(Q) = a - bQ, где Q=qL+qFQ = q_L + q_F - совокупный выпуск лидера и последователя, a,b>0a, b > 0.
  • Издержки симметричны: предельные издержки обеих фирм равны cc, причём c<ac < a.
  • Ходы последовательны: сначала лидер выбирает qLq_L, затем последователь, наблюдая qLq_L, выбирает qFq_F.
  • Решение - совершенное по подыграм равновесие: ищется не равновесие Нэша «в лоб», а устойчивое к проверке на каждом этапе игры. Технически это означает решение методом обратной индукции.

Прибыли записываются стандартно:

πL=(ab(qL+qF)c)qL,πF=(ab(qL+qF)c)qF.\pi_L = (a - b(q_L + q_F) - c) \, q_L, \qquad \pi_F = (a - b(q_L + q_F) - c) \, q_F.

Разница с Курно не в формулах прибыли, а в том, что лидер максимизирует πL\pi_L с учётом того, как qFq_F зависит от qLq_L.

Обратная индукция: решаем с конца

Метод обратной индукции - это разбор дерева игры от последнего хода к первому. Здесь последний ход делает последователь, поэтому начинаем с него.

Шаг 1. Задача последователя. Последователь видит уже выбранный qLq_L и максимизирует свою прибыль по qFq_F. Условие первого порядка πF/qF=0\partial \pi_F / \partial q_F = 0 даёт

abqL2bqFc=0    qF(qL)=acbqL2b.a - bq_L - 2bq_F - c = 0 \implies q_F^*(q_L) = \frac{a - c - bq_L}{2b}.

Это в точности функция реакции в духе Курно - но теперь лидер использует её не как одно из двух уравнений системы, а как известную ему заранее формулу поведения соперника.

Шаг 2. Задача лидера. Лидер подставляет функцию реакции последователя прямо в свою прибыль, превращая πL\pi_L в функцию одной переменной qLq_L:

πL=(ab(qL+acbqL2b)c)qL=(acbqL)2qL.\pi_L = \left(a - b\left(q_L + \frac{a - c - bq_L}{2b}\right) - c\right) q_L = \frac{(a - c - bq_L)}{2} \, q_L.

Максимизация по qLq_L (πL/qL=0\partial \pi_L / \partial q_L = 0) даёт линейное уравнение ac2bqL=0a - c - 2bq_L = 0, откуда

qL=ac2b.q_L^* = \frac{a - c}{2b}.

Равновесные значения

Подставляем qLq_L^* обратно в функцию реакции последователя:

qF=acbac2b2b=ac4b.q_F^* = \frac{a - c - b \cdot \frac{a-c}{2b}}{2b} = \frac{a - c}{4b}.

Совокупный выпуск и цена:

Q=qL+qF=3(ac)4b,P=abQ=a+3c4.Q^* = q_L^* + q_F^* = \frac{3(a - c)}{4b}, \qquad P^* = a - bQ^* = \frac{a + 3c}{4}.

Прибыли (подстановкой в π\pi):

πL=(ac)28b,πF=(ac)216b.\pi_L^* = \frac{(a - c)^2}{8b}, \qquad \pi_F^* = \frac{(a - c)^2}{16b}.

Сразу видно главное: лидер выпускает вдвое больше последователя (qL=2qFq_L^* = 2 q_F^*) и зарабатывает вдвое больше (πL=2πF\pi_L^* = 2\pi_F^*). Это и есть количественное выражение преимущества первого хода.

Преимущество первого хода: откуда оно

Почему первенство ценно? Лидер не просто «успевает раньше» - он использует обязательство. Выбрав qL=(ac)/(2b)q_L = (a-c)/(2b) (а это ровно монопольный выпуск), он делает свой выбор необратимым и наблюдаемым. Последователь вынужден принять его как данность и оптимально подстроиться, сократив собственный выпуск.

Содержательно это работает только при двух условиях:

  • Обязательство достоверно. Лидер физически не может пересмотреть qLq_L после хода последователя - иначе угроза «я уже выпустил много» пустая, и игра схлопывается обратно к одновременному выбору.
  • Ход наблюдаем. Последователь действительно видит qLq_L. Если решение лидера скрыто, наблюдать нечего - и снова получается Курно.

Преимущество первого хода - это всегда про обязательство, а не про скорость. Ценность лидерства возникает ровно тогда, когда лидер может связать себе руки так, чтобы соперник был вынужден отступить.

Сравнение с моделью Курно

Подробный разбор одновременной игры - в статье про модель Курно; здесь сопоставим только итоги при одинаковых aa, bb, cc.

ПоказательКурно (одновременно)Штакельберг (последовательно)
Выпуск лидераac3b\dfrac{a-c}{3b}ac2b\dfrac{a-c}{2b}
Выпуск второй фирмыac3b\dfrac{a-c}{3b}ac4b\dfrac{a-c}{4b}
Совокупный выпуск2(ac)3b\dfrac{2(a-c)}{3b}3(ac)4b\dfrac{3(a-c)}{4b}
Ценаa+2c3\dfrac{a+2c}{3}a+3c4\dfrac{a+3c}{4}

Три вывода из таблицы:

  • Совокупный выпуск выше, а цена ниже, чем в Курно: 34>23\frac{3}{4} > \frac{2}{3}. Перенос инициативы к одному игроку делает рынок чуть конкурентнее для потребителя.
  • Лидер выигрывает от перехода к последовательности: его выпуск и прибыль растут по сравнению с курновскими (ac)/(3b)(a-c)/(3b) и (ac)2/(9b)(a-c)^2/(9b).
  • Последователь проигрывает: его прибыль падает с (ac)2/(9b)(a-c)^2/(9b) до (ac)2/(16b)(a-c)^2/(16b). Возможность «ответить вторым» здесь не преимущество, а вынужденная позиция.

Это переворачивает наивную интуицию «лучше посмотреть, что сделает конкурент, и ответить». В играх с обязательством наблюдать второму хуже, чем связать себе руки первому.

Парадокс ценности информации

Тонкий момент, который любят на экзаменах. Казалось бы, у последователя больше информации - он знает qLq_L. Но это знание ему вредит относительно симметричного Курно. Дополнительная информация ценна, только если ты можешь ею воспользоваться скрытно; здесь же лидер заранее эксплуатирует тот факт, что последователь рационально отреагирует на наблюдаемый ход.

Отсюда естественный вопрос: а что, если обе фирмы захотят быть лидером? Если каждая попытается выпустить qL=(ac)/(2b)q_L = (a-c)/(2b), совокупный выпуск составит (ac)/b(a-c)/b, цена упадёт до cc, прибыль обнулится. Эта неустойчивая ситуация называется войной Штакельберга (Stackelberg warfare) и показывает, что роль лидера должна быть закреплена структурой рынка - например, исторически более крупной фирмой или владельцем ключевой технологии, - а не просто желанием.

Когда уместна модель Штакельберга

Последовательный выбор объёмов адекватно описывает рынки с устойчивым лидером и наблюдаемыми мощностями:

  • Доминирующая фирма и конкурентное окружение: крупный игрок задаёт объём производства, остальные подстраиваются (классически - рынки сырья, где есть мейджор и мелкие производители).
  • Ввод необратимых мощностей: фирма, первой построившая завод фиксированной мощности, фактически совершает наблюдаемое обязательство по объёму.
  • Технологическое первенство: лидер, раньше вышедший с продуктом, формирует объём предложения, под который вынуждены подстраиваться поздние входящие.

Если же мощности фирм скрыты, либо решения корректируются быстро и многократно, последовательная структура распадается и корректнее брать Курно.

Частые ошибки

  • Решать как систему двух функций реакции. В Курно так можно - там два симметричных условия первого порядка. В Штакельберге функция реакции одна (у последователя), и она подставляется в прибыль лидера. Попытка приравнять две функции реакции даёт курновский ответ и теряет весь смысл лидерства.
  • Считать, что лидеру выгодно выпускать как можно больше. Нет: оптимум лидера - конечное qL=(ac)/(2b)q_L = (a-c)/(2b). Дальнейшее наращивание сбивает цену сильнее, чем растёт его доля, и прибыль падает.
  • Путать выигрыш лидера с выигрышем для рынка. Лидер зарабатывает больше, но совокупная прибыль отрасли πL+πF=3(ac)2/(16b)\pi_L^* + \pi_F^* = 3(a-c)^2/(16b) меньше, чем в Курно (2(ac)2/(9b)2(a-c)^2/(9b)). Перераспределение в пользу лидера сопровождается ростом выпуска и снижением общей маржи.
  • Забывать про достоверность обязательства. Если лидер может тайно пересмотреть выпуск после хода последователя, равновесие схлопывается обратно к Курно. Преимущество первого хода держится только на необратимости.
  • Применять формулы при qF<0q_F^* < 0. При сильно различных издержках выпуск последователя из функции реакции может выйти отрицательным - это сигнал, что он вытеснен с рынка, и лидер действует как монополист.

FAQ

Чем равновесие Штакельберга отличается от равновесия Нэша? Равновесие Штакельберга - это совершенное по подыграм равновесие Нэша (subgame-perfect): оно остаётся равновесием Нэша на каждом этапе игры. Формально пара стратегий лидера и последователя - равновесие Нэша всей игры, но из множества таких равновесий обратная индукция выбирает единственное, устойчивое к проверке «а что рационально сделать на этом шаге». Поэтому корректно говорить именно о совершенном по подыграм решении, а не просто о равновесии Нэша.

Почему лидер выпускает ровно монопольный объём? Совпадение qL=(ac)/(2b)q_L^* = (a-c)/(2b) с монопольным выпуском не случайно для линейного спроса и равных издержек: подставив функцию реакции последователя, лидер сталкивается с «остаточным» спросом, по структуре идентичным монопольному, и максимизирует по той же логике. При нелинейном спросе или асимметричных издержках это совпадение исчезает, но метод обратной индукции работает так же.

Что выгоднее фирме - быть лидером, последователем или играть в Курно? По убыванию прибыли: лидер Штакельберга (ac)2/(8b)(a-c)^2/(8b) > Курно (ac)2/(9b)(a-c)^2/(9b) > последователь (ac)2/(16b)(a-c)^2/(16b). Поэтому за роль лидера фирмы готовы конкурировать (вплоть до войны Штакельберга), а оказаться последователем - худший из трёх исходов для количественной конкуренции.

Коротко

Модель Штакельберга - олигополия с последовательным выбором объёмов, решаемая обратной индукцией. Последователь действует по функции реакции qF=(acbqL)/(2b)q_F = (a-c-bq_L)/(2b), лидер подставляет её в свою прибыль и выбирает qL=(ac)/(2b)q_L^* = (a-c)/(2b), после чего qF=(ac)/(4b)q_F^* = (a-c)/(4b). Лидер выпускает и зарабатывает вдвое больше последователя - это и есть преимущество первого хода, держащееся на достоверном наблюдаемом обязательстве. По сравнению с моделью Курно совокупный выпуск выше, цена ниже, лидер выигрывает, а последователь проигрывает. Содержательно ценно не «успеть раньше», а связать себе руки так, чтобы соперник был вынужден отступить.

Доверьте текст нейросети EssayAI

Открыть EssayAI

Бесплатно, на русском языке и без VPN

Читайте также