Модель Штакельберга: лидер, последователь и первый ход

17 мая 2026Время чтения: 8 минут

#микроэкономика#модель Штакельберга#олигополия#лидер и последователь#обратная индукция

Модель Штакельберга - модель олигополии с последовательным выбором объёмов: одна фирма (лидер) делает ход первой, а вторая (последователь) выбирает свой выпуск, уже видя решение лидера. Её предложил немецкий экономист Генрих фон Штакельберг в 1934 году как развитие идеи количественной конкуренции. Ключевое отличие от одновременного хода в модели Курно - асимметрия информации во времени: лидер знает, что его выбор наблюдаем, и закладывает в своё решение предсказуемую реакцию конкурента. Именно из этого вырастает центральный сюжет модели - преимущество первого хода.

Постановка: кто ходит первым

Рынок тот же, что в количественных моделях олигополии, меняется только порядок ходов.

Обратный спрос линейный: $P(Q) = a - bQ$ , где $Q = q_L + q_F$ - совокупный выпуск лидера и последователя, $a, b > 0$ .
Издержки симметричны: предельные издержки обеих фирм равны $c$ , причём $c < a$ .
Ходы последовательны: сначала лидер выбирает $q_L$ , затем последователь, наблюдая $q_L$ , выбирает $q_F$ .
Решение - совершенное по подыграм равновесие: ищется не равновесие Нэша «в лоб», а устойчивое к проверке на каждом этапе игры. Технически это означает решение методом обратной индукции.

Прибыли записываются стандартно:

$\pi_L = (a - b(q_L + q_F) - c) \, q_L, \qquad \pi_F = (a - b(q_L + q_F) - c) \, q_F.$

Разница с Курно не в формулах прибыли, а в том, что лидер максимизирует $\pi_L$ с учётом того, как $q_F$ зависит от $q_L$ .

Обратная индукция: решаем с конца

Метод обратной индукции - это разбор дерева игры от последнего хода к первому. Здесь последний ход делает последователь, поэтому начинаем с него.

Шаг 1. Задача последователя. Последователь видит уже выбранный $q_L$ и максимизирует свою прибыль по $q_F$ . Условие первого порядка $\partial \pi_F / \partial q_F = 0$ даёт

$a - bq_L - 2bq_F - c = 0 \implies q_F^*(q_L) = \frac{a - c - bq_L}{2b}.$

Это в точности функция реакции в духе Курно - но теперь лидер использует её не как одно из двух уравнений системы, а как известную ему заранее формулу поведения соперника.

Шаг 2. Задача лидера. Лидер подставляет функцию реакции последователя прямо в свою прибыль, превращая $\pi_L$ в функцию одной переменной $q_L$ :

$\pi_L = \left(a - b\left(q_L + \frac{a - c - bq_L}{2b}\right) - c\right) q_L = \frac{(a - c - bq_L)}{2} \, q_L.$

Максимизация по $q_L$ ( $\partial \pi_L / \partial q_L = 0$ ) даёт линейное уравнение $a - c - 2bq_L = 0$ , откуда

$q_L^* = \frac{a - c}{2b}.$

Равновесные значения

Подставляем $q_L^*$ обратно в функцию реакции последователя:

$q_F^* = \frac{a - c - b \cdot \frac{a-c}{2b}}{2b} = \frac{a - c}{4b}.$

Совокупный выпуск и цена:

$Q^* = q_L^* + q_F^* = \frac{3(a - c)}{4b}, \qquad P^* = a - bQ^* = \frac{a + 3c}{4}.$

Прибыли (подстановкой в $\pi$ ):

$\pi_L^* = \frac{(a - c)^2}{8b}, \qquad \pi_F^* = \frac{(a - c)^2}{16b}.$

Сразу видно главное: лидер выпускает вдвое больше последователя ( $q_L^* = 2 q_F^*$ ) и зарабатывает вдвое больше ( $\pi_L^* = 2\pi_F^*$ ). Это и есть количественное выражение преимущества первого хода.

Преимущество первого хода: откуда оно

Почему первенство ценно? Лидер не просто «успевает раньше» - он использует обязательство. Выбрав $q_L = (a-c)/(2b)$ (а это ровно монопольный выпуск), он делает свой выбор необратимым и наблюдаемым. Последователь вынужден принять его как данность и оптимально подстроиться, сократив собственный выпуск.

Содержательно это работает только при двух условиях:

Обязательство достоверно. Лидер физически не может пересмотреть $q_L$ после хода последователя - иначе угроза «я уже выпустил много» пустая, и игра схлопывается обратно к одновременному выбору.
Ход наблюдаем. Последователь действительно видит $q_L$ . Если решение лидера скрыто, наблюдать нечего - и снова получается Курно.

Преимущество первого хода - это всегда про обязательство, а не про скорость. Ценность лидерства возникает ровно тогда, когда лидер может связать себе руки так, чтобы соперник был вынужден отступить.

Сравнение с моделью Курно

Подробный разбор одновременной игры - в статье про модель Курно; здесь сопоставим только итоги при одинаковых $a$ , $b$ , $c$ .

Показатель	Курно (одновременно)	Штакельберг (последовательно)
Выпуск лидера	$\dfrac{a-c}{3b}$	$\dfrac{a-c}{2b}$
Выпуск второй фирмы	$\dfrac{a-c}{3b}$	$\dfrac{a-c}{4b}$
Совокупный выпуск	$\dfrac{2(a-c)}{3b}$	$\dfrac{3(a-c)}{4b}$
Цена	$\dfrac{a+2c}{3}$	$\dfrac{a+3c}{4}$

Три вывода из таблицы:

Совокупный выпуск выше, а цена ниже, чем в Курно: $\frac{3}{4} > \frac{2}{3}$ . Перенос инициативы к одному игроку делает рынок чуть конкурентнее для потребителя.
Лидер выигрывает от перехода к последовательности: его выпуск и прибыль растут по сравнению с курновскими $(a-c)/(3b)$ и $(a-c)^2/(9b)$ .
Последователь проигрывает: его прибыль падает с $(a-c)^2/(9b)$ до $(a-c)^2/(16b)$ . Возможность «ответить вторым» здесь не преимущество, а вынужденная позиция.

Это переворачивает наивную интуицию «лучше посмотреть, что сделает конкурент, и ответить». В играх с обязательством наблюдать второму хуже, чем связать себе руки первому.

Парадокс ценности информации

Тонкий момент, который любят на экзаменах. Казалось бы, у последователя больше информации - он знает $q_L$ . Но это знание ему вредит относительно симметричного Курно. Дополнительная информация ценна, только если ты можешь ею воспользоваться скрытно; здесь же лидер заранее эксплуатирует тот факт, что последователь рационально отреагирует на наблюдаемый ход.

Отсюда естественный вопрос: а что, если обе фирмы захотят быть лидером? Если каждая попытается выпустить $q_L = (a-c)/(2b)$ , совокупный выпуск составит $(a-c)/b$ , цена упадёт до $c$ , прибыль обнулится. Эта неустойчивая ситуация называется войной Штакельберга (Stackelberg warfare) и показывает, что роль лидера должна быть закреплена структурой рынка - например, исторически более крупной фирмой или владельцем ключевой технологии, - а не просто желанием.

Когда уместна модель Штакельберга

Последовательный выбор объёмов адекватно описывает рынки с устойчивым лидером и наблюдаемыми мощностями:

Доминирующая фирма и конкурентное окружение: крупный игрок задаёт объём производства, остальные подстраиваются (классически - рынки сырья, где есть мейджор и мелкие производители).
Ввод необратимых мощностей: фирма, первой построившая завод фиксированной мощности, фактически совершает наблюдаемое обязательство по объёму.
Технологическое первенство: лидер, раньше вышедший с продуктом, формирует объём предложения, под который вынуждены подстраиваться поздние входящие.

Если же мощности фирм скрыты, либо решения корректируются быстро и многократно, последовательная структура распадается и корректнее брать Курно.

Частые ошибки

Решать как систему двух функций реакции. В Курно так можно - там два симметричных условия первого порядка. В Штакельберге функция реакции одна (у последователя), и она подставляется в прибыль лидера. Попытка приравнять две функции реакции даёт курновский ответ и теряет весь смысл лидерства.
Считать, что лидеру выгодно выпускать как можно больше. Нет: оптимум лидера - конечное $q_L = (a-c)/(2b)$ . Дальнейшее наращивание сбивает цену сильнее, чем растёт его доля, и прибыль падает.
Путать выигрыш лидера с выигрышем для рынка. Лидер зарабатывает больше, но совокупная прибыль отрасли $\pi_L^* + \pi_F^* = 3(a-c)^2/(16b)$ меньше, чем в Курно ( $2(a-c)^2/(9b)$ ). Перераспределение в пользу лидера сопровождается ростом выпуска и снижением общей маржи.
Забывать про достоверность обязательства. Если лидер может тайно пересмотреть выпуск после хода последователя, равновесие схлопывается обратно к Курно. Преимущество первого хода держится только на необратимости.
Применять формулы при $q_F^* < 0$ . При сильно различных издержках выпуск последователя из функции реакции может выйти отрицательным - это сигнал, что он вытеснен с рынка, и лидер действует как монополист.

FAQ

Чем равновесие Штакельберга отличается от равновесия Нэша? Равновесие Штакельберга - это совершенное по подыграм равновесие Нэша (subgame-perfect): оно остаётся равновесием Нэша на каждом этапе игры. Формально пара стратегий лидера и последователя - равновесие Нэша всей игры, но из множества таких равновесий обратная индукция выбирает единственное, устойчивое к проверке «а что рационально сделать на этом шаге». Поэтому корректно говорить именно о совершенном по подыграм решении, а не просто о равновесии Нэша.

Почему лидер выпускает ровно монопольный объём? Совпадение $q_L^* = (a-c)/(2b)$ с монопольным выпуском не случайно для линейного спроса и равных издержек: подставив функцию реакции последователя, лидер сталкивается с «остаточным» спросом, по структуре идентичным монопольному, и максимизирует по той же логике. При нелинейном спросе или асимметричных издержках это совпадение исчезает, но метод обратной индукции работает так же.

Что выгоднее фирме - быть лидером, последователем или играть в Курно? По убыванию прибыли: лидер Штакельберга $(a-c)^2/(8b)$ > Курно $(a-c)^2/(9b)$ > последователь $(a-c)^2/(16b)$ . Поэтому за роль лидера фирмы готовы конкурировать (вплоть до войны Штакельберга), а оказаться последователем - худший из трёх исходов для количественной конкуренции.

Коротко

Модель Штакельберга - олигополия с последовательным выбором объёмов, решаемая обратной индукцией. Последователь действует по функции реакции $q_F = (a-c-bq_L)/(2b)$ , лидер подставляет её в свою прибыль и выбирает $q_L^* = (a-c)/(2b)$ , после чего $q_F^* = (a-c)/(4b)$ . Лидер выпускает и зарабатывает вдвое больше последователя - это и есть преимущество первого хода, держащееся на достоверном наблюдаемом обязательстве. По сравнению с моделью Курно совокупный выпуск выше, цена ниже, лидер выигрывает, а последователь проигрывает. Содержательно ценно не «успеть раньше», а связать себе руки так, чтобы соперник был вынужден отступить.