EssayAI
Блог
Блог
Математика и алгоритмы

Теорема Хана-Банаха: продолжение функционала и разделение выпуклых множеств

9 февраля 2026Время чтения: 12 минут
#математика#функциональный анализ#теорема Хана-Банаха#двойственность#выпуклый анализ
Теорема Хана-Банаха: продолжение функционала и разделение выпуклых множеств

Теорема Хана-Банаха - одна из трёх «китов» функционального анализа (наряду с теоремой Банаха-Штейнгауза и теоремой об открытом отображении). Её главный смысл: на любом векторном пространстве сопряжённое XX^* достаточно богатое - функционалов хватает, чтобы «увидеть» каждый ненулевой вектор. Без этого факта не работают двойственность, теорема Рисса о представлении, теория рефлексивных пространств, а в прикладных задачах - двойственность линейного программирования и теоремы об отделимости из математической экономики. Носит имя Ганса Хана (1927, для нормированных пространств) и Стефана Банаха (1929, общий случай с сублинейной мажорантой).

Постановка: что значит «продолжить функционал»

Пусть XX - вещественное векторное пространство, MXM \subset X - его линейное подпространство, f ⁣:MRf \colon M \to \mathbb{R} - линейный функционал. Вопрос: можно ли расширить ff до линейного функционала F ⁣:XRF \colon X \to \mathbb{R}, совпадающего с ff на MM? Без дополнительных условий - да, всегда, тривиально (по теореме о базисе и аксиоме выбора). Но содержательный вопрос - можно ли при этом сохранить оценку: если на MM выполняется f(x)p(x)f(x) \leq p(x) для какой-то функции pp, можно ли получить F(x)p(x)F(x) \leq p(x) уже на всём XX?

Ответ - да, при единственном условии на pp: она должна быть сублинейной.

Определение. Функция p ⁣:XRp \colon X \to \mathbb{R} называется сублинейной, если:

  1. p(αx)=αp(x)p(\alpha x) = \alpha p(x) для всех α0\alpha \geq 0 (положительная однородность);
  2. p(x+y)p(x)+p(y)p(x + y) \leq p(x) + p(y) (субаддитивность).

Норма - частный случай сублинейной функции, как и опорная функция выпуклого множества. Это широкий класс.

Аналитическая теорема Хана-Банаха

Теорема (Хан, 1927; Банах, 1929). Пусть XX - вещественное векторное пространство, p ⁣:XRp \colon X \to \mathbb{R} - сублинейная функция, MXM \subset X - линейное подпространство, f ⁣:MRf \colon M \to \mathbb{R} - линейный функционал с f(x)p(x)f(x) \leq p(x) для всех xMx \in M. Тогда существует линейный функционал F ⁣:XRF \colon X \to \mathbb{R} такой, что

FM=fиF(x)p(x) для всех xX.F|_M = f \quad \text{и} \quad F(x) \leq p(x) \text{ для всех } x \in X.

Продолжение, вообще говоря, не единственно - выбор зависит от того, какой направление «нового» вектора x0Mx_0 \notin M берётся первым.

Подставь свою тройку (X,M,f)(X, M, f) или пару выпуклых множеств ниже - соберём постановку и доведём до конкретного продолжения или разделяющей гиперплоскости.

Доказательство-эскиз через лемму Цорна

Стандартный план - расширять ff на один вектор за шаг и потом применить лемму Цорна.

Шаг 1 (один новый вектор). Пусть x0XMx_0 \in X \setminus M. Расширим ff на M0=M+Rx0M_0 = M + \mathbb{R} x_0. Любой элемент M0M_0 записывается единственно как y+tx0y + t x_0 (yMy \in M, tRt \in \mathbb{R}). Положим F(y+tx0)=f(y)+tcF(y + t x_0) = f(y) + t c - нужно выбрать cRc \in \mathbb{R} так, чтобы FpF \leq p на M0M_0. Это приводит к двойному неравенству

supyM(f(y)p(yx0))cinfyM(p(y+x0)f(y)).\sup_{y \in M} \bigl( f(y) - p(y - x_0) \bigr) \leq c \leq \inf_{y \in M} \bigl( p(y + x_0) - f(y) \bigr).

Существование такого cc - следствие субаддитивности pp: для любых y1,y2My_1, y_2 \in M выполняется f(y1)+f(y2)=f(y1+y2)p(y1+y2)p(y1x0)+p(y2+x0)f(y_1) + f(y_2) = f(y_1 + y_2) \leq p(y_1 + y_2) \leq p(y_1 - x_0) + p(y_2 + x_0), откуда левая часть не превосходит правой.

Шаг 2 (лемма Цорна). Рассмотрим множество всех пар (N,g)(N, g), где NMN \supset M - подпространство и g ⁣:NRg \colon N \to \mathbb{R} - продолжение ff с gpg \leq p. Введём на нём порядок: (N1,g1)(N2,g2)(N_1, g_1) \preceq (N_2, g_2), если N1N2N_1 \subset N_2 и g2N1=g1g_2|_{N_1} = g_1. Любая цепь имеет верхнюю грань (объединение подпространств с согласованными функционалами). По лемме Цорна есть максимальный элемент (N,F)(N^*, F). Если бы NXN^* \neq X, можно было бы применить шаг 1 к любому x0Nx_0 \notin N^* - противоречие. Значит N=XN^* = X.

Шаг 2 - единственное место, где привлекается аксиома выбора. В сепарабельных нормированных пространствах можно обойтись индукцией по счётному плотному множеству, но в общем случае без AC доказательство известными методами не построить.

Комплексная версия: Боненблуст-Собчик

В комплексном случае линейность означает f(λx)=λf(x)f(\lambda x) = \lambda f(x) для λC\lambda \in \mathbb{C}. Сублинейная мажоранта pp должна быть полунормой (то есть p(λx)=λp(x)p(\lambda x) = |\lambda| p(x)).

Теорема (Боненблуст-Собчик, 1938). Пусть XX - комплексное векторное пространство, pp - полунорма на XX, MXM \subset X - комплексное подпространство, f ⁣:MCf \colon M \to \mathbb{C} - комплексно-линейный функционал с f(x)p(x)|f(x)| \leq p(x). Тогда существует комплексно-линейное продолжение F ⁣:XCF \colon X \to \mathbb{C} с F(x)p(x)|F(x)| \leq p(x).

Трюк доказательства - представить f=u+ivf = u + i v через вещественные части, заметить v(x)=u(ix)v(x) = -u(ix) (из комплексной линейности), применить вещественную теорему к uu, восстановить F(x)=U(x)iU(ix)F(x) = U(x) - i U(ix). Получается комплексное продолжение с сохранением оценки модуля.

Геометрическая форма: разделение выпуклых множеств

Эта формулировка для прикладника часто полезнее аналитической. Она утверждает, что два непересекающихся выпуклых множества можно «разделить» гиперплоскостью - линейным функционалом, на котором значения одного множества не превосходят значений другого.

Первая теорема об отделимости (open separation). Пусть A,BXA, B \subset X - непустые непересекающиеся выпуклые множества в нормированном пространстве, причём AA открыто. Тогда существует ненулевой непрерывный линейный функционал fXf \in X^* и число cRc \in \mathbb{R} такие, что

f(a)<cf(b)для всех aA, bB.f(a) < c \leq f(b) \quad \text{для всех } a \in A,\ b \in B.

Вторая теорема об отделимости (strict separation). Если AA компактно, BB замкнуто, и оба выпуклые непересекающиеся, то можно разделить строго: существуют fXf \in X^* и c1<c2c_1 < c_2 такие, что

f(a)c1<c2f(b)для всех aA, bB.f(a) \leq c_1 < c_2 \leq f(b) \quad \text{для всех } a \in A,\ b \in B.

Геометрическая форма выводится из аналитической: берём C=ABC = A - B (выпукло, 0C0 \notin C из непересечения, CC открыто в первой версии), строим опорную функцию pCp_C - функционал Минковского - и применяем аналитическую теорему к одномерному подпространству, проходящему через выбранную точку. Строгая отделимость требует компактности именно потому, что нужно отделить 00 от замкнутого множества с положительным расстоянием.

Если оба множества просто замкнутые выпуклые непересекающиеся - отделить их может не получиться. Контрпример: $A = \{(x, y) : y \geq e^x\}$, $B = \{(x, 0) : x \in \mathbb{R}\}$ в $\mathbb{R}^2$. Множества не пересекаются, оба замкнуты, оба выпуклы, но любая гиперплоскость, отделяющая их, имеет в качестве нормали направление $(0, 1)$ - и тогда $A$ и $B$ оба лежат в одной полуплоскости только нестрого. Компактность одного из множеств обязательна.

Следствие: нормирующий функционал

Это самое частое прикладное следствие. Если XX - нормированное пространство и x0Xx_0 \in X, x00x_0 \neq 0, то существует функционал fXf \in X^* с f=1\|f\| = 1 и f(x0)=x0f(x_0) = \|x_0\|.

Доказательство. На одномерном подпространстве M=Rx0M = \mathbb{R} x_0 определим f0(αx0)=αx0f_0(\alpha x_0) = \alpha \|x_0\|. Тогда f0(αx0)=αx0=αx0|f_0(\alpha x_0)| = |\alpha| \|x_0\| = \|\alpha x_0\|, значит f0M=1\|f_0\|_M = 1. По теореме Хана-Банаха (с p(x)=xp(x) = \|x\|) продолжаем f0f_0 до fXf \in X^* с f(x)x|f(x)| \leq \|x\|, то есть f1\|f\| \leq 1. С другой стороны, f(x0)=x0f(x_0) = \|x_0\|, значит f1\|f\| \geq 1. Итого f=1\|f\| = 1.

Это следствие гарантирует, что сопряжённое пространство XX^* «различает точки»: для разных xyx \neq y всегда найдётся ff с f(x)f(y)f(x) \neq f(y) (применить к x0=xyx_0 = x - y). Без теоремы Хана-Банаха неочевидно даже, что X{0}X^* \neq \{0\} для произвольного нормированного пространства.

Вложение XXX \hookrightarrow X^{**} и рефлексивность

Каноническое вложение J ⁣:XXJ \colon X \to X^{**} задаётся формулой J(x)(f)=f(x)J(x)(f) = f(x), то есть xx интерпретируется как «функционал на функционалах». Это вложение всегда изометрично:

J(x)X=supf1f(x)=x.\|J(x)\|_{X^{**}} = \sup_{\|f\| \leq 1} |f(x)| = \|x\|.

Верхняя грань достигается на нормирующем функционале - а его существование как раз гарантирует Хан-Банах. Без теоремы можно было бы только утверждать J(x)x\|J(x)\| \leq \|x\|, без обратного неравенства.

Пространство XX называется рефлексивным, если вложение JJ ещё и сюръективно, то есть J(X)=XJ(X) = X^{**}. Гильбертовы пространства, LpL^p при 1<p<1 < p < \infty, p\ell^p при 1<p<1 < p < \infty - рефлексивны. Пространства L1L^1, LL^\infty, C[0,1]C[0,1], 1\ell^1, \ell^\infty - нет. Изометричность JJ - нижняя планка, без неё разговор о рефлексивности был бы бессмысленным.

Двойственность в линейном программировании

Классическая LP-задача:

(P)mincTxпри Axb, x0.\text{(P)} \quad \min c^T x \quad \text{при } A x \geq b,\ x \geq 0.

Двойственная задача:

(D)maxbTyпри ATyc, y0.\text{(D)} \quad \max b^T y \quad \text{при } A^T y \leq c,\ y \geq 0.

Теорема о сильной двойственности. Если (P) имеет конечный оптимум, то (D) имеет тот же оптимум: min(P)=max(D)\min (\text{P}) = \max (\text{D}).

Доказательство - через геометрическую теорему Хана-Банаха. Множество достижимых пар (z,Axb)(z, A x - b) при x0x \geq 0 и cTx=zc^T x = z - выпуклый конус в R1+m\mathbb{R}^{1 + m}. Если оптимум (P) равен vv, то точка (vε,0)(v - \varepsilon, 0) при ε>0\varepsilon > 0 не лежит в этом конусе - её можно отделить гиперплоскостью. Коэффициенты этой гиперплоскости - двойственные множители yy, удовлетворяющие условиям (D). Эта же конструкция в чуть более общем виде даёт теорему Каруша-Куна-Таккера для нелинейного программирования.

В теории меры аналогичную роль играет теорема Рисса о представлении функционалов на C(K)C(K) - каждый положительный линейный функционал представляется интегралом по борелевской мере, и существование этой меры в общем виде опирается на Хана-Банаха через построение разделяющих функционалов.

В математической экономике вторая теорема благосостояния (об эффективности по Парето равновесных распределений) - это прямое применение теоремы об отделимости выпуклых множеств в пространстве распределений.

Частые ошибки

  • Считают продолжение единственным. Оно почти никогда не единственно. Единственность есть только в гладких пространствах (например, LpL^p при 1<p<1 < p < \infty) и только для нормирующего функционала. В C[0,1]C[0,1], 1\ell^1, L1L^1 продолжений нормирующего функционала бесконечно много.
  • Применяют без сублинейности pp. Если pp только субаддитивна, но не положительно однородна (или однородна, но не субаддитивна), теорема не работает. Норма и опорная функция выпуклого множества - сублинейны; модуль линейного отображения - нет (он удовлетворяет f(αx)=αf(x)|f(\alpha x)| = |\alpha| |f(x)|, а не αf(x)\alpha |f(x)|). В комплексном случае нужна полунорма, а не сублинейная функция.
  • Путают открытую и строгую отделимость. Открытое непустое выпуклое и непересекающееся с ним выпуклое - отделимы (нестрого, с \leq). Строгая отделимость (<<) требует компактности одного множества и замкнутости другого. Без этой пары условий получить c1<c2c_1 < c_2 нельзя - пример с экспонентой выше показывает почему.
  • Забывают про комплексную версию. Прямое применение вещественной теоремы к комплексному пространству (через рассмотрение его как R\mathbb{R}-пространства двойной размерности) даёт только R\mathbb{R}-линейное продолжение. Чтобы получить C\mathbb{C}-линейное продолжение с сохранением fp|f| \leq p, нужна именно версия Боненблуста-Собчика и условие, что pp - полунорма.
  • Считают, что теорема даёт явную формулу. Нет - она утверждает только существование. Конкретное продолжение строится либо явно для конкретной задачи (например, через интегральное представление), либо опирается на аксиому выбора и неконструктивно.

FAQ

Зачем нужна аксиома выбора в доказательстве? Лемма Цорна (эквивалент аксиомы выбора) гарантирует, что цепь вложенных подпространств с согласованными продолжениями имеет максимальный элемент. Без неё нельзя гарантировать, что счётное расширение «доходит» до всего XX, если XX не сепарабельно. В моделях ZF без AC теорема Хана-Банаха, как было показано Дж. Пинкусом, доказуема в более слабых формах (с использованием теоремы об ультрафильтрах), но эти формы дают меньше - например, не позволяют построить разрывный функционал на нормированном пространстве, а его существование для бесконечномерных пространств - следствие именно полной версии теоремы.

Чем теорема Хана-Банаха отличается от теоремы Рисса о представлении? Хан-Банах - это теорема о существовании функционала с нужными свойствами; она не описывает его явный вид. Теорема Рисса - конкретный явный вид для функционалов на пространствах функций: на LpL^p (1p<1 \leq p < \infty) функционалы представляются интегралом с ядром из LqL^q; на C(K)C(K) - интегралом по борелевской мере. Доказательство Рисса для C(K)C(K) опирается на Хана-Банаха (через построение положительной меры по разделяющему функционалу), а для LpL^p - на гильбертову технику и теорему Радона-Никодима. Это разные уровни абстракции: Хан-Банах - про существование, Рисс - про конкретное представление.

Что такое «нормирующий функционал» и зачем он нужен? Нормирующий функционал для x0Xx_0 \in X - это fXf \in X^* с f=1\|f\| = 1 и f(x0)=x0f(x_0) = \|x_0\|. Он нужен везде, где требуется явное «свидетельство» нормы: в доказательстве изометричности вложения XXX \hookrightarrow X^{**}, в построении геодезических в банаховых пространствах, в субдифференциальном анализе (нормирующий функционал - это субградиент нормы в точке). Существование гарантируется именно теоремой Хана-Банаха - иначе XX^* могло бы быть «слишком бедным», чтобы такие функционалы найти.

Коротко

Теорема Хана-Банаха в аналитической форме: линейный функционал ff, заданный на подпространстве MXM \subset X и мажорируемый сублинейной pp, продолжается до линейного FF на всём XX с той же мажорацией FpF \leq p. Доказательство - через лемму Цорна (один новый вектор за шаг + цепная индукция). В геометрической форме теорема разделяет непересекающиеся выпуклые множества гиперплоскостью: открыто (open separation) или строго (strict separation, требует компактности одного множества). Главные следствия - существование нормирующего функционала f(x)=xf(x) = \|x\| при f=1\|f\| = 1, изометричность вложения XXX \hookrightarrow X^{**}, базис теории рефлексивных пространств. Прикладные ветви - двойственность в линейном программировании, теорема Рисса о представлении функционалов, теоремы об отделимости в математической экономике.

Доверьте текст нейросети EssayAI

Открыть EssayAI

Бесплатно, на русском языке и без VPN

Читайте также