Русская Википедия:Равенство смешанных производных
Смешанные частные производные одной и той же функции, отличающиеся лишь порядком (очерёдностью) дифференцирования, равны между собой при условии их непрерывности. Такое свойство называется равенством смешанных производных.
Само утверждение о равенстве смешанных производных в различных источниках упоминается как теорема Шварца, теорема Клеро или теорема Янга.
Теорема
Определение смешанной производной
Пусть дана достаточно гладкая (скалярная) функция <math>f</math> многих переменных:
- <math>(1) \qquad f = f(x_1, x_2, \dots x_n)</math>
Мы можем взять частную производную этой функции по одному из аргументов <math>x_i</math>, считая остальные аргументы постоянными параметрами. В результате мы получим новую функцию:
- <math>(2) \qquad \phi(x_i) = {\partial f \over \partial x_i} \bigg|_{x_1,\dots x_{i-1}, x_{i+1}, \dots x_n = const}</math>
Эта новая функция тоже зависит от остальных аргументов как от параметров. То есть численное значение <math>\phi</math> в общем случае зависит от тех же переменных <math>x_1, x_2, \dots x_n</math>, что и оригинальная функция <math>f</math>:
- <math>(3) \qquad \phi = \phi(x_1, x_2, \dots x_n)</math>
Если функция <math>\phi</math> окажется достаточно гладкой, то мы можем и её продифференцировать, взяв частную производную по тому же самому или по другому аргументу <math>x_j</math>:
- <math>(4) \qquad {\partial \phi \over \partial x_j} = {\partial^2 f \over \partial x_j \partial x_i}</math>
Если <math>j \ne i</math>, то выражение в правой части равенства (4) называется смешанной производной.
Основа теоремы
Для гладкой функции многих переменных значение смешанной производной не зависит от порядка дифференцирования:
- <math>(5) \qquad {\partial^2 f \over \partial x_i \partial x_j} = {\partial^2 f \over \partial x_j \partial x_i}</math>
Теорема является базовой в теории функций многих переменных и широко применяется в математической физике, теории дифференциальных уравнений в частных производных, дифференциальной геометрии.
Необходимая степень гладкости
Уточнять необходимую степень гладкости следует поэтапно.
- 1. Справедливость для аналитической функции (теорема).
- 2. Справедливость для более широкого класса функций, имеющих в окрестности точки только такие непрерывные производные:
- <math>(6) \qquad {\partial f \over \partial x_i}, \; {\partial f \over \partial x_j}, \; {\partial^2 f \over \partial x_i \partial x_j}, {\partial^2 f \over \partial x_j \partial x_i}</math>
- 3. Поскольку для фиксированных индексов <math>i,j</math> все производные из перечня (6) берутся при условии, что любой третий аргумент <math>x_k</math> является константой, то функция <math>f</math> (а также все производные (6)) может быть разрывной в отношении третьих аргументов. Например, составим функцию из двух слагаемых:
- <math>f(x_1, x_2, \dots x_n) = \Phi(x_i, x_j) + Z(\dots x_{i-1}, x_{i+1}, \dots x_{j-1}, x_{j+1}, \dots)</math>
где первое слагаемое является гладкой функцией двух аргументов, а второе слагаемое разрывной во всех точках.
Дальнейшее уточнение гладкости функции нужно делать в ходе доказательства теоремы, оно будет сформулировано в самом конце.
Доказательство теоремы
Как указано выше, для доказательства теоремы можно не рассматривать зависимость функции от третьих аргументов. Поэтому для простоты записи изменим обозначения <math>x_i, x_j</math> на <math>x, y</math>, то есть будем рассматривать такую функцию двух переменных:
- <math>(7) \qquad f = f(x, y)</math>
Также для упрощения формул будем обозначать частные производные индексами внизу функции:
- <math>(8) \qquad f_x(x, y) = {\partial f(x, y) \over \partial x}, \; f_y(x, y) = {\partial f(x, y) \over \partial y}</math>
- <math>(8a) \qquad f_{xy} = {\partial^2 f \over \partial x \partial y}, \; f_{yx} = {\partial^2 f \over \partial y \partial x}</math>
Пусть в точке <math>(x, y)</math> существует смешанная производная:
- <math>(9) \qquad f_{xy}(x, y) = \lim_{\Delta x \rightarrow 0} {f_y(x + \Delta x, y) - f_y(x, y) \over \Delta x}</math>
Предположим, что смешанная производная <math>f_{xy}</math> существует в точке <math>(x, y)</math>, а также существует первая производная <math>f_y(x, y)</math> вдоль (горизонтальной) прямой <math>y = const</math>.
Далее, разность производных равна производной от разности, поэтому превращаем формулу (9) в:
- <math>(10) \qquad f_{xy}(x, y) = \lim_{\Delta x \rightarrow 0} {1 \over \Delta x} {\partial \over \partial y} \left [ f(x + \Delta x, y) - f(x, y) \right ]</math>
Это преобразование никаких дополнительных условий не накладывает, поскольку разность дифференцируемых функций всегда является функцией дифференцируемой.
Далее, разность в квадратных скобках формулы (10) можно записать в виде определённого интеграла от производной:
- <math>(11) \qquad f_{xy} (x, y) = \lim_{\Delta x \rightarrow 0} {1 \over \Delta x} {\partial \over \partial y} \int_x^{x+\Delta x} f_x(\xi, y) d \xi</math>
Нужно, чтобы существовала частная производная <math>f_x</math> вдоль прямой <math>y = const</math>.
Теперь частную производную по игрек в формуле (11) запишем согласно определению производной как предела:
- <math>(12) \qquad f_{xy}(x, y) = \lim_{\Delta x \rightarrow 0} {1 \over \Delta x} \lim_{\Delta y \rightarrow 0} {1 \over \Delta y} \left ( \int_x^{x + \Delta x} f_x(\xi, y + \Delta y) d \xi - \int_x^{x + \Delta x} f_x(\xi, y) d \xi \right )</math>
Как видно, надо, чтобы частная производная <math>f_x</math> существовала не только на прямой <math>y = const</math>, но в некоторой двухмерной окрестности точки <math>(x, y)</math>.
Далее, разность интегралов равна интегралу от разности, причём под знак интеграла можно внести постоянный множитель <math>{1 \over \Delta y}</math>:
- <math>(13) \qquad f_{xy} = \lim_{\Delta x \rightarrow 0} {1 \over \Delta x} \lim_{\Delta y \rightarrow 0} \int_x^{x+\Delta x} {f_x(\xi, y + \Delta y) - f_x(\xi, y) \over \Delta y} d \xi</math>
Это преобразование также не накладывает дополнительных условий, поскольку разность интегрируемых функций является функцией интегрируемой.
По теореме Лагранжа, подынтегральное выражение в формуле (13) равно производной в средней точке:
- <math>(14) \qquad {f_x(\xi, y + \Delta y) - f_x(\xi, y) \over \Delta y} = f_{yx}(\xi, \eta)</math>
Средняя точка является функцией:
- <math>(14a) \qquad \eta = \eta(\xi, \Delta y)</math>,
значения которой лежат в интервале (если, например, <math>\Delta y > 0</math>)
- <math>(14b) \qquad \eta \in \, [y, y + \Delta y]</math>
Для справедливости (14) нужно существование смешанной производной <math>f_{yx} = {\partial^2 f \over \partial y \partial x}</math> в некоторой двухмерной окрестности точки <math>(x, y)</math>.
Для окончания доказательства надо принять, что смешанная производная непрерывна в точке <math>(x, y)</math> как функция двух переменных. Значение этой производной в близкой точке <math>(\xi, \eta)</math> равно с точностью до бесконечно малого слагаемого значению производной в точке <math>(x, y)</math>:
- <math>(15) \qquad f_{yx}(\xi, \eta) = f_{yx}(x, y) + o(\xi - x, \eta -y)</math>
Смешанная производная <math>f_{yx}</math> существует в двухмерной окрестности точки <math>(x, y)</math> и непрерывна в этой точке как функция двух переменных.
Подставим (14) и (15) в (13):
- <math>(16) \qquad f_{xy} = \lim_{\Delta x \rightarrow 0} {1 \over \Delta x} \lim_{\Delta y \rightarrow 0} \int_x^{x+\Delta x} (f_{yx}(x, y) + o(\xi - x, \eta -y)) d \xi</math>
Заметим, что формула (16) эквивалентна формуле (13) (хотя и в других обозначениях), а потому интеграл и обе границы существуют. Поскольку подынтегральная функция в (16) интегрируема, а первое слагаемое <math>f_{yx}(x,y)</math> является константой по переменной интегрирования <math>\xi</math>, то второе слагаемое тоже оказывается интегрируемым, и мы можем разбить интеграл на сумму двух интегралов, первый из которых легко берётся как интеграл от константы:
- <math>(17) \qquad \int_x^{x+\Delta x} (f_{yx}(x, y) + o(\xi - x, \eta -y)) d \xi = \int_x^{x+\Delta x} f_{yx}(x,y) d \xi + \int_x^{x+\Delta x} o(\xi - x, \eta -y) d \xi = </math>
- <math>= f_{yx} \Delta x + \int_x^{x+\Delta x} o(\xi - x, \eta -y) d \xi</math>
После подстановки (17) в (16) мы можем вынести постоянное слагаемое сначала за пределы первой границы, а затем за пределы другой границы:
- <math>(18) \qquad f_{xy} = \lim_{\Delta x \rightarrow 0} {1 \over \Delta x} \left ( f_{yx}(x,y) \Delta x + \lim_{\Delta y \rightarrow 0} \int_x^{x+\Delta x} o(\xi - x, \eta(\xi,\Delta y) -y) d \xi \right ) =</math>
- <math>= f_{yx}(x, y) + \lim_{\Delta x \rightarrow 0} {1 \over \Delta x} \lim_{\Delta y \rightarrow 0} \int_x^{x+\Delta x}o(\xi - x, \eta(\xi,\Delta y) -y) d \xi </math>
Покажем, что второе слагаемое в последнем выражении формулы (18) равно нулю. Возьмём произвольное положительное число <math>\epsilon</math>. Непрерывность смешанной производной <math>f_{yx}</math> в точке <math>(x, y)</math> означает, что существует такое положительное число <math>\delta</math>, что для каждой точки <math>(\xi, \eta)</math> внутри квадрата <math>|\xi - x| < \delta, \; |\eta - y| < \delta</math> справедливо неравенство:
- <math>(19) \qquad |o(\xi-x, \eta - y)| = |f_{yx}(\xi, \eta) - f_{yx}(x,y)| < \epsilon </math>
Если мы возьмём положительные числа <math>\Delta x < \delta, \; \Delta y < \delta</math>, то интеграл в последнем слагаемом формулы (18) оценивается сверху:
- <math>(20) \qquad \int_x^{x+\Delta x}o(\xi - x, \eta(\xi,\Delta y) -y) d \xi < \int_x^{x+\Delta x} \epsilon d \xi = \epsilon \Delta x</math>
Обозначим это слагаемое <math>L</math>
- <math>(21) \qquad L = \lim_{\Delta x \rightarrow 0} {1 \over \Delta x} \lim_{\Delta y \rightarrow 0} \int_x^{x+\Delta x}o(\xi - x, \eta(\xi,\Delta y) -y) d \xi \le \lim_{\Delta x \rightarrow 0} {1 \over \Delta x} \lim_{\Delta y \rightarrow 0} \epsilon \Delta x = \epsilon</math>
Аналогично (если взять <math>-\epsilon < \Delta x < 0</math>), имеем оценку снизу:
- <math>(22) \qquad L \ge -\epsilon</math>
Поскольку положительное число <math>\epsilon</math> может быть сколь угодно малым, то с необходимостью следует <math>L = 0</math>. Теорема доказана.
Уточнение гладкости функции
Как видно в ходе доказательства, от функции требуется существование одной смешанной производной (например, <math>f_{xy}</math>) в точке, а также существование второй смешанной производной <math>f_{yx}</math> в двумерной окрестности точки и её непрерывность в этой точке. Из этого условия также следует существование производной <math>f_y</math> вдоль отрезка прямой <math>y = const</math> и существование производной <math>f_x</math> в двумерной окрестности точки.
Кроме того, существование <math>f_{xy}</math> в точке <math>(x, y)</math> следует из двух фактов: (а) существует производная <math>f_y</math> вдоль отрезка прямой <math>y = const</math>, проходящей через точку <math>(x, y)</math>, (б) смешанная производная <math>f_{yx}</math> существует и непрерывна в этой точке.
Пример
Рассмотрим функцию
- <math>(23) \qquad f(x, y) = xy + y^2 \chi(y)</math>
где функция Дирихле <math>\chi(y)</math> равна нулю в рациональных точках <math>y={m \over n}</math> и единице в иррациональных. Функция (23) определена на всей плоскости; непрерывна (как функция двух переменных) вдоль прямой <math>y = 0</math> и разрывна во всех других точках плоскости.
Везде существует непрерывная частная производная:
- <math>(24) \qquad f_x(x, y) = {\partial f \over \partial x} = y</math>
а также одна из смешанных производных:
- <math>(25) \qquad f_{yx}(x, y) = {\partial^2 f \over \partial y \partial x} = 1</math>
Частная производная по игрек существует лишь в точках прямой <math>y=0</math>:
- <math>(26) \qquad f_y(x, 0) = x</math>
Также в этих же точках прямой существует вторая смешанная производная:
- <math>(27) \qquad f_{xy}(x, 0) = \lim_{\Delta x \rightarrow 0} {f_y(x+\Delta x, 0) - f_y(x, 0) \over \Delta x} = 1</math>
Как видим, для точек прямой <math>y = 0</math> условия теоремы выполняются, и обе смешанные производные равны.
Контрпример
Рассмотрим функцию двух переменных <math>x, y</math>
- <math>(28) \qquad f(x, y) = {|a x + b y|^3 \over \sqrt{x^2 + y^2}}</math>
где буквами <math>a, b</math> обозначены некоторые ненулевые параметры. Формула (28) задаёт непрерывную функцию всюду на плоскости за исключением начала координат <math>x=0, \; y=0</math>. Мы можем доопределить функцию <math>f(x,y)</math> в начале координат
- <math>(29) \qquad f(0,0) = 0</math>
Согласно этим определениям функция будет непрерывной также и в начале координат, что можно видеть, представив формулу (28) в полярной системе координат (и направляя <math>r \rightarrow 0</math>):
- <math>(30) \qquad f(r, \phi) = (a^2+b^2)^{3 \over 2} \, r^2 |\sin(\phi + \phi_0)|^3</math>
Покажем, что для этой доопределённой функции <math>f(x,y)</math> смешанные производные в начале координат существуют, но не равны между собой.
Сначала вычислим первые производные <math>f_x, \, f_y</math>. Как промежуточный результат, заметим, что функция «куб модуля» дважды дифференцируема, и её первая и вторая производные вычисляются по формулам:
- <math>(31) \qquad {d \over d x} |x|^3 = 3 x |x|</math>
- <math>(31a) \qquad {d^2 \over d x^2} |x|^3 = {d \over d x} (3 x |x|) = 6 |x|</math>
Теперь, учитывая (28) и (31), запишем первые производные функции <math>f(x,y)</math> в точке плоскости, отличной от начала координат (<math>r = \sqrt{x^2 + y^2}</math>):
- <math>(32) \qquad f_x = 3 a {(a x + b y)|a x + b y| \over r} - {x \over r^3} |a x + b y|^3</math>
- <math>(33) \qquad f_y = 3 b {(a x + b y)|a x + b y| \over r} - {y \over r^3} |a x + b y|^3</math>
Можно также вычислить первые производные в начале координат, исходя из определения производной:
- <math>(32a) \qquad f_x(0, 0) = \lim_{x \rightarrow 0} {f(x, 0) - f(0,0) \over x} = \lim_{x \rightarrow 0} {|ax|^3 \over {x |x|}} = 0</math>
Аналогично
- <math>(33a) \qquad f_y(0, 0) = 0</math>
Перейдём теперь к вычислению смешанных производных в начале координат:
- <math>(34) \qquad f_{xy}(0, 0) = \lim_{x \rightarrow 0} {f_y(x, 0) - f_y(0,0) \over x} = \lim_{x \rightarrow 0} {1 \over x} \left ({3 b a x |a x| \over |x|} \right ) = 3 a b |a|</math>
Аналогичное вычисление даёт:
- <math>(35) \qquad f_{yx}(0, 0) = 3 a b |b|</math>
Легко видеть, что формулы (34) и (35) дают разные результаты, если:
- <math>(36) \qquad |a| > 0, \; |b| > 0, \; |a| \ne |b|</math>
Причина этого неравенства в том, что не выполняется условие теоремы — обе смешанные производные (хотя существуют везде) являются разрывными в начале координат.
Можно также рассмотреть функцию
- <math>f(x, y) = {x y (x^2 - y^2) \over x^2 + y^2}</math>
Упрощенное доказательство для аналитических функций
Аналитическая функция двух переменных (по крайней мере локально) разлагается в сходящийся степенной ряд:
- <math>(37) \qquad f(x, y) = \sum_{n, m = 0}^{\infty} a_{nm} (x - x_0)^n (y - y_0)^m</math>
Как известно, степенной ряд можно дифференцировать почленно в пределах его радиуса сходимости. Таким образом, найдём первые производные:
- <math>(38) \qquad f_x = \sum_{n, m = 0}^{\infty} n a_{nm} (x - x_0)^{n-1} (y - y_0)^m</math>
- <math>(39) \qquad f_y = \sum_{n, m = 0}^{\infty} m a_{nm} (x - x_0)^n (y - y_0)^{m-1}</math>
Повторное дифференцирование (38) и (39) даёт одну и ту же формулу для обеих смешанных производных:
- <math>(40) \qquad f_{xy} = f_yx = \sum_{n, m = 0}^{\infty} n m a_{nm} (x - x_0)^{n-1} (y - y_0)^{m-1}</math>
См. также
Литература