Русская Википедия:Равенство смешанных производных

Материал из Онлайн справочника
Перейти к навигацииПерейти к поиску

Смешанные частные производные одной и той же функции, отличающиеся лишь порядком (очерёдностью) дифференцирования, равны между собой при условии их непрерывности. Такое свойство называется равенством смешанных производных.

Само утверждение о равенстве смешанных производных в различных источниках упоминается как теорема Шварца, теорема Клеро или теорема Янга.

Теорема

Определение смешанной производной

Пусть дана достаточно гладкая (скалярная) функция <math>f</math> многих переменных:

<math>(1) \qquad f = f(x_1, x_2, \dots x_n)</math>

Мы можем взять частную производную этой функции по одному из аргументов <math>x_i</math>, считая остальные аргументы постоянными параметрами. В результате мы получим новую функцию:

<math>(2) \qquad \phi(x_i) = {\partial f \over \partial x_i} \bigg|_{x_1,\dots x_{i-1}, x_{i+1}, \dots x_n = const}</math>

Эта новая функция тоже зависит от остальных аргументов как от параметров. То есть численное значение <math>\phi</math> в общем случае зависит от тех же переменных <math>x_1, x_2, \dots x_n</math>, что и оригинальная функция <math>f</math>:

<math>(3) \qquad \phi = \phi(x_1, x_2, \dots x_n)</math>

Если функция <math>\phi</math> окажется достаточно гладкой, то мы можем и её продифференцировать, взяв частную производную по тому же самому или по другому аргументу <math>x_j</math>:

<math>(4) \qquad {\partial \phi \over \partial x_j} = {\partial^2 f \over \partial x_j \partial x_i}</math>

Если <math>j \ne i</math>, то выражение в правой части равенства (4) называется смешанной производной.

Основа теоремы

Для гладкой функции многих переменных значение смешанной производной не зависит от порядка дифференцирования:

<math>(5) \qquad {\partial^2 f \over \partial x_i \partial x_j} = {\partial^2 f \over \partial x_j \partial x_i}</math>

Теорема является базовой в теории функций многих переменных и широко применяется в математической физике, теории дифференциальных уравнений в частных производных, дифференциальной геометрии.

Необходимая степень гладкости

Уточнять необходимую степень гладкости следует поэтапно.

  • 1. Справедливость для аналитической функции (теорема).
  • 2. Справедливость для более широкого класса функций, имеющих в окрестности точки только такие непрерывные производные:
<math>(6) \qquad {\partial f \over \partial x_i}, \; {\partial f \over \partial x_j}, \; {\partial^2 f \over \partial x_i \partial x_j}, {\partial^2 f \over \partial x_j \partial x_i}</math>
  • 3. Поскольку для фиксированных индексов <math>i,j</math> все производные из перечня (6) берутся при условии, что любой третий аргумент <math>x_k</math> является константой, то функция <math>f</math> (а также все производные (6)) может быть разрывной в отношении третьих аргументов. Например, составим функцию из двух слагаемых:
<math>f(x_1, x_2, \dots x_n) = \Phi(x_i, x_j) + Z(\dots x_{i-1}, x_{i+1}, \dots x_{j-1}, x_{j+1}, \dots)</math>

где первое слагаемое является гладкой функцией двух аргументов, а второе слагаемое разрывной во всех точках.

Дальнейшее уточнение гладкости функции нужно делать в ходе доказательства теоремы, оно будет сформулировано в самом конце.

Доказательство теоремы

Как указано выше, для доказательства теоремы можно не рассматривать зависимость функции от третьих аргументов. Поэтому для простоты записи изменим обозначения <math>x_i, x_j</math> на <math>x, y</math>, то есть будем рассматривать такую функцию двух переменных:

<math>(7) \qquad f = f(x, y)</math>

Также для упрощения формул будем обозначать частные производные индексами внизу функции:

<math>(8) \qquad f_x(x, y) = {\partial f(x, y) \over \partial x}, \; f_y(x, y) = {\partial f(x, y) \over \partial y}</math>
<math>(8a) \qquad f_{xy} = {\partial^2 f \over \partial x \partial y}, \; f_{yx} = {\partial^2 f \over \partial y \partial x}</math>

Пусть в точке <math>(x, y)</math> существует смешанная производная:

<math>(9) \qquad f_{xy}(x, y) = \lim_{\Delta x \rightarrow 0} {f_y(x + \Delta x, y) - f_y(x, y) \over \Delta x}</math>

Предположим, что смешанная производная <math>f_{xy}</math> существует в точке <math>(x, y)</math>, а также существует первая производная <math>f_y(x, y)</math> вдоль (горизонтальной) прямой <math>y = const</math>.

Далее, разность производных равна производной от разности, поэтому превращаем формулу (9) в:

<math>(10) \qquad f_{xy}(x, y) = \lim_{\Delta x \rightarrow 0} {1 \over \Delta x} {\partial \over \partial y} \left [ f(x + \Delta x, y) - f(x, y) \right ]</math>

Это преобразование никаких дополнительных условий не накладывает, поскольку разность дифференцируемых функций всегда является функцией дифференцируемой.

Далее, разность в квадратных скобках формулы (10) можно записать в виде определённого интеграла от производной:

<math>(11) \qquad f_{xy} (x, y) = \lim_{\Delta x \rightarrow 0} {1 \over \Delta x} {\partial \over \partial y} \int_x^{x+\Delta x} f_x(\xi, y) d \xi</math>

Нужно, чтобы существовала частная производная <math>f_x</math> вдоль прямой <math>y = const</math>.

Теперь частную производную по игрек в формуле (11) запишем согласно определению производной как предела:

<math>(12) \qquad f_{xy}(x, y) = \lim_{\Delta x \rightarrow 0} {1 \over \Delta x} \lim_{\Delta y \rightarrow 0} {1 \over \Delta y} \left ( \int_x^{x + \Delta x} f_x(\xi, y + \Delta y) d \xi - \int_x^{x + \Delta x} f_x(\xi, y) d \xi \right )</math>

Как видно, надо, чтобы частная производная <math>f_x</math> существовала не только на прямой <math>y = const</math>, но в некоторой двухмерной окрестности точки <math>(x, y)</math>.

Далее, разность интегралов равна интегралу от разности, причём под знак интеграла можно внести постоянный множитель <math>{1 \over \Delta y}</math>:

<math>(13) \qquad f_{xy} = \lim_{\Delta x \rightarrow 0} {1 \over \Delta x} \lim_{\Delta y \rightarrow 0} \int_x^{x+\Delta x} {f_x(\xi, y + \Delta y) - f_x(\xi, y) \over \Delta y} d \xi</math>

Это преобразование также не накладывает дополнительных условий, поскольку разность интегрируемых функций является функцией интегрируемой.

По теореме Лагранжа, подынтегральное выражение в формуле (13) равно производной в средней точке:

<math>(14) \qquad {f_x(\xi, y + \Delta y) - f_x(\xi, y) \over \Delta y} = f_{yx}(\xi, \eta)</math>

Средняя точка является функцией:

<math>(14a) \qquad \eta = \eta(\xi, \Delta y)</math>,

значения которой лежат в интервале (если, например, <math>\Delta y > 0</math>)

<math>(14b) \qquad \eta \in \, [y, y + \Delta y]</math>

Для справедливости (14) нужно существование смешанной производной <math>f_{yx} = {\partial^2 f \over \partial y \partial x}</math> в некоторой двухмерной окрестности точки <math>(x, y)</math>.

Для окончания доказательства надо принять, что смешанная производная непрерывна в точке <math>(x, y)</math> как функция двух переменных. Значение этой производной в близкой точке <math>(\xi, \eta)</math> равно с точностью до бесконечно малого слагаемого значению производной в точке <math>(x, y)</math>:

<math>(15) \qquad f_{yx}(\xi, \eta) = f_{yx}(x, y) + o(\xi - x, \eta -y)</math>

Смешанная производная <math>f_{yx}</math> существует в двухмерной окрестности точки <math>(x, y)</math> и непрерывна в этой точке как функция двух переменных.

Подставим (14) и (15) в (13):

<math>(16) \qquad f_{xy} = \lim_{\Delta x \rightarrow 0} {1 \over \Delta x} \lim_{\Delta y \rightarrow 0} \int_x^{x+\Delta x} (f_{yx}(x, y) + o(\xi - x, \eta -y)) d \xi</math>

Заметим, что формула (16) эквивалентна формуле (13) (хотя и в других обозначениях), а потому интеграл и обе границы существуют. Поскольку подынтегральная функция в (16) интегрируема, а первое слагаемое <math>f_{yx}(x,y)</math> является константой по переменной интегрирования <math>\xi</math>, то второе слагаемое тоже оказывается интегрируемым, и мы можем разбить интеграл на сумму двух интегралов, первый из которых легко берётся как интеграл от константы:

<math>(17) \qquad \int_x^{x+\Delta x} (f_{yx}(x, y) + o(\xi - x, \eta -y)) d \xi = \int_x^{x+\Delta x} f_{yx}(x,y) d \xi + \int_x^{x+\Delta x} o(\xi - x, \eta -y) d \xi = </math>
<math>= f_{yx} \Delta x + \int_x^{x+\Delta x} o(\xi - x, \eta -y) d \xi</math>

После подстановки (17) в (16) мы можем вынести постоянное слагаемое сначала за пределы первой границы, а затем за пределы другой границы:

<math>(18) \qquad f_{xy} = \lim_{\Delta x \rightarrow 0} {1 \over \Delta x} \left ( f_{yx}(x,y) \Delta x + \lim_{\Delta y \rightarrow 0} \int_x^{x+\Delta x} o(\xi - x, \eta(\xi,\Delta y) -y) d \xi \right ) =</math>
<math>= f_{yx}(x, y) + \lim_{\Delta x \rightarrow 0} {1 \over \Delta x} \lim_{\Delta y \rightarrow 0} \int_x^{x+\Delta x}o(\xi - x, \eta(\xi,\Delta y) -y) d \xi </math>

Покажем, что второе слагаемое в последнем выражении формулы (18) равно нулю. Возьмём произвольное положительное число <math>\epsilon</math>. Непрерывность смешанной производной <math>f_{yx}</math> в точке <math>(x, y)</math> означает, что существует такое положительное число <math>\delta</math>, что для каждой точки <math>(\xi, \eta)</math> внутри квадрата <math>|\xi - x| < \delta, \; |\eta - y| < \delta</math> справедливо неравенство:

<math>(19) \qquad |o(\xi-x, \eta - y)| = |f_{yx}(\xi, \eta) - f_{yx}(x,y)| < \epsilon </math>

Если мы возьмём положительные числа <math>\Delta x < \delta, \; \Delta y < \delta</math>, то интеграл в последнем слагаемом формулы (18) оценивается сверху:

<math>(20) \qquad \int_x^{x+\Delta x}o(\xi - x, \eta(\xi,\Delta y) -y) d \xi < \int_x^{x+\Delta x} \epsilon d \xi = \epsilon \Delta x</math>

Обозначим это слагаемое <math>L</math>

<math>(21) \qquad L = \lim_{\Delta x \rightarrow 0} {1 \over \Delta x} \lim_{\Delta y \rightarrow 0} \int_x^{x+\Delta x}o(\xi - x, \eta(\xi,\Delta y) -y) d \xi \le \lim_{\Delta x \rightarrow 0} {1 \over \Delta x} \lim_{\Delta y \rightarrow 0} \epsilon \Delta x = \epsilon</math>

Аналогично (если взять <math>-\epsilon < \Delta x < 0</math>), имеем оценку снизу:

<math>(22) \qquad L \ge -\epsilon</math>

Поскольку положительное число <math>\epsilon</math> может быть сколь угодно малым, то с необходимостью следует <math>L = 0</math>. Теорема доказана.

Уточнение гладкости функции

Как видно в ходе доказательства, от функции требуется существование одной смешанной производной (например, <math>f_{xy}</math>) в точке, а также существование второй смешанной производной <math>f_{yx}</math> в двумерной окрестности точки и её непрерывность в этой точке. Из этого условия также следует существование производной <math>f_y</math> вдоль отрезка прямой <math>y = const</math> и существование производной <math>f_x</math> в двумерной окрестности точки.

Кроме того, существование <math>f_{xy}</math> в точке <math>(x, y)</math> следует из двух фактов: (а) существует производная <math>f_y</math> вдоль отрезка прямой <math>y = const</math>, проходящей через точку <math>(x, y)</math>, (б) смешанная производная <math>f_{yx}</math> существует и непрерывна в этой точке.

Пример

Рассмотрим функцию

<math>(23) \qquad f(x, y) = xy + y^2 \chi(y)</math>

где функция Дирихле <math>\chi(y)</math> равна нулю в рациональных точках <math>y={m \over n}</math> и единице в иррациональных. Функция (23) определена на всей плоскости; непрерывна (как функция двух переменных) вдоль прямой <math>y = 0</math> и разрывна во всех других точках плоскости.

Везде существует непрерывная частная производная:

<math>(24) \qquad f_x(x, y) = {\partial f \over \partial x} = y</math>

а также одна из смешанных производных:

<math>(25) \qquad f_{yx}(x, y) = {\partial^2 f \over \partial y \partial x} = 1</math>

Частная производная по игрек существует лишь в точках прямой <math>y=0</math>:

<math>(26) \qquad f_y(x, 0) = x</math>

Также в этих же точках прямой существует вторая смешанная производная:

<math>(27) \qquad f_{xy}(x, 0) = \lim_{\Delta x \rightarrow 0} {f_y(x+\Delta x, 0) - f_y(x, 0) \over \Delta x} = 1</math>

Как видим, для точек прямой <math>y = 0</math> условия теоремы выполняются, и обе смешанные производные равны.

Контрпример

Рассмотрим функцию двух переменных <math>x, y</math>

<math>(28) \qquad f(x, y) = {|a x + b y|^3 \over \sqrt{x^2 + y^2}}</math>

где буквами <math>a, b</math> обозначены некоторые ненулевые параметры. Формула (28) задаёт непрерывную функцию всюду на плоскости за исключением начала координат <math>x=0, \; y=0</math>. Мы можем доопределить функцию <math>f(x,y)</math> в начале координат

<math>(29) \qquad f(0,0) = 0</math>

Согласно этим определениям функция будет непрерывной также и в начале координат, что можно видеть, представив формулу (28) в полярной системе координат (и направляя <math>r \rightarrow 0</math>):

<math>(30) \qquad f(r, \phi) = (a^2+b^2)^{3 \over 2} \, r^2 |\sin(\phi + \phi_0)|^3</math>

Покажем, что для этой доопределённой функции <math>f(x,y)</math> смешанные производные в начале координат существуют, но не равны между собой.

Сначала вычислим первые производные <math>f_x, \, f_y</math>. Как промежуточный результат, заметим, что функция «куб модуля» дважды дифференцируема, и её первая и вторая производные вычисляются по формулам:

<math>(31) \qquad {d \over d x} |x|^3 = 3 x |x|</math>
<math>(31a) \qquad {d^2 \over d x^2} |x|^3 = {d \over d x} (3 x |x|) = 6 |x|</math>

Теперь, учитывая (28) и (31), запишем первые производные функции <math>f(x,y)</math> в точке плоскости, отличной от начала координат (<math>r = \sqrt{x^2 + y^2}</math>):

<math>(32) \qquad f_x = 3 a {(a x + b y)|a x + b y| \over r} - {x \over r^3} |a x + b y|^3</math>
<math>(33) \qquad f_y = 3 b {(a x + b y)|a x + b y| \over r} - {y \over r^3} |a x + b y|^3</math>

Можно также вычислить первые производные в начале координат, исходя из определения производной:

<math>(32a) \qquad f_x(0, 0) = \lim_{x \rightarrow 0} {f(x, 0) - f(0,0) \over x} = \lim_{x \rightarrow 0} {|ax|^3 \over {x |x|}} = 0</math>

Аналогично

<math>(33a) \qquad f_y(0, 0) = 0</math>

Перейдём теперь к вычислению смешанных производных в начале координат:

<math>(34) \qquad f_{xy}(0, 0) = \lim_{x \rightarrow 0} {f_y(x, 0) - f_y(0,0) \over x} = \lim_{x \rightarrow 0} {1 \over x} \left ({3 b a x |a x| \over |x|} \right ) = 3 a b |a|</math>

Аналогичное вычисление даёт:

<math>(35) \qquad f_{yx}(0, 0) = 3 a b |b|</math>

Легко видеть, что формулы (34) и (35) дают разные результаты, если:

<math>(36) \qquad |a| > 0, \; |b| > 0, \; |a| \ne |b|</math>

Причина этого неравенства в том, что не выполняется условие теоремы — обе смешанные производные (хотя существуют везде) являются разрывными в начале координат.

Можно также рассмотреть функцию

<math>f(x, y) = {x y (x^2 - y^2) \over x^2 + y^2}</math>

Упрощенное доказательство для аналитических функций

Аналитическая функция двух переменных (по крайней мере локально) разлагается в сходящийся степенной ряд:

<math>(37) \qquad f(x, y) = \sum_{n, m = 0}^{\infty} a_{nm} (x - x_0)^n (y - y_0)^m</math>

Как известно, степенной ряд можно дифференцировать почленно в пределах его радиуса сходимости. Таким образом, найдём первые производные:

<math>(38) \qquad f_x = \sum_{n, m = 0}^{\infty} n a_{nm} (x - x_0)^{n-1} (y - y_0)^m</math>
<math>(39) \qquad f_y = \sum_{n, m = 0}^{\infty} m a_{nm} (x - x_0)^n (y - y_0)^{m-1}</math>

Повторное дифференцирование (38) и (39) даёт одну и ту же формулу для обеих смешанных производных:

<math>(40) \qquad f_{xy} = f_yx = \sum_{n, m = 0}^{\infty} n m a_{nm} (x - x_0)^{n-1} (y - y_0)^{m-1}</math>

См. также

Литература

Шаблон:Rq