Русская Википедия:Решение уравнения

Материал из Онлайн справочника
Версия от 08:10, 11 сентября 2023; EducationBot (обсуждение | вклад) (Новая страница: «{{Русская Википедия/Панель перехода}} В математике '''решение уравнения''' — это задача по нахождению '''всех''' значений аргументов (чисел, функций, наборов...»)
(разн.) ← Предыдущая версия | Текущая версия (разн.) | Следующая версия → (разн.)
Перейти к навигацииПерейти к поиску

В математике решение уравнения — это задача по нахождению всех значений аргументов (чисел, функций, наборов и т. д.), при которых выполняется равенство (выражения слева и справа от знака равенства становятся эквивалентными). Значения неизвестных переменных, при которых это равенство достигается, называются решениями или корнями данного уравнения. Решить уравнение означает найти множество всех его решений (корней) или доказать, что корней нет вовсе (либо нет тех, что удовлетворяют заданным условиям).

Например, уравнение <math>x + y = 2x - 1</math> решается для неизвестного <math>x</math> с помощью замены <math>x = y + 1,</math> так как замена переменной <math>x</math> на выражение <math>y + 1</math> превращает уравнение в тождество: <math>(y + 1) + y = 2 (y + 1) - 1.</math> Кроме того, если положить неизвестной переменную <math>y,</math> тогда уравнение решается с помощью замены <math>y = x - 1</math>. Замена переменной <math>y</math> на выражение <math>x - 1</math> превращает уравнение в тождество: <math>x + (x - 1) = 2x - 1.</math> Также <math>x</math> и <math>y</math> могут одновременно рассматриваться как неизвестные переменные. Существует много решений уравнения для подобного случая, например, <math>(x, y) = (1, 0)</math> — то есть <math>x = 1</math> и <math>y = 0,</math> а в общем, <math>(x, y) = (a + 1,\text{ }a)</math> для всех возможных значений.

В зависимости от задачи, может требоваться найти одно решение (любое подходящее решение) или все решения уравнения. Все решения уравнения называются множеством решений. Помимо простого нахождения решения, может ставиться задача по нахождению наилучшего решения уравнения по какому-либо параметру. Задачи такого рода называются задачами оптимизации. Решения задач оптимизации, как правило, не называются «решениями уравнения».

Аналитические методы решения уравнения

Под методом решения задачи (в т.ч. уравнения) понимается, прежде всего, пошаговый алгоритм.

Аналитический метод решения (иначе, просто аналитическое решение) — это выражение замкнутой формы, которое может быть вычислено за конечное число операций[1]. Однако, существуют формулы (выражения), содержащие в себе невычислимые (или непредставимые) на данном этапе развития теории и технологий функции. Далее под аналитическим решением мы будем иметь в виду любое решение, записанное в формульном виде, содержащее в себе известные или определённые функции от параметров (в случае числовых уравнений) или переменных (в случае функциональных уравнений). Ниже приведены основные аналитические методы решений различного вида уравнений.

Метод подбора значения

Самый простой нелогичный (т.к. не требует никакого подчинения законам математической логики) метод решения уравнения, заключающийся в угадывании правильного значения корня. С этого метода начинается обучение решению более сложных уравнений, чем линейные (напр., квадратные и кубические), в 5—7-х классах средней образовательной школы в России.

Пример решения уравнения методом подбора: <math>x^2-2x+1=0</math>

Легко догадаться, что одним из корней уравнения будет <math>1.</math> Чтобы проверить правильность подобранного значения, необходимо подставить его в исходное уравнение вместо переменной <math>x:\text{ }1^2-2\cdot 1+1=0\Longleftrightarrow 0=0.</math>.

Как видно, требуемое тождественное равенство выполняется, а это значит, что найденное нами значение является правильным (то есть входит в множество решений уравнения).

Недостатки метода подбора:

  • Чаще всего, корнями уравнения являются иррациональные (алгебраически иррациональные или даже трансцендентные) числа, угадать которые практически невозможно;
  • Методом подбора нельзя указать на отсутствие решения при каких-либо ограничениях на значение решений;
  • В случае бесконечного множества решений (напр., в уравнениях с двумя и более переменными) данный метод совершенно не подходит, однако, бывает полезен, когда с помощью одного подобранного правильного значения каким-либо другим известным методом можно получить остальные допустимые решения[2];
  • Далеко не все уравнения представлены в виде простых функций от переменной, так что решить такие уравнения метод подбора также неспособен;
  • Применимость данного метода ограничивается не только сложностью уравнений, их видом и областью допустимых решений, но также наличием хороших вычислительных способностей, знанием наиболее часто встречающихся значений и их соответствия конкретному виду уравнений[3].

Преимущества метода подбора:

  • Простота использования (применение метода подбора не требует выполнения практически никаких логических действий, за исключением проверки);
  • Скорость получения решения (обычно, там, где на необходимость применения метода подбора указано в контексте, решения подбираются довольно-таки быстро);
  • Доступность в применении (ведь иногда бывает так, что аналитическое решение какого-либо вида уравнения отсутствует совсем, но значение всё ещё легко подобрать в каком-то конкретном случае, например, уравнение <math>2^x-x^2-1=0</math> пока чтоШаблон:Уточнить невозможноШаблон:Кому решить аналитическим путём[4], но, тем не менее, получить хотя бы один корень методом подбора довольно-таки просто: <math>x=1\longrightarrow 2^1-1^2-1=0\Longleftrightarrow 0=0).</math>

Полный перебор

Шаблон:Основная статья Частным случаем метода подбора является метод полного перебора — то есть поиска решения исчерпыванием всевозможных вариантов. Используется в случае, если множество всех решений (либо всех решений, удовлетворяющих определённым условиям) конечно.

Метод обратной операции [инверсии]

Данный метод решения уравнений, называемый иначе методом построения обратной функции, основывается на свойстве обратной функции нивелировать влияние функции на значение переменной[5]:

<math>f^{-1}(f(x))=x</math> или, что по сути то же самое, <math>f(f^{-1}(x))=x.</math>

Метод обычно используется в составе других методов решений и самостоятельно применяется лишь тогда, когда переменные и константы находятся по разные стороны от знака равенства: <math>f(x)=g(a_0,a_1,...a_i), a_i=const.</math>

Самый простой пример — линейное уравнение: <math>5x=10.</math> Здесь <math>f(x)=5x,\text{ }g(a_i)=10,</math>значит <math>f^{-1}(x)=\frac{x}{5},</math> и получаем: <math>f^{-1}(f(x))=\frac{5x}{5}=x,</math> теперь то же самое нужно проделать с другой частью уравнения: <math>f^{-1}(g(a_i))=\frac{10}{5}=2,</math> отсюда <math>x=2.</math> Проверка: <math>5\cdot2=10\Longleftrightarrow 10=10.</math>

Ещё пример: <math>x^2=4\Longleftrightarrow x=\pm\sqrt{4}\Longleftrightarrow x_{1,2}=2;-2.</math>

Рассмотрим следующую задачу со схемой решения: если дано уравнение вида <math>f\left(x\right)=C</math>, где <math>C</math> — константа, то искомое неизвестное <math>x</math> равно <math>f^{-1}\left(C\right)</math>.

Иногда, для того чтобы решить уравнение <math>f\left(x\right)=g\left(x\right)</math>, можно поступить через реверсию. Другими словами, решить уравнение <math>f^{-1}\left(x\right)=g^{-1}\left(x\right)</math>, которое может оказаться проще, чем исходное. Далее все решения <math>x=\alpha</math> приравнять либо к левой части <math>f\left(x\right)</math> исходного равенства, либо же приравнять к правой, то есть <math>g\left(x\right)</math>. И таким образом можно найти неизвестное.

Недостатки метода обратной операции:

  • Иногда обратная функция от переменной в составе других методов решений приводит к нескольким результатам, из-за чего в решении появляются посторонние корни, которые были получены логическим путём, но не подходят в уравнение (нарушают тождественное равенство)[6][7], что выясняется только при проверке;
  • Обратные операции, чаще всего, кажутся гораздо более сложными, чем обычные (например, дети начальных классов воспринимают деление как более сложное действие, чем "привычное" им умножение; старшеклассники часто долго приспосабливаются к интегрированию, потому что дифференцирование для них, также весьма привычное, воспринимается более лёгким);
  • Редки случаи, но так же имеют место быть, когда та или иная операция обратна сама себе [инволюция] (допустим, как линейная функция <math>f(x)=x,</math> или интеграл и производная от показательной функции <math>f(x)=e^x</math>[8]);
  • Не все обратные функции представимы в виде композиций других известных функций (чаще всего, это интегралы — интегралы Френеля, функция Лапласа, интегральные синус и косинус, интегральная экспонента, или, например, неэлементарные, такие, как W-функция Ламберта, тетрация и суперкорень);
  • Не всякая обратная операция даёт допустимое или вообще хоть какое-нибудь решение (например, функция <math>f(x)=x^2</math> даёт действительное число при любом значении переменной, однако, это значение всегда неотрицательно[9], из-за чего нахождение обратной функции ограничивается неотрицательностью аргумента; также, например, существуют неинтегрируемые[10] или недифференцируемые[11] функции, наподобие функции Дирихле, функции Вейерштрасса и др.);
  • Для некоторых обратных операций до сих пор не существует алгоритма вычисления, так что значения этих функций, как решения каких-либо уравнений, так и остаются в виде формул (например, суперлогарифм, ζ-функция Римана и т. д.).

Преимущества метода обратных операций:

  • В отличие от метода подбора, применение обратных функций, чаще всего, позволяет не упустить дополнительные существующие допустимые решения, даже если их множество бесконечно;
  • Обратные операции являются одной из основных составляющих почти любых логичных методов решения уравнений, используются гораздо чаще и на своём примере помогают лучше разобраться в понятиях области допустимых значений, области определения и области изменения значения аргумента(-ов);
  • В большинстве случаев значения обратных функций можно вычислить с помощью различного рода калькуляторов или же, наоборот, оставить их в формульном выражении для удобства в дальнейшем применении.

Графический метод

Данный метод решения задач (в том числе, уравнений) основывается на базовом свойстве графиков функций — определённым и (в идеале) точным отображением значений аргументов и значений функций от этих аргументов в пространстве координат, вследствие чего каждая точка графика имеет не более одного набора этих значений для каждой конкретной функции (то есть два значения от одного и того же аргумента не могут быть присвоены одной и той же точке координат).

По определению, две функции имеют одну общую точку (точку пересечения графиков) тогда, когда их значения от одного(их) и того(тех) же значения(-й) аргумента(-ов) равны: <math>f(x_1,x_2,...,x_i)=g(x_1,x_2,...,x_i).</math>

Например, решим графически уравнение <math>\frac{1}{2}x^2-4x+10=x-2</math> (см. рисунок ниже):

Файл:Пример точек пересечения.jpg
Пример точек пересечения (A и B).

Здесь чёрным цветом показан график функции <math>f(x)=\frac{1}{2}x^2-4x+10,</math> синим цветом — график функции <math>g(x)=x-2.</math> Абсциссы точек A и B образуют множество решений исходного уравнения: <math>x_1=4, x_2=6,</math> что легко находится проекцией точек на ось абсцисс (ось <math>x</math>). Проверка: <math>\frac{1}{2}\cdot 4^2-4\cdot4+10=4-2\Longleftrightarrow 2=2</math> и <math>\frac{1}{2}\cdot6^2-4\cdot6+10=6-2\Longleftrightarrow4=4.</math> Решение является исчерпывающим, поскольку прямая не может пересечь параболу более двух раз (согласно основной теореме алгебры).

Недостатки графического метода:

  • Графически, за исключением простых случаев, можно получить только приблизительное решение;
  • Не всякие значения и не всяких функций вычислимы, поэтому их графики самостоятельно построить нельзя;
  • Не зная свойств входящих в уравнение функций, невозможно точно утверждать, является ли полученное множество решений исчерпывающим;
  • Чаще всего, применимость данного метода ограничивается построением графиков функций в окрестностях центра координат;
  • Воспроизведение графиков функций, что называется, "в уме" бывает достаточно затруднительным, в таких случаях без каких-либо дополнительных приспособлений никак не обойтись.

Преимущества графического метода:

  • Простота использования (уровня знаний средней школы вполне достаточно);
  • Доступность в применении (например, когда решение уравнения ещё не изучалось или отсутствует вовсе);
  • Наглядность представления (помогает лучше понять, что представляет собой какое-либо решение и как его можно изобразить)[12].

Кроме описанного метода существуют специальные модифицированные графические методы, такие, например, как метод Лиля.

Метод оценки ОДЗ

Шаблон:Основной источник Метод оценки ОДЗ (области допустимых значений) заключается в отсечении некоторой части значений из области значений функции, в которых данная функция не существует (иначе, отсечение значений, которые она не может принимать).

Например, решим методом оценки ОДЗ следующую систему уравнений:

<math>\begin{cases} \frac{1}{x+1}+x+1=2\\\sin^2(x)=x \end{cases}</math>

Начнём с верхнего уравнения, основываясь на следующем свойстве суммы взаимно-обратных чисел: <math>\frac{1}{n}+n\geqslant2, n>0.</math> Оно непосредственно выводится из частного случая нестрогого неравенства о степенных средних[13]. Причём равенство двум достигается только в том случае, если эти числа равны: <math>\frac{1}{x+1}=x+1\Longleftrightarrow(x+1)^2=1\Longleftrightarrow x+1=\pm1.</math> В результате получаем множество решений: <math>x_1=0,\text{ }x_2=-2.</math>

В нижнем уравнении присутствует неотрицательная функция возведения в квадрат и функция <math>f(x)=\sin(x),</math> значения которой лежат в диапазоне <math>\{-1;\text{ }1\}.</math>

Как видно, второе решение не подходит по обоим критериям, что избавляет нас от необходимости второй проверки. Осталось проверить первый корень: <math>\sin(0)=0\Longleftrightarrow \sin^2(0)=0\Longleftrightarrow0=0.</math> Значит, единственное решение исходной системы уравнений — это <math>x_1=0.</math>

Недостатки метода оценки ОДЗ:

  • Существуют функции, исследование которых крайне затруднительно, отчего их свойства долго остаются неизвестными <math>\biggl(</math>например, предложенная Риманом функция <math>f(x)=\sum_{n=1}^{\infty}\frac{\sin(n^2x)}{n^2}</math>[14]<math>\biggr);</math>
  • Часто метод оценки приводит к интервалу, в котором лежат возможные решения, и тогда их приходится находить методом подбора с учётом полученного ограничения;
  • Оценка значений функций базируется на знании их свойств, которые, как часто бывает, ввиду разнообразия самих функций, не собраны воедино в одном источнике.

Преимущества метода оценки ОДЗ:

  • Данный метод бывает полезен, когда необходимо доказать отсутствие допустимого решения, но сделать это другими методами не представляется возможным;
  • Методом оценки ОДЗ, в отличие от графического метода и метода подбора, возможно получить и бесконечное множество допустимых решений;
  • Как было показано в примере, грамотное применение метода оценки позволяет избежать дополнительных проверок;
  • Некоторые уравнения гораздо проще решить именно таким методом (например, частные случаи иррациональных уравнений).

Метод разложения на множители

Шаблон:Основная статья Метод разложения на множители уравнений (то есть их факторизация) применяется для представления их в виде произведения нескольких менее сложных, чаще, однотипных уравнений[15]. Разложение основывается на свойстве произведения нескольких множителей равняться нулю тогда и только тогда, когда хотя бы один из этих множителей также равен нулю[16].

Этот метод решения именно полиномиальных уравнений являлся отдельным направлением алгебры на протяжении многих столетий[17] и представляет собой совокупность сразу нескольких алгоритмов получения решения. Его актуальность и значимость есть следствие основной теоремы алгебры, согласно которой любой многочлен любой ненулевой конечной степени имеет хотя бы один комплексный корень.

Самым простым из всех способов разложения является, пожалуй, деление многочлена на многочлен.

Недостатки метода факторизации многочленов:

  • Относительно узкая специализация метода (например, уравнение <math>2^x-3x+2=0</math> нельзя факторизовать, так как произведением формул корней прийти к исходному уравнению не получится[18]);
  • Метод разложения содержит в себе сразу несколько способов факторизации и применим не ко всем полиномам, другими словами, он не универсален (некоторые иррациональные уравнения до сих пор не удаётся ни решить аналитически, ни разложить тоже, — простой пример: <math>x^{\pi}-x+1=0</math>).

Преимущества метода факторизации многочленов:

  • Некоторые частные случаи уравнений, для которых общий алгоритм решения не найден или слишком сложен, возможно решить только разложением (например, уравнения шестой и выше степеней, алгоритмы будущего решения которых слишком громоздки, сложно и долго вычисляемы, вследствие чего их разработка становится нецелесообразной[19]);
  • Все способы разложения выведены достаточно давно, доступны в открытых источниках, не выходят за рамки школьной программы и, кроме обыкновенного калькулятора, дополнительных знаний и приспособлений (в том числе специальных программных продуктов), как правило, не требуют.

Методы преобразований

К числу этих методов относятся наборы действий, выполняемых над обеими частями уравнения (перед знаком равенства и после), приводящие к уравнениям-следствиям или равносильным уравнениям, решить которые гораздо легче вследствие наличия известного алгоритма решения или представления их в более удобной форме, позволяющей быстро соотнести их с тем или иным известным алгоритмом решения. Ниже приведён список основных преобразований.

Перенос слагаемых

Любую часть уравнения можно "перенести в другую сторону, за знак равенства", прибавив её к другой части уравнения и только поменяв знак(!) на противоположный[20].

Например, решим в вещественных числах уравнение: <math>x^2-2x+4=2x.</math>

Для этого перенесём правую часть уравнения в левую, поменяв знак правой части на противоположный: <math>x^2-2x+4-2x=0.</math>

Далее, вследствие ассоциативности функции умножения на константу, сложим подобные слагаемые: <math>x^2-4x+4=0.</math>

Теперь легко увидеть, что получившаяся левая часть напоминает формулу полного квадрата: <math>(x-2)^2=x^2-4x+4.</math>

Отсюда находим корни: <math>\pm(x-2)=0\longrightarrow x_1=x_2=2.</math> Проверка: <math>2^2-2\cdot2+4=2\cdot2\Longleftrightarrow4=4.</math>

Перенос слагаемых можно выполнять в любых случаях (не вынося аргумент из-под функции), при этом получившиеся уравнения являются равносильными.

Прибавление (вычитание) константы (выражения)

Этот приём преобразования уравнений основан на свойстве числового равенства — его инвариантности относительно сложения (числовое равенство останется таковым, даже если к обеим его частям прибавить какое-либо число, в том числе и отрицательное). В свою очередь, данное свойство числового равенства является всего лишь частным случаем аналогичного свойства числовых нестрогих неравенств[21]. Так как большинство решаемых уравнений выполняются над полем каких-либо чисел (бывают нечисловые уравнения, например, — функциональные, где в качестве неизвестной переменной выступают функции), то такие же числовые свойства распространяются и на уравнения.

Суть преобразования состоит в том, что к обеим частям уравнения можно прибавить одно и то же число или выражение с числовой функцией, ОДЗ которой не уже, чем ОДЗ функций в исходном уравнении. Перенос слагаемых является просто частным случаем прибавления (вычитания) выражений. В частности, "взаимоуничтожение" одинаковых слагаемых по разные стороны знака равенства есть следствие возможности переноса.

Прибавление числового выражения возможно всегда, однако, приводит к равносильному уравнению только тогда, когда область ОДЗ функции в выражении не уже, чем ОДЗ функций исходного уравнения. Например, прибавив к обеим частям выражение <math>\sqrt{x}</math> мы придём к уравнению-следствию, в котором неотрицательность переменной <math>x</math> может отсеять существующие отрицательные корни, из-за чего позднее нам придётся учитывать это ограничение.

Также бывает полезен несколько обратный приём — выделение слагаемого, например: <math>\frac{x^2+5x+6}{x+2}=0\Longleftrightarrow \frac{(x^2+4x+4)+(x+2)}{x+2}=0\Longleftrightarrow \frac{(x+2)^2}{x+2}+\frac{x+2}{x+2}=0\Longleftrightarrow (x+2)+1=0\longrightarrow x_1=-3.</math>

Умножение (деление) на ненулевую(ое) константу (выражение)

Умножение числовых равенств (то есть, числовых уравнений) на одно и то же ненулевое числовое выражение есть следствие возможности прибавления этого выражения, а, значит, распространяет на себя его свойства, добавляя, разве что, ограничение на не равенство переменной нулю[20].

Используя предыдущий пример: <math>x^2+5x+6=0\Longleftrightarrow(x^2+4x+4)+(x+2)=0\Longleftrightarrow (x+2)^2+(x+2)=0.</math>

Теперь поделим оба слагаемых на <math>(x+2): \frac{(x+2)^2}{x+2}+\frac{x+2}{x+2}=0\Longleftrightarrow x+2+1=0\longrightarrow x_1=-3.</math>

Однако, поделив на это выражение, мы установили ограничение — его неравенство нулю: <math>x+2\neq0\longrightarrow x\neq-2.</math> Поэтому теперь необходимо проверить, не является ли данное значение корнем исходного уравнения, отсеянным этим самым ограничением: <math>(-2)^2+5\cdot(-2)+6=4-10+6=0.</math>

Как видно, сужение ОДЗ даже на одну точку (число) способно сильно исказить множество всех возможных допустимых решений.

Замена выражений

Самый распространенный из методов — метод замены переменной. Искусство производить замену переменных заключается в том, чтобы увидеть, какая замена будет более рациональна и быстрее приведет к успеху.

Суть метода замены переменной заключается в том, что путём замены некоторого входящего в уравнение выражения, содержащего переменную, в исходном уравнении либо понижается степень, либо от дробного переходят к целому уравнению, либо иррациональное уравнение сводят к рациональному, то есть исходное уравнение сводится к простейшему. Данный метод применяется в уравнениях, где замена переменной очевидна или становится очевидной после некоторых элементарных тождественных преобразований.

Тождественная замена переменной другим выражением, содержащим функции от переменной, ОДЗ которых не уже, чем ОДЗ функций исходного уравнения, также всегда приводит к равносильному уравнению. Сама его возможность и равносильность основываются на свойстве транзитивности чисел (если в тройке чисел какие-то два числа попарно равны третьему, следовательно, все три числа равны между собой[22]).

Замена очень часто используется в решении уравнений любого рода и даже больше (например, для уравнения третьей степени существует тригонометрическая формула Виета, для нахождения первообразных — универсальная тригонометрическая подстановка Вейерштрасса, для интегралов от рациональных функций — специальные подстановки Эйлера и т.д.).

По сути, любая формула корней уравнения есть частный случай замены, когда в выражении, заменяющем переменную, не содержится переменных совсем (то есть функция в этом выражении содержит в качестве аргумента(ов) константу(ы)).

Замена выражения также помогает прийти к более лёгкому уравнению. Однако, многие часто путают корни уравнения-следствия с корнями исходного уравнения, ошибочно подставляя их не в то уравнение при проверке. Так, например, сделав замену <math>x=a^y</math> и получив конкретное значение <math>y_0</math> в качестве корня уравнения-следствия с переменной <math>y</math>, для проверки необходимо сначала подставить <math>y_0</math> в формулу замены <math>x=a^y,</math> чтобы рассчитать <math>x_0</math>, которое и будет корнем исходного уравнения от переменной <math>x</math> и которое необходимо подставить в него для проверки.

Однако, существуют типы уравнений, для которых определённые виды замены делать нельзя.

Например, уравнение вида: <math>a^{(n)}x=x,\text{ }a\neq0,</math> где <math>a^{(n)}x</math>— это гипероператор порядка <math>n</math> (для каждого из них есть дополнительные ограничения на <math>a</math>)

Если сделать замену <math>x=a^{(n+1)}y,</math> то получим уравнение-следствие: <math>a^{(n)}\bigl(a^{(n+1)}y\bigr)=a^{(n+1)}y\Longleftrightarrow a^{(n+1)}(y+1)=a^{(n+1)}y.</math>

Отсюда следует, что, либо <math>y+1=y</math> и решения нет (что противоречит "теоретической практике"), либо гипероператоры неоднозначны (что неверно для первых трёх операторов — сложения, умножения и возведения в степень).

Для наглядности, положим, что <math>n=3</math>: <math>a^{(3)}x=x\Longleftrightarrow a^x=x.</math> Сделаем замену <math>x=a^{(4)}y={}^ya:</math> <math>a^{{}^ya}={}^ya\Longleftrightarrow {}^{y+1}a={}^ya,</math> откуда приходим к противоречию <math>y+1=y,</math> хотя решение данного исходного уравнения существует и выражается через суперкорень второй степени[23].

Возведение в степень

Благодаря возможности умножения числового выражения на числовое выражение становится возможным возведение числового выражения в ненулевую степень[20], которое является частным случаем умножения при идентичности множителей. Однако, возведение в степень строго определено лишь для неотрицательных чисел, поэтому, возводя в степень выражение с переменной, необходимо указать соответствующее ограничение и учитывать его в дальнейшем.

Если всё-таки без возведения в степень отрицательного выражения не обойтись, то показатель степени должен быть целым числом, иначе такое преобразование приведёт к решению уже двух уравнений вместо одного и увеличению количества посторонних корней, поскольку: <math>(-n)^{\frac{1}{k}}=-\sqrt[k]{n}, \frac{k+1}{2}\in\mathbb{Z},</math> но в то же время <math>\frac{1}{k}=\frac{2}{2k}\longrightarrow (-n)^{\frac{2}{2k}}=\sqrt[2k]{(-n)^2}=\sqrt[2k]{1\cdot n^2}=\sqrt[k]{n},k\in\mathbb{Z}.</math> С иррациональными показателями ситуация пока что не определена.

Возведение в нулевую степень нуля (или выражения, которое может принимать нулевое значение) также невозможно (см. Неопределённость).

Чётные показатели степени удваивают количество решаемых уравнений, поскольку показательные функции чётных степеней чётные. Количество посторонних корней также увеличивается[20].

Логарифмирование

Согласно свойствам числовых нестрогих неравенств[21], обе части уравнения можно логарифмировать. Однако, здесь тоже есть свои ограничения (для поля вещественных чисел):

  • Если логарифмирование осуществляется по положительному основанию-числу, то логарифмируемое выражение (число) также должно быть положительным;
  • Если логарифмирование осуществляется по отрицательному основанию-числу, то логарифмируемое выражение (число) также должно быть отрицательным (при этом доопределение логарифма нужно пояснить);
  • Логарифмирование выражений со значениями, противоположными по знаку значениям основания, невозможно.

Именно поэтому логарифмирование, как правило, приводит не к увеличению посторонних, а к потере истинных корней.

Потенцирование

В противоположность возведению в степень числовые равенства можно преобразовывать в показатели степени[20]: <math>f(x_1, x_2...)=g(a_1, a_2,...)\Longleftrightarrow b^{f(x_1, x_2...)}=b^{g(a_1, a_2,...)}, b,a_1,a_2...=const.</math>

Тогда, как числовые выражения могут быть любыми, основание <math>b</math> должно быть положительно (или отрицательно — с наложением на переменную соответствующих ограничений).

Более того, потенцировать можно даже показатели степени у выражений, однако, при этом между основанием и степенью есть своеобразная ограничивающая взаимозависимость, из-за чего основание не может быть любым: <math>f^n(x_1,x_2,...)=g^m(a_1,a_2,...)\Longleftrightarrow f^{(k^n)}(x_1,x_2,...)=g^{(k^m)}(a_1,a_2,...),\text{if } k=\biggl(\frac{m}{n}\biggr)^\frac{1}{m-n}.</math>

Это легко доказывается следующим образом:

<math>f^n(x_1,x_2,...)=g^m(a_1,a_2,...)</math>

<math>f^{(k^n)}(x_1,x_2,...)=g^{(k^m)}(a_1,a_2,...)</math>

<math>f(x_1,x_2,...)=g^{\frac{(k^m)}{(k^n)}}(a_1,a_2,...)\Longleftrightarrow f(x_1,x_2,...)=g^{(k^{m-n})}(a_1,a_2,...)</math>

Подставляем вместо <math>f(x_1,x_2,...)</math> получившееся выражение в исходное уравнение:

<math>g^{n(k^{m-n})}(a_1,a_2,...)=g^m(a_1,a_2,...),</math> отсюда получаем: <math>n(k^{m-n})=m.</math> Далее:

<math>k^{m-n}=\frac{m}{n}\Longleftrightarrow k=\biggl(\frac{m}{n}\biggr)^\frac{1}{m-n}.</math> В случае <math>m=1</math> формула значительно упрощается:

<math>k=\biggl(\frac{1}{n}\biggr)^\frac{1}{1-n}\Longleftrightarrow k=\Biggl(\frac{1}{n^\frac{1}{1-n}}\Biggr)\Longleftrightarrow k=n^{-\frac{1}{1-n}}=n^\frac{1}{n-1}.</math>

Тетрация с показателем 2

Для числовых выражений можно вычислять тетрацию с показателем 2 (то есть возводить выражение в степень самого себя):

<math>f(x_1, x_2...)=g(a_1, a_2,...)\Longleftrightarrow {}^2{f(x_1, x_2...)}={}^2{g(a_1, a_2,...)}\Longleftrightarrow \bigl(f(x_1,x_2,...)\bigr)^{f(x_1,x_2,,,,)}=\bigl(g(a_1,a_2,...)\bigr)^{g(a_1,a_2,,,,)}, b,a_1,a_2...=const.</math>

Разумеется, сюда же накладываются ограничения на положительность самих выражений или доопределения возведения в степень в случае их отрицательности.

Вычисление тетрации с более высокими показателями накладывает определённые ограничения в виде взаимозависимостей выражений (см. выше), поскольку тогда будут иметь место так называемые "степенные башни". Так же можно извлекать суперкорень с соответствующим показателем, но также стоит учитывать, что данная операция определена только для положительных чисел.

Пример: <math>x^2=4\Longleftrightarrow {}^2(x^2)={}^24\Longleftrightarrow (x^2)^{(x^2)}=4^4\Longleftrightarrow x^{2x^2}=256.</math>

Сделаем замену <math>x=y^\frac{1}{2}:</math> <math>(y^\frac{1}{2})^{2(y^\frac{1}{2})^2}=256\Longleftrightarrow y^y=256\longrightarrow y=4\longrightarrow x_1=2.</math>

Однако, вследствие неопределённости тетрации при неположительных числах, у нас исчез второй корень уравнения: <math>x_2=-2.</math>

Суперпотенцирование

Также благодаря возможности применения предыдущей итерации (возведения в степень), числовые равенства возможно преобразовывать в показатели тетрации:

<math>f(x_1, x_2...)=g(a_1, a_2,...)\Longleftrightarrow {}^{f(x_1, x_2...)}b={}^{g(a_1, a_2,...)}b; b,a_1,a_2...=const.</math>

При этом стоит учитывать положительность основания <math>b</math> (поскольку даже ноль не может быть возведён в степень самого себя) и различные неопределённости (недоговорённости) нецелых и/или отрицательных показателей тетрации.

Эту тенденцию можно продолжить итерировать и далее (см. Пентация, Гипероператор).

С точной уверенностью суперлогарифмировать числовые выражения пока нельзя по причине малоизученности свойств гипероператоров и обратных к ним функций, поскольку неясно, какие ограничения накладывает такое преобразование.

Специальные методы решения

Преобразования тригонометрических уравнений

Тригонометрическими называются уравнения, содержащие в качестве функций от переменных только тригонометрические функции (то есть уравнения, содержащие в себе композиции только тригонометрических функций).

При решении такого рода уравнений применяются различные тождества, основанные на свойствах самих тригонометрических функций (см. Тригонометрические тождества). В этих преобразованиях, однако, стоит учитывать составную природу тангенса и котангенса, синус и косинус в составе которых являются независимыми друг от друга функциями от одной и той же переменной.

Так, сделав очевидную замену <math>\text{tg}(x)=\frac{\sin(x)}{\sqrt{1-\sin^2(x)}},</math> мы получим совершенно новую функцию, значения которой будут отличаться от исходного соотношения тангенса: <math>\text{tg}(x)=\frac{\sin(x)}{\cos(x)}</math> (см. графики ниже).

Файл:Двойной рисунок тангенса с заменой.png
График функции y=tg(x) без замены (слева) и с заменой косинуса на синус (справа)

Такое изменение происходит из-за того, что формуле с заменой подразумевается арифметический корень, значение которого всегда неотрицательно. Однако, если бы мы подписали "±", функция тангенса потеряла бы присущую ей однозначность.

  • <math>\sin(x)=n\longrightarrow x=(-1)^k \arcsin(n)+\pi k, \text{ }n\in[-1;1],\text{ }k\in\mathbb{Z};</math>
  • <math>\cos(x)=n\longrightarrow x=\pm\arccos(n)+2\pi k, \text{ }n\in[-1;1],\text{ }k\in\mathbb{Z};</math>
  • <math>\text{tg}(x)=n\longrightarrow x=\text{arctg}(n)+\pi k, \text{ }n\in[-1;1],\text{ }k\in\mathbb{Z};</math>
  • <math>\text{ctg}(x)=n\longrightarrow x=\text{arcctg}(n)+\pi k, \text{ }n\in[-1;1],\text{ }k\in\mathbb{Z}.</math>

Решим в качестве примера уравнение посложнее: <math>\sin(x)\cos(x)\cos(2x)=\frac{1}{8}.</math>

Т.к. <math>\sin(x)\cos(x)=\frac{1}{2}\sin(2x),</math> то получаем: <math>\frac{1}{2}\sin(2x)\cos(2x)=\frac{1}{8}.</math>

Умножим на 4 и опять получим синус двойного угла: <math>2\sin(2x)\cos(2x)=\frac{1}{2}\Longleftrightarrow \sin{4x}=\frac{1}{2}.</math>

Окончательная формула корней: <math>x_{0,1,...}=(-1)^k\frac{\arcsin{\frac{1}{2}}+\pi k}{4}=(-1)^k\frac{\pi}{24}+\frac{\pi k}{4},\text{ }k\in\mathbb{Z}.</math>

Преобразования дифференциальных и интегральных уравнений

Дифференциальные уравнения — это, как правило, уравнения, содержащие в себе числовые функции и их производные. Таким образом, все преобразования, выполняемые над числовыми уравнениями, распространяются и на эти типы уравнений. Главное — помнить, что лучше проводить такие преобразования, в которых области допустимых значений входящих в уравнение функций не изменялись совсем. Отличительной особенностью дифференциальных уравнений от числовых является возможность их интегрирования (дифференцирования) по обе стороны от знака равенства.Шаблон:Основная статьяДифференциальные уравнения, так же как и числовые, решается аналитическим способом (символьное интегрирование) при поиске первообразной функции или численным — при вычислении определённого интеграла на каком-либо отрезке. Ниже приведены основные и наиболее часто используемые преобразования для нахождения аналитического решения. Шаблон:Основная статья Большинство типов дифференциальных уравнений можно привести к уравнениям с разделяющимися переменными, общее решение которых уже известно[24]. К числу таких преобразований можно отнести[24]:

  • Приведение однородных уравнений заменой <math>y(x)=xz(x)</math> при <math>x>0;</math>
  • Приведение квазиоднородных уравнений к однородным заменой <math>y(x)=z^{\frac{\beta}{\alpha}},</math> а затем — к уравнениям с разделяющимися переменными.

Шаблон:Основная статья Линейные дифференциальные уравнения, как правило, решаются тремя методами[24]:

Дифференциальные уравнения Бернулли также сводятся либо к линейным, либо к уравнениям с разделяющимися переменными с помощью замен[25].

Однородные дифференциальные уравнения второго и выше порядков решаются путём замены функции <math>y(x)=e^{kx}</math> и переходу таким способом к решению характеристического алгебраического уравнения от переменной <math>k</math> степени, равной порядку исходного дифференциального уравнения.

Существуют типы дифференциальных уравнений высших порядков, порядок которых можно понизить заменой производной какого-либо порядка на другую функцию. Таким же образом они могут быть сведены к уравнениям с разделяющимися переменными. Шаблон:Основная статья Интегральные уравнения являются более сложными, чем дифференциальные, но в своих решениях, как и они, часто содержат интегральные преобразования:

Шаблон:Основная статья

Шаблон:Основная статья

Помимо дифференциальных и интегральных существует также смешанный тип — интегро-дифференциальные уравнения, основным направлением решения которых является их сведение к двум предыдущим типам уравнений различными методами.

Преобразования функциональных уравнений

Шаблон:Основная статья Общего решения функциональных уравнений не существует, как и общих методов. Сами по себе функциональные уравнения являются свойствами своего решения — функции или типа функций. Например, решением функционального уравнения Абеля <math>\alpha (f(x))=\alpha (x)+1,{\text{ }}f(x)=a^{x}</math> является функция <math>\alpha (x)={\text{slog}}_{a}x.</math>[26]

Численные методы решения уравнений

Шаблон:Основная статья Данные методы представляют собой отдельную совокупность алгоритмов получения решения конкретного уравнения с заданной точностью. Основные отличия от аналитического решения:

  • Погрешность вычисления (при аналитическом способе иррациональные числа доступны в виде формул от рациональных, в связи с чем при желании могут быть вычислены с любой точностью для любых частных случаев);
  • Универсальность применения (одни и те же числовые методы могут быть применены к совсем разного типа уравнениям);
  • Возобновляемость процесса решения (для каждого конкретного случая одного вида уравнения метод необходимо применять заново и с самого начала, в отличие от аналитического решения, зная которое, для вычисления корней достаточно подставить нужные коэффициенты в уже известную, т.е. полученную раннее, формулу);
  • Необходимость использования дополнительного оборудования (таких, как калькуляторы и программные продукты; аналитические решения придумываются "из головы", хотя существуют специальные сайты или устанавливаемое ПО, способные вывести формулы уже известных аналитических решений).

Метод бисекции (дихотомии)

Шаблон:Основная статья Этот численный метод решения уравнения основан на противоположности знаков непрерывной функции около её нуля. Сам алгоритм довольно прост:

  1. Берётся отрезок, на концах которого функция даёт противоположные по знаку значения;
  2. Отрезок разбивается пополам, после чего значение функции в середине отрезка умножается на значения его концов: отрицательный результат приводит к сужению изначального отрезка от бывшей середины до того конца, в котором произведение было отрицательным;
  3. Новый отрезок снова делим пополам и повторяем процедуру до тех пор, пока отрезок не достигнет заданной точности.

Пример: найдём положительный корень уравнения <math>2^x=x^2+2.</math> Для этого перепишем уравнение в функцию: <math>f(x)=2^x-x^2-2.</math> Построив график этой функции легко убедиться, что искомое значение лежит в отрезке <math>[4;\text{ }5].</math> Найдём значения функции от концов этого отрезка и его середины: <math>f(4)=-2;</math> <math>f(5)=5;</math> <math>f(4,5)\approx 0,377416997969519,</math> — как видно, произведение значений <math>f(4)</math> и <math>f(4,5)</math> даёт отрицательный результат, в отличие от <math>f(4,5)\cdot f(5).</math> Теперь отрезок, в котором лежит корень, сокращается: <math>[4;\text{ }4,5].</math> Повторим процедуру снова (при этом значения функции на концах уже известны из предыдущих расчётов): <math>f(4,25)\approx -1,035186159956460,</math> — теперь отрезок сокращается "в другую сторону": <math>[4,25;\text{ }4,5].</math> Следующий цикл: <math>f(4,375)\approx -0,391192125583853,</math>— получаем новый отрезок: <math>[4,375;\text{ }4,5].</math> Цикл продолжается до требуемой точности, а затем, в качестве приближённого значения корня, выбирается тот конец отрезка, значения функции от которого наиболее близко к нулю. В нашем примере значение 4,44129 будет являться корнем исходного уравнения до пятого знака после запятой.

Метод хорд (секущих)

Шаблон:Основная статья Итерационный численный метод нахождения корня уравнения с заданной точностью, в основе которого лежит постоянное приближение к корню через пересечения хорд с осью абсцисс. Здесь используется следующая формула:

<math>x_{i+1}=x_{i}-{\dfrac {f(x_{i})\cdot (x_{i}-x_{0})}{f(x_{i})-f(x_{0})}},</math> однако она имеет низкую скорость сходимости, поэтому вместо неё чаще используют алгоритм:

<math>x_{i+1}=x_{i-1}-{\dfrac {f(x_{i-1})\cdot (x_{i}-x_{i-1})}{f(x_{i})-f(x_{i-1})}};</math> в различных источниках обе эти формулы называют по-разному — методом хорд и/или методом секущих.

Общий алгоритм использования метода в геометрическом смысле имеет вид:

  1. Сперва необходимо удостовериться, что функция уравнения непрерывна, а на рассматриваемом интервале имеется лишь один корень и отсутствуют нули производной (иначе, вычисление может не сойтись совсем);
  2. Затем выбрать две точки, принадлежащие графику функции (лежащие на нём), абсциссы которых входят в заданный интервал и значения функции в которых противоположны по знаку;
  3. Обе эти точки соединяются, образуя хорду (секущую), вычисляется точка пересечения хорды с осью абсцисс;
  4. Проводится перпендикуляр к оси абсцисс из точки пересечения к графику функции (проекция точки пересечения на график функции);
  5. Полученная точка на графике функции с противоположным концом уже имеющейся хорды соединяются, образуя новую хорду, для которой также надо будет вычислить точку пересечения с осью абсцисс...и т.д.

Метод Ньютона

Шаблон:Основная статья Основная идея метода Ньютона заключается в использовании итеративного приближения дифференцируемой функции по следующему алгоритму[27]:

<math>f'(x_n)=\text{tg}\alpha_n=\frac{\Delta y}{\Delta x}=\frac{0-f(x_n)}{x_{n+1}-x_n}\longrightarrow x_{n+1}=x_n-\frac{f(x_n)}{f'(x_n)}</math>

Для начала нужно убедиться, что функция, приравненная к нулю в данном уравнении, удовлетворяет некоторым критериям, ограничениям и условиям применимости данного метода, затем — удостовериться, что рядом с обнаруженным неизвестным корнем нет других неизвестных корней (иначе, можно попросту "сбиться с толку"). Теперь следует выбрать значение переменной <math>x_n</math>, близкое к корню (чем ближе, тем лучше), и подставить его в вышеописанную формулу. Дальше возможно два исхода:

  1. Если полученное значение <math>x_{n+1}</math> лежит в том же интервале, что и искомый корень, то его заново можно подставить в формулу: каждое следующее значение точнее предыдущего;
  2. Если полученное значение <math>x_{n+1}</math> не лежит в том же интервале, что и искомый корень, то необходимо заменять <math>x_{n+1}</math> на <math>\frac{x_n+x_{n+1}}{2}</math> до тех пор, пока новое значение не вернётся в интервал.

Итерационный процесс продолжается, пока полученное приближение искомого корня уравнения не достигнет требуемой точности.

Метод простой итерации

Шаблон:Основная статья

Обобщив метод хорд (секущих) и метод Ньютона можно прийти к выводу, что они оба являются разновидностью одного и того же алгоритма. Его можно описать следующим образом:

  1. Уравнение <math>f(x)=0</math> приводится к виду: <math>x=\varphi(x)</math>, — теперь можно записать итерационную формулу как <math> x_{i+1}=\varphi (x_{i});</math>
  2. Функцию <math>\varphi(x_i)</math> необходимо выбирать в соответствии с условиями сходимости метода, обычно <math>\varphi(x_i)=x_i-\lambda(x)f(x_i),</math> в качестве независимой <math>\lambda(x)</math> можно выбрать константу <math>\lambda_0,</math> знак которой совпадает со знаком производной <math>f'(x)</math> на отрезке, соединяющем истинный корень и первое значение <math>x_0.</math>

В частности, положив <math>\lambda_0=\frac{1}{f'(x_0)},</math> придём к алгоритму, называемому методом одной касательной; а при <math>\lambda(x)=\frac{1}{f'(x)}</math> получится тот самый метод Ньютона.

Пример: найти приближение корня уравнения <math>0,25\sin(x)-x-\pi=0.</math> Для начала определим функцию <math>\varphi(x)</math> и выразим <math>x</math> через неё:

<math>x=0,25\sin(x)-\pi\longrightarrow \varphi(x)=0,25\sin(x)-\pi,</math> — теперь необходимо убедиться, соответствует ли полученная функция условию сходимости, — <math>|\varphi'(x)|<1:</math>

<math>\varphi'(x)=0,25\cos(x)\longrightarrow |0,25\cos(x)|<1,</math> но <math>\cos(x)\in{[-1;1]}\text{ }\forall x.</math>

Теперь остаётся выбрать значение для первой итерации, близкое к корню (чем ближе, тем быстрее сходимость метода). Пусть <math>x_0=-3,</math> тогда <math>\varphi(-3)=x_1=0,25\sin(-3)-\pi\approx -3,176872655604760.</math>

Повторим процедуру уже для нового значения: <math>\varphi(x_1)=x_2\approx 0,25\sin(-3,176872655604760)-\pi\approx -3,132774482649750...</math>

Пройдя таким образом 22 шага итерации, мы получим приближение <math>x_{22}\approx -3,141592653589790,</math> для которого с точностью до пятнадцатого знака после запятой верно равенство: <math>x_{22}=-\pi</math>. Проверка: <math>0,25\sin(\pi)-(-\pi)-\pi= 0,25\cdot0+\pi-\pi=0\Longleftrightarrow0=0.</math>

Обратим внимание, что скорость сходимости зависит также и от самой функции. Так, если вместо множителя <math>0,25</math> мы поставим <math>0,5</math>, то при одинаковом изначальном значении <math>x_0</math> и уровне погрешности количество шагов увеличится с 22 до 44.

Методы проверки решения

Проверка решения необходима для определения того или иного полученного решения истинным и/или посторонним. Уравнение является частным случаем задачи, поэтому на них распространяются аналогичные методы проверки, а именно[28]:

  • Проверка алгоритма решения — это основной метод проверки хода решения, заключающийся в попутном обосновании логичности всех выполненных математических действий алгоритма (т.е. их непротиворечивости математическим теориям, в рамках которых решается уравнение).

Однако, выполнение проверки алгоритма возможно не всегда или не в полном объёме, к тому же при выполнении самой проверки также могут быть допущены ошибки, и полноту решения данный метод "не проверяет" почти никогда. В таких случаях используются иные методы, такие, например, как[28]:

  • Подстановка корней в исходное уравнение заключается в проверке выполнения тождественного равенства уравнения при конкретном данном решении (однако, бесконечные множества решений таким способом проверить нельзя).
  • Проверка на соответствие ОДЗ не гарантирует правильность и полноту решения, но определяет их истинность и помогает избежать дополнительных решений (а значит, и проверок) при появлении посторонних корней.
  • Проверка решения на простые и/или предельные случаи выполняется над аналитическим решением, чтобы доказать его универсальность или наличие в нём ограничительных функций, т.е. найти область возможных решений данного конкретного вида уравнений.
  • Проверка на соответствие структуры решения структуре уравнения позволяет заранее определить дополнительные возможные решения уравнения исходя из свойств входящих в уравнение функций, таких как симметрия, чётность, возвратность и пр.
  • Решение альтернативным способом полезно, когда требуется проверить какой-либо алгоритм (аналитическое решение), благодаря этому методу открываются новые формулы, связи и взаимозависимости уже известных функций.

Методы отсеивания посторонних корней

Шаблон:В планах

Критерии наличия допустимых решений уравнений

Шаблон:В планах

Примечания

Шаблон:Примечания

Литература

  • Маркушевич, Л. А. Уравнения и неравенства в заключительном повторении курса алгебры средней школы / Л. А. Маркушевич, Р. С. Черкасов. / Математика в школе. — 2004. — № 1.
  • Шаблон:Из БСЭ
  • Шаблон:Книга // Энциклопедия Кольера. — Открытое общество. 2000.
  • Уравнение // Энциклопедия Кругосвет
  • Шаблон:Книга // Математическая энциклопедия. — М.: Советская энциклопедия. И. М. Виноградов. 1977—1985.