Русская Википедия:Факторизация целых чисел

Материал из Онлайн справочника
Версия от 10:11, 23 сентября 2023; EducationBot (обсуждение | вклад) (Новая страница: «{{Русская Википедия/Панель перехода}} thumb|Схематическая иллюстрация факторизации числа 525.|342x342px '''Факториза́цией''' натурального числа называется его разложение в произведение простой множитель|простых множителе...»)
(разн.) ← Предыдущая версия | Текущая версия (разн.) | Следующая версия → (разн.)
Перейти к навигацииПерейти к поиску

Файл:Factorization.gif
Схематическая иллюстрация факторизации числа 525.

Факториза́цией натурального числа называется его разложение в произведение простых множителей. Существование и единственность (с точностью до порядка следования множителей) такого разложения следует из основной теоремы арифметики.

В отличие от задачи распознавания простоты числа, факторизация предположительно является вычислительно сложной задачей. В настоящее время неизвестно, существует ли эффективный не квантовый алгоритм факторизации целых чисел. Однако доказательства того, что не существует решения этой задачи за полиномиальное время, также нет.

Предположение о том, что для больших чисел задача факторизации является вычислительно сложной, лежит в основе широко используемых алгоритмов (например, RSA). Многие области математики и информатики находят применение в решении этой задачи. Среди них: эллиптические кривые, алгебраическая теория чисел и квантовые вычисления.

История

Задача поиска эффективных способов разложения целых чисел на множители интересовала математиков с давних времён, особенно специалистов в области теории чисел. Существуют предположения о том, что Ферма был одним из первых, кто предложил метод разложения, заключающийся в том, чтобы представить число в виде разности квадратов <math>n = x^2 - y^2</math>, а затем, вычисляя <math>\gcd(n, x-y)</math>, попытаться найти нетривиальный делитель <math>n</math>. Данный способ позволяет находить два мало различающихся по величине делителя числа быстрее, чем простой перебор делителейШаблон:Sfn.

Файл:Rsa logo.png
Создание алгоритма RSA стимулировало бурные исследования в области факторизации целых чисел.

Далее Лежандр обнаружил, что при таком подходе достаточно получить сравнение <math>x^2 \equiv y^2 \mod n</math>, и использовал для этого цепные дроби. Также Эйлером и Гауссом были предложены некоторые способы нахождения чисел, связанных этим сравнениемШаблон:Sfn.

Одним из ключевых моментов в развитии факторизации целых чисел было создание алгоритма RSA, что возобновило интерес учёных в данном направлении, так как имело практическое применение в области шифрования. Этот алгоритм был предложен в 1977 году тремя учёными Рональдом Ривестом, Ади Шамиром и Леонардом Адлеманом из Массачусетского технологического института и назван по первым буквам фамилий авторов методом RSA. Он основан на идее криптографии с открытым ключом и для взлома системы необходимо выполнить разложение числа на простые сомножители. На момент публикации алгоритма RSA были известны методы, которые позволяли факторизовать числа, состоящие не более чем из 25—30 цифр, а наиболее известным и применяемым все ещё оставался метод Ферма. Метод RSA позволяет факторизовать числаШаблон:Уточнить из 100 и более десятичных знаков. Создатели, в свою очередь, пообещали за факторизацию числа из 129 десятичных знаков символические сто долларов СШАШаблон:Sfn.

На популярность задачи факторизации также повлияла публикация в 1977 году в журнале Scientific American Мартина Гарднера «Новый алгоритм шифрования, для взлома которого потребуются миллионы лет».Шаблон:Source-ref Столь громкое название было воспринято в качестве вызова всему математическому сообществу. В результате этой гонки было предложено несколько новых и нестандартных идей факторизацииШаблон:Sfn.

Эпопея с разложением 129-значного числа завершилась в 1994 году, когда коллектив под руководством А. Ленстры, используя 1600 компьютеров, подготовил за 220 дней систему линейных уравнений, содержавшую более полумиллиона неизвестных. Решение этой системы суперкомпьютером заняло два дня. Несмотря на то, что в то время уже были известны методы решета числового поля, данный результат был получен с помощью алгоритма квадратичного решетаШаблон:Sfn.

Алгоритмы факторизации

Как правило, на вход таких алгоритмов подаётся число <math>n \in \N</math>, которое необходимо факторизовать, состоящее из <math>N = [\log_2 n] + 1</math> символов (если <math>n</math> представлено в двоичном виде)Шаблон:Sfn. При этом алгоритм ищет первый простой делитель, после чего, при необходимости, можно запустить алгоритм заново для дальнейшей факторизации. Также, прежде чем начинать факторизацию большого числа, следует убедиться в том, что оно не простое. Для этого достаточно пройти тест числа на простоту. Эта задача детерминированно разрешима за полиномиальное времяШаблон:Sfn.

В зависимости от сложности алгоритмы факторизации можно разбить на две группы. Первая группа — экспоненциальные алгоритмы, сложность которых экспоненциально зависит от длины входящих параметров (то есть от длины <math>N</math> самого числа в бинарном представлении). Вторая группа — субэкспоненциальные алгоритмы.

Вопрос о существовании алгоритма факторизации с полиномиальной сложностью на классическом компьютере является одной из важных открытых проблем современной теории чисел. В то же время факторизация с полиномиальной сложностью возможна на квантовом компьютере с помощью алгоритма Шора (класс BQP)Шаблон:Sfn.

Экспоненциальные алгоритмы

Перебор возможных делителей

Шаблон:Main

Сложность <math> O(\sqrt{n}\log^2 n) </math> или <math> O(\sqrt{n}\log n) </math>.

Один из самых простых и очевидных алгоритмов факторизации, заключающийся в том, чтобы последовательно делить факторизуемое число <math>n</math> на натуральные числа от <math>2</math> до <math>\lfloor \sqrt{n} \rfloor</math>. Формально достаточно делить только на простые числа в этом интервале, однако, для этого необходимо знать их множество. На практике составляется таблица простых чисел и производится проверка небольших чисел (например, до <math>2^{16}</math>). Для очень больших чисел алгоритм не используется в силу низкой скорости работыШаблон:Sfn.

Шаблон:Hider

Метод факторизации Ферма

Шаблон:Main

Сложность <math> O(n)</math> или <math>O(exp(N))</math>.

Идея алгоритма заключается в поиске таких чисел <math>A</math> и <math>B</math>, что факторизуемое число n представимо в виде: <math>n = A^2 - B^2 = (A-B)(A+B)</math>. Как и метод пробного деления, обычно не применяется на практике для факторизации больших чисел, так как имеет экспоненциальную сложность. Метод реализуем без операции деления, а только лишь с операциями сложения и вычитанияШаблон:Sfn. Если <math>n = pq</math>, при условии того, что <math>p</math> и <math>q</math> — простые числа, не сильно различающиеся по величине, то метод Ферма факторизует n достаточно быстроШаблон:Sfn.

Шаблон:Hider

ρ-алгоритм Полларда

Шаблон:Main

Сложность <math>O(n^{1/4})</math>.

Алгоритм Полларда является вероятностным алгоритмом, позволяющим находить делитель составного числа <math>n</math>, работающим со сложностью, зависящей лишь от величины делителя, но не величины факторизуемого числа <math>n</math>. Это обуславливает удобство применимости данного алгоритма в тех случаях, когда другие алгоритмы, сложность которых зависит от <math>n</math>, становятся неэффективныШаблон:Sfn. Примечателен также тем, что существует вариант реализации такого алгоритма, при котором достаточно в памяти хранить всего 3 целых числаШаблон:Sfn.

Шаблон:Hider

Алгоритм Ленстры

Шаблон:Main

Сложность <math>O(n^{1/3}\log^2n)</math>.

Несмотря на относительно неплохую эффективность среди экспоненциальных алгоритмов, в алгоритме Ленстры есть необходимость неоднократно вычислять квадратный корень в одном из шагов алгоритма, что является более трудоёмким, чем сложение или вычитаниеШаблон:Sfn.

Шаблон:Hider

Алгоритм Полларда — Штрассена

Шаблон:Main

Сложность <math>O(n^{1/4}\log^4n)</math>.

Данный алгоритм имеет оценку сложности схожую с методом квадратичных форм Шенкса (что является наилучшей среди детерминированных алгоритмов факторизации), однако требует выделение <math>O(n^{1/4}\log n)</math> памяти. Он может использоваться непосредственно для факторизации не очень больших целых чисел, а также в качестве вспомогательного алгоритма в субэкспоненциальном методе ДиксонаШаблон:Sfn и для ускорения вычислений второго этапа метода факторизации с помощью эллиптических кривых.[1]

Шаблон:Hider

Метод квадратичных форм Шенкса

Шаблон:MainГарантированная сложность <math>O(n^{1/4+\varepsilon})</math> и при верности гипотезы Римана <math>O(n^{1/5+\varepsilon})</math>.

В отличие от алгоритма Полларда - Штрассена не требует выделения больших объёмов памяти, к тому же имеет достаточно простые расчётные формулы[2].

P-1 алгоритм Полларда

Шаблон:Main

Сложность <math>O(n^{1/2}\log^cn)</math>Шаблон:Sfn.

Несмотря на экспоненциальную оценку сложности, алгоритм во всех случаях быстро находит небольшие простые делители <math>n</math>, потому что они являются степенно-гладкими для небольшой границы гладкости <math>B</math>. В практических задачах данный алгоритм обычно используется до применения субэкспоненциальных алгоритмов факторизации, чтобы отделить небольшие простые делители числа <math>n</math>Шаблон:Sfn.

Шаблон:Hider

Метод Лемана

Шаблон:Main

Сложность <math>O(n^{1/3})</math>.

В настоящее время алгоритм представляет скорее исторический, чем практический интерес, так как этот алгоритм был первым детерминированным алгоритмом со сложностью выполнения быстрее, чем <math>O(\sqrt{n})</math>.

Шаблон:Hider

Субэкспоненциальные алгоритмы

Для обозначения сложности принята L-нотацияШаблон:Sfn:

<math>L_{n}(\alpha,\;c):=O(\exp((c+o(1))(\log n)^{\alpha}(\log\log n)^{1-\alpha})),</math>

где <math>n</math> — число подлежащее факторизации, <math>0<\alpha<1</math> и <math>c</math> — некоторые константы.

Алгоритм Диксона

Шаблон:Main

Сложность <math>L_n(1/2,\;2\sqrt{2})</math>.

Шаблон:Hider

Факторизация методом непрерывных дробей

Шаблон:Main

Сложность <math>L_n(1/2,\;\sqrt{2})</math>Шаблон:Sfn.

Метод квадратичного решета

Шаблон:Main

Сложность <math>L_n(1/2,\;1)</math>Шаблон:Sfn.

Данный метод с использованием нескольких многочленов эффективен и достаточно легко реализуем на компьютере. Есть основания полагать, что он является наилучшим из известных алгоритмов факторизации для <math>n < 10^{110}</math> (не считая метод факторизации с помощью эллиптических кривых, который в некоторых случаях может работать быстрее. Для чисел <math>n > 10^{110}</math> алгоритмы решета числового поля сработают быстрее, чем метод квадратичного решетаШаблон:Sfn.

Факторизация Ленстры с помощью эллиптических кривых

Шаблон:Main

Сложность <math>L_p(1/2,\;\sqrt{2})</math>, где <math>p</math> — наименьшее простое, которое делит <math>n</math>Шаблон:Sfn.

Параметры <math>a, x, y</math> выбираются случайно. Значения <math>w,v</math> следует выбирать эмпирически, рассмотрев некоторую серию возрастающих значенийШаблон:Sfn. На практике при заданных <math>n, v, w</math> алгоритм заключается в том, чтобы выполнить алгоритм с одной кривой. Это повторяется до тех пор, пока <math>n</math> не разложится на множители или пока время, отведённое для алгоритма, не закончится.

Существуют модификации алгоритма, позволяющие работать с несколькими кривыми одновременноШаблон:Sfn.

Шаблон:Hider

Решето числового поля

В настоящее время самыми эффективными алгоритмами факторизации являются вариации решета числового поляШаблон:Sfn:

Применение в криптографии

Предполагаемая большая вычислительная сложность задачи факторизации лежит в основе криптостойкости некоторых алгоритмов шифрования с открытым ключом, таких как RSA. Более того, если известен хотя бы один из параметров ключей RSA, то система взламывается однозначно, кроме того, существует множество алгоритмов восстановления всех ключей в системе, обладая какими-то даннымиШаблон:Sfn.

Текущее состояние

В марте 1994 года с помощью двойной вариации множественного полиномиального QS командой математиков под руководством Ленстры было разложено на множители 129-разрядное (428-битовое) число. Вычисления выполнялись добровольцами в Интернете — в течение восьми месяцев трудились 600 человек и 1600 компьютеров. Компьютеры соединялись по электронной почте, передавая свои результаты в центральное хранилище, где выполнялся окончательный анализ. В этих вычислениях использовались QS и теория пятилетней давности, NFS мог бы ускорить выполнение расчётов. Группа учёных сделала вывод о том, что широко используемые 512-битовые модули RSA могут быть вскрыты организацией, готовой потратить несколько миллионов долларов и подождать несколько месяцевШаблон:Sfn.

С целью развития искусства разложения на множители RSA Data Security, Inc. в марте 1991 года объявило о программе RSA Factoring Challenge (состязание RSA по разложению на множители). Состязание состоит в разложении на множители ряда трудных чисел, каждое из которых является произведением двух простых чисел примерно одинакового размера. Каждое простое число было выбрано конгруэнтным 2 по модулю 3. Всего было предложено 42 числа, по одному в диапазоне от 100 до 500 разрядов с шагом в 10 разрядов (плюс одно дополнительное, 129-разрядное число. Подробнее: Шаблон:Нп5Шаблон:Sfn.

Примечания

Шаблон:Примечания

Литература

на русском языке
на английском языке

Шаблон:Числа по характеристикам делимости Шаблон:Добротная статья