Метод деления пополам

Алгоритм нахождения нуля функции

В математике метод бисекции — это метод нахождения корня , который применяется к любой непрерывной функции , для которой известны два значения с противоположными знаками. Метод состоит из многократного деления пополам интервала , определяемого этими значениями, и последующего выбора подынтервала, в котором функция меняет знак и, следовательно, должна содержать корень . Это очень простой и надежный метод, но он также относительно медленный. Из-за этого его часто используют для получения грубого приближения к решению, которое затем используют в качестве отправной точки для более быстро сходящихся методов. ^[1] Этот метод также называют методом деления интервала пополам , ^[2] методом бинарного поиска , ^[3] или методом дихотомии . ^[4]

Для многочленов существуют более сложные методы проверки существования корня в интервале ( правило знаков Декарта , теорема Штурма , теорема Будана ). Они позволяют расширить метод деления пополам до эффективных алгоритмов для нахождения всех действительных корней многочлена; см. Изоляция действительных корней .

Метод

Метод применим для численного решения уравнения f ( x ) = 0 для действительной переменной x , где f — непрерывная функция, определенная на интервале [ a , b ] и где f ( a ) и f ( b ) имеют противоположные знаки. В этом случае говорят, что a и b заключают в скобки корень, поскольку по теореме о промежуточном значении непрерывная функция f должна иметь по крайней мере один корень в интервале ( a , b ).

На каждом шаге метод делит интервал на две части/половины, вычисляя среднюю точку c = ( a + b ) / 2 интервала и значение функции f ( c ) в этой точке. Если c само по себе является корнем, то процесс завершается успешно и останавливается. В противном случае теперь есть только две возможности: либо f ( a ) и f ( c ) имеют противоположные знаки и заключают в скобки корень, либо f ( c ) и f ( b ) имеют противоположные знаки и заключают в скобки корень. ^[5] Метод выбирает подынтервал, который гарантированно является скобкой, в качестве нового интервала для использования на следующем шаге. Таким образом, интервал, содержащий ноль f, уменьшается по ширине на 50% на каждом шаге. Процесс продолжается до тех пор, пока интервал не станет достаточно малым.

Явно, если f ( c )=0, то c может быть взято в качестве решения, и процесс останавливается. В противном случае, если f ( a ) и f ( c ) имеют противоположные знаки, то метод устанавливает c как новое значение для b , а если f ( b ) и f ( c ) имеют противоположные знаки, то метод устанавливает c как новое a . В обоих случаях новые f ( a ) и f ( b ) имеют противоположные знаки, поэтому метод применим к этому меньшему интервалу. ^[6]

Итерационные задачи

Входными данными для метода являются непрерывная функция f , интервал [ a , b ] и значения функции f ( a ) и f ( b ). Значения функции имеют противоположные знаки (есть по крайней мере одно пересечение нуля в пределах интервала). Каждая итерация выполняет следующие шаги:

Вычислите c , середину интервала, c = ⁠а + б/2⁠ .
Рассчитайте значение функции в средней точке f ( c ).
Если сходимость удовлетворительная (то есть c − a достаточно мало или | f ( c )| достаточно мало), возвращаем c и прекращаем итерации.
Проверьте знак f ( c ) и замените либо ( a , f ( a )), либо ( b , f ( b )) на ( c , f ( c )), чтобы в новом интервале произошло нулевое пересечение.

При реализации метода на компьютере могут возникнуть проблемы с конечной точностью, поэтому часто существуют дополнительные тесты сходимости или ограничения на количество итераций. Хотя f является непрерывной, конечная точность может помешать значению функции когда-либо стать нулевым. Например, рассмотрим $f (x) = cos x$ ; не существует значения с плавающей точкой, аппроксимирующего $x = π /2$ , которое дает точно ноль. Кроме того, разница между a и b ограничена точностью с плавающей точкой; т. е. по мере уменьшения разницы между a и b в какой-то момент средняя точка $[a, b]$ будет численно идентична (в пределах точности с плавающей точкой) либо a , либо b .

Алгоритм

Метод может быть записан в псевдокоде следующим образом: ^[7]

вход: Функция f , конечные значения a , b , толерантность TOL , Максимальные итерации NMAX условия:  a < b , либо f ( a ) < 0 и f ( b ) > 0, либо f ( a ) > 0 и f ( b ) < 0 вывод: значение, которое отличается от корня f ( x ) = 0 менее чем на TOL N ← 1 while  N ≤ NMAX  do  // ограничить итерации, чтобы предотвратить бесконечный цикл  c ← ( a + b )/2 // новая средняя точка  if  f ( c ) = 0 or ( b – a )/2 < TOL  then  // решение найдено Output( c ) Stop  end if  N ← N + 1 // увеличить счетчик шагов  if sign( f ( c )) = sign( f ( a )) then  a ← c  else  b ← c  // новый интервал end while
Output("Метод не выполнен.") // превышено максимальное количество шагов

Пример: Нахождение корня многочлена

Предположим, что метод бисекции используется для нахождения корня многочлена

f(x)=x^{3}-x-2\,.

Сначала нужно найти два числа и , чтобы и имели противоположные знаки. Для приведенной выше функции и удовлетворяют этому критерию, так как $а$ $б$ $f(a)$ $f(b)$ $а=1$ $b=2$

f(1)=(1)^{3}-(1)-2=-2

и

f(2)=(2)^{3}-(2)-2=+4\,.

Поскольку функция непрерывна, в интервале [1, 2] должен быть корень.

В первой итерации конечные точки интервала, который охватывает корень, — это и , поэтому средняя точка — это $а_{1}=1$ $b_{1}=2$

c_{1}={\frac {2+1}{2}}=1,5

Значение функции в средней точке равно . Поскольку отрицательно, заменяется на для следующей итерации, чтобы гарантировать, что и имеют противоположные знаки. По мере продолжения интервал между и будет становиться все меньше, сходясь к корню функции. Посмотрите, как это происходит, в таблице ниже. $f(c_{1})=(1,5)^{3}-(1,5)-2=-0,125$ $f(c_{1})$ $а=1$ $а=1,5$ $f(a)$ $f(b)$ $а$ $б$

Итерация	$а_{н}$	$b_{n}$	$c_{n}$	$f(c_{n})$
1	1	2	1.5	−0,125
2	1.5	2	1.75	1.6093750
3	1.5	1.75	1.625	0,6660156
4	1.5	1.625	1.5625	0,2521973
5	1.5	1.5625	1.5312500	0,0591125
6	1.5	1.5312500	1.5156250	−0,0340538
7	1.5156250	1.5312500	1.5234375	0,0122504
8	1.5156250	1.5234375	1.5195313	−0,0109712
9	1.5195313	1.5234375	1.5214844	0,0006222
10	1.5195313	1.5214844	1.5205078	−0,0051789
11	1.5205078	1.5214844	1.5209961	−0,0022794
12	1.5209961	1.5214844	1.5212402	−0,0008289
13	1.5212402	1.5214844	1.5213623	−0,0001034
14	1.5213623	1.5214844	1.5214233	0,0002594
15	1.5213623	1.5214233	1.5213928	0.0000780

После 13 итераций становится очевидным, что имеет место сходимость примерно к 1,521: корень многочлена.

Анализ

Метод гарантированно сходится к корню f, если f является непрерывной функцией на интервале [ a , b ] и f ( a ) и f ( b ) имеют противоположные знаки. Абсолютная ошибка уменьшается вдвое на каждом шаге, поэтому метод сходится линейно . В частности, если c ₁ = ⁠а + б/2⁠ — середина начального интервала, а c _n — середина интервала на n -м шаге, тогда разность между c _n и решением c ограничена ^[8]

|c_{n}-c|\leq {\frac {|ba|}{2^{n}}}.

Эту формулу можно использовать для определения заранее верхней границы числа итераций, которые метод бисекции должен выполнить для сходимости к корню в пределах определенного допуска. Число итераций n , необходимых для достижения требуемого допуска ε (то есть ошибки, которая гарантированно не превысит ε), ограничено

n\leq n_{1/2}\equiv \left\lceil \log _{2}\left({\frac {\epsilon _{0}}{\epsilon }}\right)\right\rceil ,

где начальный размер скобок и требуемый размер скобок. Основной мотивацией использования метода бисекции является то, что на множестве непрерывных функций никакой другой метод не может гарантировать получение оценки c _n для решения c, которое в худшем случае имеет абсолютную ошибку менее чем за n _1/2 итераций. ^[9] Это также верно при нескольких общих предположениях относительно функции f и поведения функции в окрестности корня. ^[9]^[10] $\epsilon _{0}=|ba|$ $\epsilon \leq \epsilon _ {0}.$ $\epsilon$

Однако, несмотря на то, что метод бисекции является оптимальным в отношении производительности в худшем случае при критериях абсолютной ошибки, он неоптимален в отношении средней производительности при стандартных предположениях ^[11]^[12] , а также асимптотической производительности . ^[13] Популярные альтернативы методу бисекции, такие как метод секущей , метод Риддерса или метод Брента (среди прочих), обычно работают лучше, поскольку они жертвуют производительностью в худшем случае для достижения более высоких порядков сходимости к корню. И строгое улучшение метода бисекции может быть достигнуто с более высоким порядком сходимости без жертвы производительностью в худшем случае с методом ITP . ^[13]^[14]^{[ необходим неосновной источник ]}

Обобщение на более высокие измерения

Метод бисекции был обобщен на многомерные функции. Такие методы называются обобщенными методами бисекции . ^[15]^[16]

Методы, основанные на вычислении степени

Некоторые из этих методов основаны на вычислении топологической степени , которая для ограниченной области и дифференцируемой функции определяется как сумма по ее корням: $\Omega \subseteq \mathbb {R} ^{n}$ $f:\mathbb {R} ^{n}\rightarrow \mathbb {R} ^{n}$

\deg(f,\Omega):=\sum _{y\in f^{-1}(\mathbf {0})}\operatorname {sgn} \det(Df(y))

,

где — матрица Якоби , , и $Df(y)$ $\mathbf {0} =(0,0,...,0)^{T}$

\operatorname {sgn}(x)={\begin{cases}1,&x>0\\0,&x=0\\-1,&x<0\\\end{cases}}

— знаковая функция . ^[17] Для того чтобы корень существовал, достаточно, чтобы , и это можно проверить с помощью поверхностного интеграла по границе . ^[18] $\deg(f,\Omega)\neq 0$ $\Омега$

Характерный метод деления пополам

Метод характеристической бисекции использует только знаки функции в различных точках. Пусть f будет функцией из R ^d в R ^d для некоторого целого числа d ≥ 2. Характеристический многогранник ^[19] (также называемый допустимым многоугольником ) ^[20] функции f — это многогранник в R ^d , имеющий 2 ^d вершин, такой, что в каждой вершине v комбинация знаков f ( v ) уникальна, а топологическая степень f на ее внутренней стороне не равна нулю (необходимый критерий для обеспечения существования корня). ^[21] Например, при d = 2 характеристический многогранник функции f — это четырехугольник с вершинами (скажем) A, B, C, D, такой, что:

⁠ ⁠ $\operatorname {sgn} f(A)=(-,-)$ , то есть f ₁ (A)<0, f ₂ (A)<0.
⁠ ⁠ $\operatorname {sgn} f(B)=(-,+)$ , то есть f ₁ (B)<0, f ₂ (B)>0.
⁠ ⁠ $\operatorname {sgn} f(C)=(+,-)$ , то есть f ₁ (C)>0, f ₂ (C)<0.
⁠ ⁠ $\operatorname {sgn} f(D)=(+,+)$ , то есть f ₁ (D)>0, f ₂ (D)>0.

Собственное ребро характеристического многоугольника — это ребро между парой вершин, такое, что знаковый вектор отличается только одним знаком. В приведенном выше примере собственными ребрами характеристического четырехугольника являются AB, AC, BD и CD. Диагональ — это пара вершин, такая, что знаковый вектор отличается всеми d знаками. В приведенном выше примере диагонали — это AD и BC.

На каждой итерации алгоритм выбирает правильное ребро многогранника (скажем, A—B) и вычисляет знаки f в его средней точке (скажем, M). Затем он действует следующим образом:

Если ⁠ ⁠ $\operatorname {sgn} f(M)=\operatorname {sgn}(A)$ , то A заменяется на M, и мы получаем меньший характеристический многогранник.
Если ⁠ ⁠ $\operatorname {sgn} f(M)=\operatorname {sgn}(B)$ , то B заменяется на M, и мы получаем меньший характеристический многогранник.
В противном случае мы выбираем новый подходящий край и пробуем снова.

Предположим, что диаметр (= длина самого длинного собственного ребра) исходного характеристического многогранника равен $D.$ Тогда требуется по крайней мере деление ребер пополам, чтобы диаметр оставшегося многоугольника был не больше $ε$ . ^[20]^{: 11, Лемма.4.7} Если топологическая степень исходного многогранника не равна нулю, то существует процедура, которая может выбрать ребро таким образом, что следующий многогранник также будет иметь ненулевую степень. ^[21]^[22] $\log _{2}(D/\varepsilon)$

Смотрите также

Алгоритм бинарного поиска
Алгоритм Лемера–Шура , обобщение метода бисекции на комплексной плоскости
Вложенные интервалы

Ссылки

^ Берден и Фейрес 1985, стр. 31
^ "Деление интервала пополам (бисекция)". Архивировано из оригинала 2013-05-19 . Получено 2013-11-07 .
^ Берден и Фейрес 1985, стр. 28
^ "Метод дихотомии - Энциклопедия математики". www.encyclopediaofmath.org . Получено 21.12.2015 .
^ Если функция имеет одинаковый знак в конечных точках интервала, конечные точки могут заключать в скобки корни функции, а могут и не заключать их.
^ Burden & Faires 1985, стр. 28 для раздела
^ Burden & Faires 1985, стр. 29. Эта версия пересчитывает значения функции на каждой итерации, а не переносит их на следующие итерации.
^ Burden & Faires 1985, с. 31, теорема 2.1
^ Аб Сикорски, К. (1 февраля 1982 г.). «Биссекция оптимальна». Числовая математика . 40 (1): 111–117 . doi :10.1007/BF01459080. ISSN 0945-3245. S2CID 119952605.
^ Сикорский, К (1 декабря 1985 г.). «Оптимальное решение нелинейных уравнений». Журнал сложности . 1 (2): 197– 209. doi :10.1016/0885-064X(85)90011-1. ISSN 0885-064X.
^ Граф, Зигфрид; Новак, Эрих; Папагеоргиу, Анаргирос (1 июля 1989 г.). «В среднем бисекция не оптимальна». Числовая математика . 55 (4): 481–491 . doi : 10.1007/BF01396051. ISSN 0945-3245. S2CID 119546369.
^ Новак, Эрих (1989-12-01). "Средние результаты для нулевого обнаружения". Журнал сложности . 5 (4): 489– 501. doi : 10.1016/0885-064X(89)90022-8 . ISSN 0885-064X.
^ ab Oliveira, IFD; Takahashi, RHC (2020-12-06). "Улучшение средней производительности метода бисекции, сохраняющее оптимальность Minmax". ACM Transactions on Mathematical Software . 47 (1): 5:1–5:24. doi :10.1145/3423597. ISSN 0098-3500. S2CID 230586635.
^ Иво, Оливейра (14.12.2020). «Улучшенный метод деления пополам». doi : 10.1145/3423597. S2CID 230586635.
^ Mourrain, B.; Vrahatis, MN; Yakoubsohn, JC (2002-06-01). «О сложности изоляции действительных корней и вычислении с уверенностью топологической степени». Journal of Complexity . 18 (2): 612– 640. doi : 10.1006/jcom.2001.0636 . ISSN 0885-064X.
^ Vrahatis, Michael N. (2020). «Обобщения теоремы о промежуточном значении для аппроксимации неподвижных точек и нулей непрерывных функций». В Sergeyev, Yaroslav D.; Kvasov, Дмитрий E. (ред.). Numerical Computations: Theory and Algorithms . Lecture Notes in Computer Science. Vol. 11974. Cham: Springer International Publishing. pp. 223– 238. doi :10.1007/978-3-030-40616-5_17. ISBN 978-3-030-40616-5. S2CID 211160947.
^ Polymilis, C.; Servizi, G.; Turchetti, G.; Skokos, Ch.; Vrahatis, MN (май 2003 г.). «Определение периодических орбит с помощью топологической теории степеней». Libration Point Orbits and Applications : 665– 676. arXiv : nlin/0211044 . doi :10.1142/9789812704849_0031. ISBN 978-981-238-363-1.
^ Кирфотт, Бейкер (1979-06-01). "Эффективный метод вычисления степени для обобщенного метода деления пополам". Numerische Mathematik . 32 (2): 109– 127. doi :10.1007/BF01404868. ISSN 0945-3245. S2CID 122058552.
^ Врахатис, Майкл Н. (1995-06-01). «Эффективный метод поиска и вычисления периодических орбит нелинейных отображений». Журнал вычислительной физики . 119 (1): 105– 119. Bibcode : 1995JCoPh.119..105V. doi : 10.1006/jcph.1995.1119. ISSN 0021-9991.
^ ab Vrahatis, MN; Iordanidis, KI (1986-03-01). "Быстрый обобщенный метод деления пополам для решения систем нелинейных уравнений". Numerische Mathematik . 49 (2): 123– 138. doi :10.1007/BF01389620. ISSN 0945-3245. S2CID 121771945.
^ ab Vrahatis, MN; Perdiou, AE; Kalantonis, VS; Perdios, EA; Papadakis, K.; Prosmiti, R.; Farantos, SC (июль 2001 г.). "Применение метода характеристического деления пополам для определения местоположения и вычисления периодических орбит в молекулярных системах". Computer Physics Communications . 138 (1): 53– 68. Bibcode :2001CoPhC.138...53V. doi :10.1016/S0010-4655(01)00190-4.
^ Врахатис, Майкл Н. (декабрь 1988 г.). «Решение систем нелинейных уравнений с использованием ненулевого значения топологической степени». Труды ACM по математическому программному обеспечению . 14 (4): 312– 329. doi :10.1145/50063.214384.

Берден, Ричард Л.; Фейрес, Дж. Дуглас (1985), "2.1 Алгоритм деления пополам", Численный анализ (3-е изд.), PWS Publishers, ISBN 0-87150-857-5

Дальнейшее чтение

Корлисс, Джордж (1977), «Какой корень находит алгоритм деления пополам?», SIAM Review , 19 (2): 325– 327, doi :10.1137/1019044, ISSN 1095-7200
Кау, Аутар; Калу, Эгву (2008), Численные методы и их приложения (1-е изд.), архивировано из оригинала 2009-04-13

Внешние ссылки

Вайсштейн, Эрик В. «Двустороннее сечение». Математический мир .
Заметки по методу бисекции, PPT, Mathcad, Maple, Matlab, Mathematica от Института целостных численных методов

[1] Берден и Фейрес 1985, стр. 31

[2] "Деление интервала пополам (бисекция)". Архивировано из оригинала 2013-05-19 . Получено 2013-11-07 .

[3] Берден и Фейрес 1985, стр. 28

[4] "Метод дихотомии - Энциклопедия математики". www.encyclopediaofmath.org . Получено 21.12.2015 .

[5] Если функция имеет одинаковый знак в конечных точках интервала, конечные точки могут заключать в скобки корни функции, а могут и не заключать их.

[6] Burden & Faires 1985, стр. 28 для раздела

[7] Burden & Faires 1985, стр. 29. Эта версия пересчитывает значения функции на каждой итерации, а не переносит их на следующие итерации.

[8] Burden & Faires 1985, с. 31, теорема 2.1

[:0-9] Аб Сикорски, К. (1 февраля 1982 г.). «Биссекция оптимальна». Числовая математика . 40 (1): 111–117 . doi :10.1007/BF01459080. ISSN 0945-3245. S2CID 119952605.

[10] Сикорский, К (1 декабря 1985 г.). «Оптимальное решение нелинейных уравнений». Журнал сложности . 1 (2): 197– 209. doi :10.1016/0885-064X(85)90011-1. ISSN 0885-064X.

[11] Граф, Зигфрид; Новак, Эрих; Папагеоргиу, Анаргирос (1 июля 1989 г.). «В среднем бисекция не оптимальна». Числовая математика . 55 (4): 481–491 . doi : 10.1007/BF01396051. ISSN 0945-3245. S2CID 119546369.

[12] Новак, Эрих (1989-12-01). "Средние результаты для нулевого обнаружения". Журнал сложности . 5 (4): 489– 501. doi : 10.1016/0885-064X(89)90022-8 . ISSN 0885-064X.

[:1-13] Oliveira, IFD; Takahashi, RHC (2020-12-06). "Улучшение средней производительности метода бисекции, сохраняющее оптимальность Minmax". ACM Transactions on Mathematical Software . 47 (1): 5:1–5:24. doi :10.1145/3423597. ISSN 0098-3500. S2CID 230586635.

[14] Иво, Оливейра (14.12.2020). «Улучшенный метод деления пополам». doi : 10.1145/3423597. S2CID 230586635.

[15] Mourrain, B.; Vrahatis, MN; Yakoubsohn, JC (2002-06-01). «О сложности изоляции действительных корней и вычислении с уверенностью топологической степени». Journal of Complexity . 18 (2): 612– 640. doi : 10.1006/jcom.2001.0636 . ISSN 0885-064X.

[16] Vrahatis, Michael N. (2020). «Обобщения теоремы о промежуточном значении для аппроксимации неподвижных точек и нулей непрерывных функций». В Sergeyev, Yaroslav D.; Kvasov, Дмитрий E. (ред.). Numerical Computations: Theory and Algorithms . Lecture Notes in Computer Science. Vol. 11974. Cham: Springer International Publishing. pp. 223– 238. doi :10.1007/978-3-030-40616-5_17. ISBN 978-3-030-40616-5. S2CID 211160947.

[17] Polymilis, C.; Servizi, G.; Turchetti, G.; Skokos, Ch.; Vrahatis, MN (май 2003 г.). «Определение периодических орбит с помощью топологической теории степеней». Libration Point Orbits and Applications : 665– 676. arXiv : nlin/0211044 . doi :10.1142/9789812704849_0031. ISBN 978-981-238-363-1.

[18] Кирфотт, Бейкер (1979-06-01). "Эффективный метод вычисления степени для обобщенного метода деления пополам". Numerische Mathematik . 32 (2): 109– 127. doi :10.1007/BF01404868. ISSN 0945-3245. S2CID 122058552.

[19] Врахатис, Майкл Н. (1995-06-01). «Эффективный метод поиска и вычисления периодических орбит нелинейных отображений». Журнал вычислительной физики . 119 (1): 105– 119. Bibcode : 1995JCoPh.119..105V. doi : 10.1006/jcph.1995.1119. ISSN 0021-9991.

[:2-20] Vrahatis, MN; Iordanidis, KI (1986-03-01). "Быстрый обобщенный метод деления пополам для решения систем нелинейных уравнений". Numerische Mathematik . 49 (2): 123– 138. doi :10.1007/BF01389620. ISSN 0945-3245. S2CID 121771945.

[:3-21] Vrahatis, MN; Perdiou, AE; Kalantonis, VS; Perdios, EA; Papadakis, K.; Prosmiti, R.; Farantos, SC (июль 2001 г.). "Применение метода характеристического деления пополам для определения местоположения и вычисления периодических орбит в молекулярных системах". Computer Physics Communications . 138 (1): 53– 68. Bibcode :2001CoPhC.138...53V. doi :10.1016/S0010-4655(01)00190-4.

[22] Врахатис, Майкл Н. (декабрь 1988 г.). «Решение систем нелинейных уравнений с использованием ненулевого значения топологической степени». Труды ACM по математическому программному обеспечению . 14 (4): 312– 329. doi :10.1145/50063.214384.