Числовая сертификация

Числовая сертификация — это процесс проверки правильности возможного решения системы уравнений . В (численной) вычислительной математике, такой как численная алгебраическая геометрия , возможные решения вычисляются алгоритмически, но существует вероятность, что ошибки испортили возможные решения. Например, в дополнение к неточности входных данных и возможных решений, числовые ошибки или ошибки в дискретизации задачи могут привести к искаженным возможным решениям. Целью числовой сертификации является предоставление сертификата, который доказывает, какие из этих возможных решений действительно являются приближенными решениями.

Методы сертификации можно разделить на два вида: априорная сертификация и апостериорная сертификация. Апостериорная сертификация подтверждает правильность окончательных ответов (независимо от того, как они получены), в то время как априорная сертификация подтверждает правильность каждого шага конкретного вычисления. Типичным примером апостериорной сертификации является альфа-теория Смейла , в то время как типичным примером априорной сертификации является интервальная арифметика .

Сертификаты

Сертификат для корня это вычислительное доказательство правильности решения-кандидата. Например, сертификат может состоять из приближенного решения , области , содержащей , и доказательства, которое содержит ровно одно решение системы уравнений. х {\displaystyle x} Р {\displaystyle R} х {\displaystyle x} Р {\displaystyle R}

В этом контексте априорный числовой сертификат является сертификатом в смысле правильности в информатике . С другой стороны, апостериорный числовой сертификат действует только на решения, независимо от того, как они вычисляются. Следовательно, апостериорная сертификация отличается от алгоритмической правильности — в качестве крайнего примера алгоритм может случайным образом генерировать кандидатов и пытаться сертифицировать их как приблизительные корни, используя апостериорную сертификацию.

Апостериориметоды сертификации

Существует множество методов апостериорной сертификации, в том числе:

Альфа-теория

Краеугольным камнем альфа-теории Смейла является ограничение ошибки для метода Ньютона . Работа Смейла 1986 года [1] ввела величину , которая количественно определяет сходимость метода Ньютона. Точнее, пусть будет системой аналитических функций от переменных , оператора производной и оператора Ньютона. Величины и используются для подтверждения решения-кандидата. В частности, если то является приближенным решением для , т. е. кандидат находится в области квадратичной сходимости для метода Ньютона. Другими словами, если это неравенство выполняется, то существует корень , так что итерации оператора Ньютона сходятся как α {\displaystyle \альфа} Ф {\displaystyle F} х {\displaystyle x} Д {\displaystyle D} Н {\displaystyle N} β ( ф , х ) = х Н ( х ) = Д ф ( х ) 1 ф ( х ) {\displaystyle \beta (f,x)=\|xN(x)\|=\|Df(x)^{-1}f(x)\|} γ ( ф , х ) = Как дела к 2 Д ф ( х ) 1 Д к ф ( х ) к ! 1 к 1 {\displaystyle \gamma (f,x)=\sup _{k\geq 2}\left\|{\frac {Df(x)^{-1}D^{k}f(x)}{k!}}\right\|^{\frac {1}{k-1}}} α ( ф , х ) = β ( ф , х ) γ ( ф , х ) {\displaystyle \альфа (f,x)=\бета (f,x)\гамма (f,x)} α ( ф , х ) < 13 3 17 4 , {\displaystyle \альфа (f,x)<{\frac {13-3{\sqrt {17}}}{4}},} х {\displaystyle x} ф {\displaystyle f} х {\displaystyle x^{\ast}} Ф {\displaystyle F} Н к ( х ) х 1 2 2 к 1 х х . {\displaystyle \left\|N^{k}(x)-x^{\ast }\right\|\leq {\frac {1}{2^{2^{k}-1}}}\|xx^{\ast }\|.}

Программный пакет alphaCertified обеспечивает реализацию альфа-теста для полиномов путем оценки и . [2] β {\displaystyle \бета} γ {\displaystyle \гамма}

Интервальные методы Ньютона и Кравчика

Предположим , что — функция, неподвижные точки которой соответствуют корням . Например, оператор Ньютона обладает этим свойством. Предположим, что — область, тогда, Г : Р н Р н {\displaystyle G:\mathbb {R} ^{n}\rightarrow \mathbb {R} ^{n}} Ф {\displaystyle F} я {\displaystyle Я}

  1. Если отображается в себя, т.е. , то по теореме Брауэра о неподвижной точке имеет по крайней мере одну неподвижную точку в , и, следовательно, имеет по крайней мере один корень в . Г {\displaystyle G} я {\displaystyle Я} Г ( я ) я {\displaystyle G(I)\subseteq I} Г {\displaystyle G} я {\displaystyle Я} Ф {\displaystyle F} я {\displaystyle Я}
  2. Если является сжимающим в области, содержащей , то существует не более одного корня в . Г {\displaystyle G} я {\displaystyle Я} я {\displaystyle Я}

Существуют версии следующих методов для комплексных чисел, но для отражения этого случая необходимо скорректировать как интервальную арифметику, так и условия.

Метод интервального Ньютона

В одномерном случае метод Ньютона можно напрямую обобщить для подтверждения корня на интервале. Для интервала пусть будет серединой . Тогда оператор Ньютона, примененный к интервалу, будет Дж. {\displaystyle J} м ( Дж. ) {\displaystyle м(Дж)} Дж. {\displaystyle J} Дж. {\displaystyle J}

я Н ( Дж. ) = м ( Дж. ) Ф ( м ( Дж. ) ) / Ф ( Дж. ) . {\displaystyle IN(J)=m(J)-F(m(J))/F'(J).}

На практике в этом вычислении можно использовать любой интервал, содержащий . Если является корнем , то по теореме о среднем значении существует такой , что . Другими словами, . Поскольку содержит обратный элемент во всех точках , то следует, что . Следовательно, . Ф ( Дж. ) {\displaystyle F'(J)} х {\displaystyle x} Ф {\displaystyle F} с Дж. {\displaystyle c\in J} Ф ( м ( Дж. ) ) Ф ( с ) ( м ( Дж. ) х ) = Ф ( х ) = 0 {\displaystyle F(м(Дж))-F'(c)(м(Дж)-x)=F(x)=0} Ф ( м ( Дж. ) ) = Ф ( с ) ( м ( Дж. ) х ) {\displaystyle F(м(J))=F'(c)(м(J)-x)} Ф ( Дж. ) {\displaystyle F'(J)} Ф {\displaystyle F} Дж. {\displaystyle J} м ( Дж. ) х Ф ( м ( Дж. ) ) / Ф ( Дж. ) {\displaystyle m(J)-x\in F(m(J))/F'(J)} х = м ( Дж. ) ( м ( Дж. ) х ) я Н ( Дж. ) {\displaystyle x=m(J)-(m(J)-x)\in IN(J)}

Более того, если , то либо является корнем и , либо . Следовательно, не превышает половины ширины . Следовательно, если есть некоторый корень в , итерационная процедура замены на будет сходиться к этому корню. Если же, с другой стороны, нет корня в , эта итерационная процедура в конечном итоге даст пустой интервал, свидетельство отсутствия корней. 0 Ф ( Дж. ) {\displaystyle 0\not \in F'(J)} м ( Дж. ) {\displaystyle м(Дж)} Ф {\displaystyle F} я Н ( Дж. ) = { м ( Дж. ) } {\displaystyle В(Дж)=\{м(Дж)\}} м ( Дж. ) я Н ( Дж. ) {\displaystyle m(J)\not \in IN(J)} Дж. Н ( Дж. ) {\displaystyle J\cap N(J)} Дж. {\displaystyle J} Ф {\displaystyle F} Дж. {\displaystyle J} Дж. {\displaystyle J} Дж. я Н ( Дж. ) {\displaystyle J\cap IN(J)} Ф {\displaystyle F} Дж. {\displaystyle J}

Аналоги этого подхода для более высоких размерностей см . в интервальном методе Ньютона .

Метод Кравчика

Пусть будет любой обратимой матрицей в . Обычно берут, чтобы быть приближением к . Затем определяют функцию Мы видим, что является фиксированным значением тогда и только тогда, когда является корнем . Поэтому описанный выше подход можно использовать для определения корней . Этот подход аналогичен многомерной версии метода Ньютона, заменяющей производную фиксированной матрицей . И {\displaystyle Y} н × н {\displaystyle n\times n} Г Л ( н , Р ) {\displaystyle GL(n,\mathbb {R} )} И {\displaystyle Y} Ф ( у ) 1 {\displaystyle F'(y)^{-1}} Г ( х ) = х И Ф ( х ) . {\displaystyle G(x)=x-YF(x).} х {\displaystyle x} Г {\displaystyle G} х {\displaystyle x} Ф {\displaystyle F} Ф {\displaystyle F} И {\displaystyle Y}

Заметим, что если — компактная и выпуклая область и , то для любого существуют такие, что Дж. {\displaystyle J} у Дж. {\displaystyle y\in J} х Дж. {\displaystyle x\in J} с 1 , , с н Дж. {\displaystyle c_{1},\dots ,c_{n}\in J}

Г ( у ) Г ( х ) = [ г 1 ( с 1 ) Т г н ( с н ) Т ] ( у х ) . {\displaystyle G(y)-G(x)={\begin{bmatrix}\nabla g_{1}(c_{1})^{T}\\\vdots \\\nabla g_{n}(c_{n})^{T}\end{bmatrix}}(yx).}

Пусть будет матрицей Якоби для , оцененной на . Другими словами, запись состоит из образа над . Тогда следует, что где произведение матрицы на вектор вычисляется с использованием интервальной арифметики. Затем, допуская варьирование в , следует, что образ на удовлетворяет следующему включению: где вычисления, еще раз, вычисляются с использованием интервальной арифметики. Объединяя это с формулой для , результатом является оператор Кравчика Г ( Дж. ) {\displaystyle G'(J)} Г {\displaystyle G} Дж. {\displaystyle J} ( Г ( Дж. ) ) я дж {\displaystyle (G'(J))_{ij}} г я х дж {\displaystyle {\frac {\partial g_{i}}{\partial x_{j}}}} Дж. {\displaystyle J} Г ( х ) Г ( у ) + Г ( Дж. ) ( х у ) , {\displaystyle G(x)\in G(y)+\nabla G(J)(xy),} х {\displaystyle x} Дж. {\displaystyle J} Г {\displaystyle G} Дж. {\displaystyle J} Г ( Дж. ) Г ( у ) + Г ( Дж. ) ( Дж. у ) , {\displaystyle G(J)\subset G(y)+G'(J)(Jy),} Г {\displaystyle G}

К у , И ( Дж. ) = у И Ф ( у ) + ( я Ф ( Дж. ) ) ( Дж. у ) , {\displaystyle K_{y,Y}(J)=y-YF(y)+(IF'(J))(Jy),}

где — единичная матрица. я {\displaystyle Я}

Если , то имеет неподвижную точку в , т.е. имеет корень в . С другой стороны, если максимальная матричная норма с использованием супремум-нормы для векторов всех матриц в меньше , то является сжимающей в пределах , поэтому имеет единственную неподвижную точку. К у , И ( Дж. ) Дж. {\displaystyle K_{y,Y}(J)\subset J} Г {\displaystyle G} Дж. {\displaystyle J} Ф {\displaystyle F} Дж. {\displaystyle J} я Ф ( Дж. ) {\displaystyle ЕСЛИ '(J)} 1 {\displaystyle 1} Г {\displaystyle G} Дж. {\displaystyle J} Г {\displaystyle G}

Более простой тест, когда является параллелепипедом, выровненным по осям, использует , т.е. середину . В этом случае существует единственный корень , если Дж. {\displaystyle J} у = м ( Дж. ) {\displaystyle y=m(J)} Дж. {\displaystyle J} Ф {\displaystyle F}

К ( Х ) м ( Х ) < ж ( Х ) 2 , {\displaystyle \|K(X)-m(X)\|<{\frac {w(X)}{2}},}

где - длина самой длинной стороны . ж ( Х ) {\displaystyle w(X)} Дж. {\displaystyle J}

тест Миранды

  • Тест Миранды (Яп, Вегтер, Шарма)

Априориметоды сертификации

  • Интервальная арифметика (Мур, Арб, Меззаробба)
  • Числа состояний (Белтран–Лейкин)

Интервальная арифметика

Интервальная арифметика может использоваться для предоставления априорного числового сертификата путем вычисления интервалов, содержащих уникальные решения. Используя интервалы вместо простых числовых типов во время отслеживания пути, результирующие кандидаты представляются интервалами. Кандидат-интервал решения сам по себе является сертификатом, в том смысле, что решение гарантированно находится внутри интервала.

Номера состояний

Числовая алгебраическая геометрия решает полиномиальные системы, используя методы продолжения гомотопии и отслеживания пути. Контролируя число условий для отслеживаемой гомотопии на каждом шаге и гарантируя, что никакие два пути решения никогда не пересекаются, можно вычислить числовой сертификат вместе с решением. Эта схема называется априорным отслеживанием пути. [3]

Несертифицированное численное отслеживание пути опирается на эвристические методы для контроля размера временного шага и точности. [4] Напротив, априори сертифицированное отслеживание пути выходит за рамки эвристики, обеспечивая контроль размера шага, который гарантирует , что для каждого шага по пути текущая точка находится в области квадратичной сходимости для текущего пути.

Ссылки

  1. ^ Смейл, Стив (1986). «Метод Ньютона оценивает данные в одной точке». Слияние дисциплин: новые направления в чистой, прикладной и вычислительной математике : 185–196 .
  2. ^ Хауенштейн, Джонатан; Соттиле, Франк (2012). «Алгоритм 921: alphaCertified: сертификация решений полиномиальных систем». ACM Transactions on Mathematical Software . 38 (4): 28. doi :10.1145/2331130.2331136.
  3. ^ Бельтран, Карлос; Лейкин, Антон (2012). «Сертифицированное численное отслеживание гомотопии». Экспериментальная математика . 21 (1): 69–83 .
  4. ^ Бейтс, Дэниел; Хауенштейн, Джонатан; Соммес, Эндрю; Уомплер, Чарльз (2009). «Управление размером шага для отслеживания пути». Contemporary Mathematics . 496 (21).
Взято с "https://en.wikipedia.org/w/index.php?title=Числовая_сертификация&oldid=918456593"