Теорема Бейкера

Об алгебраической независимости логарифмов

В теории трансцендентных чисел , математической дисциплине, теорема Бейкера дает нижнюю границу для абсолютного значения линейных комбинаций логарифмов алгебраических чисел . Почти пятнадцатью годами ранее Александр Гельфонд считал, что задача с целыми коэффициентами имеет «чрезвычайно большое значение». [1] Результат , доказанный Аланом Бейкером  (1966, 1967a, 1967b), включил в себя многие более ранние результаты в теории трансцендентных чисел. Бейкер использовал это для доказательства трансцендентности многих чисел, для вывода эффективных границ для решений некоторых диофантовых уравнений и для решения проблемы числа классов нахождения всех мнимых квадратичных полей с числом класса 1.

История

Для упрощения обозначений пусть будет множеством логарифмов по основанию e ненулевых алгебраических чисел , то есть где обозначает множество комплексных чисел , а обозначает алгебраические числа (алгебраическое замыкание рациональных чисел ). Используя эти обозначения, несколько результатов в теории трансцендентных чисел становятся гораздо проще для формулировки. Например, теорема Эрмита–Линдемана становится утверждением о том, что любой ненулевой элемент является трансцендентным. Л {\displaystyle \mathbb {L} } Л = { λ С :   е λ В ¯ } , {\displaystyle \mathbb {L} =\left\{\lambda \in \mathbb {C} :\ e^{\lambda }\in {\overline {\mathbb {Q} }}\right\},} С {\displaystyle \mathbb {C} } В ¯ {\displaystyle {\overline {\mathbb {Q} }}} В {\displaystyle \mathbb {Q} } Л {\displaystyle \mathbb {L} }

В 1934 году Александр Гельфонд и Теодор Шнайдер независимо доказали теорему Гельфонда–Шнайдера . Этот результат обычно формулируется так: если является алгебраическим и не равно 0 или 1, и если является алгебраическим и иррациональным, то является трансцендентным. Экспоненциальная функция является многозначной для комплексных показателей, и это применимо ко всем ее значениям, которые в большинстве случаев составляют бесконечно много чисел. Эквивалентно, однако, она говорит, что если являются линейно независимы над рациональными числами, то они линейно независимы над алгебраическими числами. Таким образом, если и не равно нулю, то частное является либо рациональным числом, либо трансцендентным. Оно не может быть алгебраическим иррациональным числом, таким как . а {\displaystyle а} б {\displaystyle б} а б {\displaystyle а^{б}} λ 1 , λ 2 Л {\displaystyle \lambda _{1},\lambda _{2}\in \mathbb {L} } λ 1 , λ 2 Л {\displaystyle \lambda _{1},\lambda _{2}\in \mathbb {L} } λ 2 {\displaystyle \лямбда _{2}} λ 1 / λ 2 {\displaystyle \lambda _{1}/\lambda _{2}} 2 {\displaystyle {\sqrt {2}}}

Хотя доказательство этого результата «рациональная линейная независимость влечет алгебраическую линейную независимость» для двух элементов было достаточным для его и Шнайдера результата, Гельфонд счел важным распространить этот результат на произвольное число элементов Действительно, из Гельфонда (1960, стр. 177): L {\displaystyle \mathbb {L} } L . {\displaystyle \mathbb {L} .}

...можно предположить, ...что наиболее актуальной проблемой в теории трансцендентных чисел является исследование мер трансцендентности конечных множеств логарифмов алгебраических чисел.

Эта задача была решена четырнадцать лет спустя Аланом Бейкером и с тех пор имела многочисленные применения не только в теории трансцендентности, но и в алгебраической теории чисел и изучении диофантовых уравнений . Бейкер получил медаль Филдса в 1970 году как за эту работу, так и за ее применение к диофантовым уравнениям.

Заявление

С учетом вышеприведенных обозначений теорема Бейкера является неоднородным обобщением теоремы Гельфонда–Шнайдера. В частности, она утверждает:

Теорема Бейкера  —  Если линейно независимы над рациональными числами, то для любых алгебраических чисел, не все из которых равны нулю, имеем где H — максимальная из высот , а Cэффективно вычислимое число, зависящее от n , и максимальная из степеней d (если β 0 не равно нулю, то предположение о линейной независимости можно отбросить). В частности, это число отлично от нуля, поэтому 1 и линейно независимы над алгебраическими числами. λ 1 , , λ n L {\displaystyle \lambda _{1},\ldots ,\lambda _{n}\in \mathbb {L} } β 0 , , β n , {\displaystyle \beta _{0},\ldots ,\beta _{n},} | β 0 + β 1 λ 1 + + β n λ n | > H C {\displaystyle \left|\beta _{0}+\beta _{1}\lambda _{1}+\cdots +\beta _{n}\lambda _{n}\right|>H^{-C}} β i {\displaystyle \beta _{i}} λ i {\displaystyle \lambda _{i}} β i . {\displaystyle \beta _{i}.} λ i {\displaystyle \lambda _{i}} λ i {\displaystyle \lambda _{i}}

Так же как теорема Гельфонда–Шнайдера эквивалентна утверждению о трансцендентности чисел вида a b , так и теорема Бейкера влечет трансцендентность чисел вида

a 1 b 1 a n b n , {\displaystyle a_{1}^{b_{1}}\cdots a_{n}^{b_{n}},}

где все b i являются алгебраическими, иррациональными, а 1, b 1 , ..., b n линейно независимы относительно рациональных чисел, а все a i являются алгебраическими и не равны 0 или 1.

Бейкер (1977) также дал несколько версий с явными константами. Например, если имеет высоту не более и все числа имеют высоту не более , то линейная форма exp ( λ j ) = α j {\displaystyle \exp(\lambda _{j})=\alpha _{j}} A j 4 {\displaystyle A_{j}\geq 4} β j {\displaystyle \beta _{j}} B 4 {\displaystyle B\geq 4}

Λ = β 0 + β 1 λ 1 + + β n λ n {\displaystyle \Lambda =\beta _{0}+\beta _{1}\lambda _{1}+\cdots +\beta _{n}\lambda _{n}}

либо 0, либо удовлетворяет

log | Λ | > ( 16 n d ) 200 n Ω ( log Ω log log A n ) ( log B + log Ω ) {\displaystyle \log |\Lambda |>(16nd)^{200n}\Omega \left(\log \Omega -\log \log A_{n}\right)(\log B+\log \Omega )}

где

Ω = log A 1 log A 2 log A n {\displaystyle \Omega =\log A_{1}\log A_{2}\cdots \log A_{n}}

и поле, порожденное рациональными числами и над ними, имеет степень не выше d . В особом случае, когда β 0 = 0 и все являются рациональными целыми числами, самый правый член log Ω можно удалить. α i {\displaystyle \alpha _{i}} β i {\displaystyle \beta _{i}} β j {\displaystyle \beta _{j}}

Явный результат Бейкера и Вюстхольца для линейной формы Λ с целыми коэффициентами дает нижнюю границу вида

log | Λ | > C h ( α 1 ) h ( α 2 ) h ( α n ) log ( max { | β 1 | , , | β n | } ) , {\displaystyle \log |\Lambda |>-Ch(\alpha _{1})h(\alpha _{2})\cdots h(\alpha _{n})\log \left(\max \left\{|\beta _{1}|,\ldots ,|\beta _{n}|\right\}\right),}

где

C = 18 ( n + 1 ) ! n n + 1 ( 32 d ) n + 2 log ( 2 n d ) , {\displaystyle C=18(n+1)!n^{n+1}(32d)^{n+2}\log(2nd),}

а d - степень числового поля, генерируемого α i . {\displaystyle \alpha _{i}.}

Метод Бейкера

Доказательство Бейкера своей теоремы является развитием рассуждений, данных Гельфондом (1960, глава III, раздел 4). Основные идеи доказательства иллюстрируются доказательством следующего качественного варианта теоремы Бейкера (1966), описанного Серром (1971):

Если числа линейно независимы относительно рациональных чисел, то для ненулевых алгебраических чисел они линейно независимы относительно алгебраических чисел. 2 π i , log a 1 , , log a n {\displaystyle 2\pi i,\log a_{1},\ldots ,\log a_{n}} a 1 , , a n , {\displaystyle a_{1},\ldots ,a_{n},}

Точную количественную версию теории Бейкера можно доказать, заменив условия, согласно которым все вещи равны нулю, на условия, согласно которым все вещи достаточно малы на протяжении всего доказательства.

Основная идея доказательства Бейкера заключается в построении вспомогательной функции нескольких переменных, которая обращается в нуль до высокого порядка во многих точках формы, а затем многократном показе того, что она обращается в нуль до более низкого порядка в еще большем количестве точек этой формы. Наконец, тот факт, что она обращается в нуль (до порядка 1) в достаточном количестве точек этой формы, подразумевает, используя определители Вандермонда , что существует мультипликативное отношение между числами a i . Φ ( z 1 , , z n 1 ) {\displaystyle \Phi (z_{1},\ldots ,z_{n-1})} z 1 = = z n 1 = l , {\displaystyle z_{1}=\cdots =z_{n-1}=l,}

Построение вспомогательной функции

Предположим, что существует связь

β 1 log α 1 + + β n 1 log α n 1 = log α n {\displaystyle \beta _{1}\log \alpha _{1}+\cdots +\beta _{n-1}\log \alpha _{n-1}=\log \alpha _{n}}

для алгебраических чисел α 1 , ..., α n , β 1 , ..., β n −1 . Функция Φ имеет вид

Φ ( z 1 , , z n 1 ) = λ 1 = 0 L λ n = 0 L p ( λ 1 , , λ n ) α 1 ( λ 1 + λ n β 1 ) z 1 α n 1 ( λ n 1 + λ n β n 1 ) z n 1 {\displaystyle \Phi (z_{1},\ldots ,z_{n-1})=\sum _{\lambda _{1}=0}^{L}\cdots \sum _{\lambda _{n}=0}^{L}p(\lambda _{1},\ldots ,\lambda _{n})\alpha _{1}^{(\lambda _{1}+\lambda _{n}\beta _{1})z_{1}}\cdots \alpha _{n-1}^{(\lambda _{n-1}+\lambda _{n}\beta _{n-1})z_{n-1}}}

Целочисленные коэффициенты p выбираются так, чтобы они не были все равны нулю, а Φ и его производные порядка не выше некоторой константы M обращаются в нуль при для целых чисел с для некоторой константы h . Это возможно, поскольку эти условия являются однородными линейными уравнениями относительно коэффициентов p , которые имеют ненулевое решение при условии, что число неизвестных переменных p больше числа уравнений. Линейное соотношение между логарифмами α необходимо для сокращения числа линейных уравнений, которые должны быть удовлетворены. Более того, используя лемму Зигеля , размеры коэффициентов p можно выбрать не слишком большими. Константы L , h , и M должны быть тщательно скорректированы, чтобы следующая часть доказательства работала, и подчиняются некоторым ограничениям, которые примерно таковы: z 1 = = z n 1 = l , {\displaystyle z_{1}=\cdots =z_{n-1}=l,} l {\displaystyle l} 0 l h {\displaystyle 0\leq l\leq h}

  • L должно быть несколько меньше M , чтобы приведенное ниже рассуждение о дополнительных нулях работало.
  • Малая степень h должна быть больше L , чтобы последний шаг доказательства сработал.
  • L n должно быть больше, чем примерно M n −1 h, чтобы можно было найти коэффициенты p .

Ограничения можно удовлетворить, взяв h достаточно большим, M — некоторой фиксированной степенью h , а L — немного меньшей степенью h . Бейкер взял M примерно равным h 2 , а L — примерно равным h 2−1/2 n .

Линейное соотношение между логарифмами α используется для небольшого уменьшения L ; грубо говоря, без него условие L n должно быть больше, чем примерно M n −1 h превратилось бы в L n должно быть больше, чем примерно M n h , что несовместимо с условием, что L несколько меньше M .

Нули вспомогательной функции

Следующий шаг — показать, что Φ обращается в ноль в немного меньших порядках во многих других точках формы для целых чисел l . Эта идея была ключевым нововведением Бейкера: предыдущая работа над этой проблемой включала попытки увеличить количество производных, которые обращаются в ноль, сохраняя при этом фиксированное количество точек, что, по-видимому, не работает в случае нескольких переменных. Это делается путем объединения двух идей; во-первых, показывается, что производные в этих точках довольно малы, используя тот факт, что многие производные Φ обращаются в ноль во многих близлежащих точках. Затем показывается, что производные Φ в этой точке задаются алгебраическими целыми числами, умноженными на известные константы. Если алгебраическое целое число имеет все свои сопряженные элементы, ограниченные известной константой, то оно не может быть слишком малым, если только оно не равно нулю, потому что произведение всех сопряженных элементов ненулевого алгебраического целого числа по абсолютной величине равно по крайней мере 1. Объединение этих двух идей подразумевает, что Φ исчезает до немного меньшего порядка во многих других точках. Эта часть аргумента требует, чтобы Φ не увеличивалась слишком быстро; рост Φ зависит от размера L , поэтому требует ограничения на размер L , которое, грубо говоря, заключается в том, что L должен быть несколько меньше M . Точнее, Бейкер показал, что поскольку Φ исчезает до порядка M при h последовательных целых числах, он также исчезает до порядка M /2 при h 1+1/8 n последовательных целых числах 1, 2, 3, .... Повторение этого аргумента J раз показывает, что Φ исчезает до порядка M /2 J при h 1+ J /8 n точках, при условии, что h достаточно велико, а L несколько меньше M /2 J . z 1 = = z n 1 = l {\displaystyle z_{1}=\cdots =z_{n-1}=l} z 1 = = z n 1 = l . {\displaystyle z_{1}=\cdots =z_{n-1}=l.}

Затем берется достаточно большое значение J, при котором:

h 1 + J 8 n > ( L + 1 ) n . {\displaystyle h^{1+{\frac {J}{8n}}}>(L+1)^{n}.}

( J больше, чем примерно 16 n подойдет, если h 2 > L ), так что:

l { 1 , 2 , , ( L + 1 ) n } : Φ ( l , , l ) = 0. {\displaystyle \forall l\in \left\{1,2,\ldots ,(L+1)^{n}\right\}:\qquad \Phi (l,\ldots ,l)=0.}

Завершение доказательства

По определению можно записать как: Φ ( l , , l ) = 0 {\displaystyle \Phi (l,\ldots ,l)=0}

λ 1 = 0 L λ n = 0 L p ( λ 1 , , λ n ) α 1 λ 1 l α n λ n l = 0. {\displaystyle \sum _{\lambda _{1}=0}^{L}\cdots \sum _{\lambda _{n}=0}^{L}p(\lambda _{1},\ldots ,\lambda _{n})\alpha _{1}^{\lambda _{1}l}\cdots \alpha _{n}^{\lambda _{n}l}=0.}

Поэтому при изменении l мы имеем систему из ( L + 1) n однородных линейных уравнений относительно ( L + 1) n неизвестных, которая по предположению имеет ненулевое решение, что, в свою очередь, подразумевает, что определитель матрицы коэффициентов должен исчезать. Однако эта матрица является матрицей Вандермонда , и формула для определителя такой матрицы вынуждает равенство между двумя значениями:

α 1 λ 1 α n λ n {\displaystyle \alpha _{1}^{\lambda _{1}}\cdots \alpha _{n}^{\lambda _{n}}}

так что мультипликативно зависимы. Взятие логарифмов показывает, что они линейно зависимы по рациональным числам. α 1 , , α n {\displaystyle \alpha _{1},\ldots ,\alpha _{n}} 2 π i , log α 1 , , log α n {\displaystyle 2\pi i,\log \alpha _{1},\ldots ,\log \alpha _{n}}

Расширения и обобщения

Бейкер (1966) фактически дал количественную версию теоремы, дав эффективные нижние границы для линейной формы в логарифмах. Это делается с помощью похожего аргумента, за исключением того, что утверждения о чем-то, равном нулю, заменяются утверждениями, дающими небольшую верхнюю границу для этого, и так далее.

Бейкер (1967a) показал, как исключить предположение о 2π i в теореме. Это требует модификации последнего шага доказательства. Можно показать, что многие производные функции обращаются в нуль при z = 0, с помощью аргумента, аналогичного приведенному выше. Но эти уравнения для первых ( L +1) n производных снова дают однородный набор линейных уравнений для коэффициентов p , поэтому определитель равен нулю и снова является определителем Вандермонда, на этот раз для чисел λ 1 log α 1 + ⋯ + λ n log α n . Таким образом, два из этих выражений должны быть одинаковыми, что показывает, что log α 1 ,...,log α n линейно зависимы над рациональными числами. ϕ ( z ) = Φ ( z , , z ) {\displaystyle \phi (z)=\Phi (z,\ldots ,z)}

Бейкер (1967b) дал неоднородную версию теоремы, показав, что

β 0 + β 1 log α 1 + + β n log α n {\displaystyle \beta _{0}+\beta _{1}\log \alpha _{1}+\cdots +\beta _{n}\log \alpha _{n}}

не равен нулю для ненулевых алгебраических чисел β 0 , ..., β n , α 1 , ..., α n , и, более того, дает для него эффективную нижнюю границу. Доказательство аналогично однородному случаю: можно предположить, что

β 0 + β 1 log α 1 + + β n 1 log α n 1 = log α n {\displaystyle \beta _{0}+\beta _{1}\log \alpha _{1}+\cdots +\beta _{n-1}\log \alpha _{n-1}=\log \alpha _{n}}

и вставляем дополнительную переменную z 0 в Φ следующим образом:

Φ ( z 0 , , z n 1 ) = λ 0 = 0 L λ n = 0 L p ( λ 0 , , λ n ) z 0 λ 0 e λ n β 0 z 0 α 1 ( λ 1 + λ n β 1 ) z 1 α n 1 ( λ n 1 + λ n β n 1 ) z n 1 {\displaystyle \Phi (z_{0},\ldots ,z_{n-1})=\sum _{\lambda _{0}=0}^{L}\cdots \sum _{\lambda _{n}=0}^{L}p(\lambda _{0},\ldots ,\lambda _{n})z_{0}^{\lambda _{0}}e^{\lambda _{n}\beta _{0}z_{0}}\alpha _{1}^{(\lambda _{1}+\lambda _{n}\beta _{1})z_{1}}\cdots \alpha _{n-1}^{(\lambda _{n-1}+\lambda _{n}\beta _{n-1})z_{n-1}}}

Следствия

Как упоминалось выше, теорема включает в себя многочисленные более ранние результаты трансцендентности, касающиеся показательной функции, такие как теорема Эрмита–Линдемана и теорема Гельфонда–Шнайдера. Она не столь всеобъемлюща, как все еще недоказанная гипотеза Шануэля , и не подразумевает теорему о шести экспонентах, ни, очевидно, все еще открытую гипотезу о четырех экспонентах .

Основная причина, по которой Гельфонд желал расширения своего результата, заключалась не только в появлении множества новых трансцендентных чисел. В 1935 году он использовал инструменты, которые он разработал для доказательства теоремы Гельфонда–Шнайдера , чтобы вывести нижнюю границу для величины

| β 1 λ 1 + β 2 λ 2 | {\displaystyle |\beta _{1}\lambda _{1}+\beta _{2}\lambda _{2}|}

где β 1 и β 2 являются алгебраическими, а λ 1 и λ 2 находятся в . [2] Доказательство Бейкера дало нижние границы для величин, подобных приведенным выше, но с произвольным числом членов, и он мог использовать эти границы для разработки эффективных средств решения диофантовых уравнений и решения проблемы Гаусса о числе классов . L {\displaystyle \mathbb {L} }

Расширения

Теорема Бейкера предоставляет нам линейную независимость над алгебраическими числами логарифмов алгебраических чисел. Это слабее, чем доказательство их алгебраической независимости . До сих пор не было достигнуто никакого прогресса в решении этой проблемы. Было высказано предположение [3] , что если λ 1 , ..., λ n являются элементами , которые линейно независимы над рациональными числами, то они также алгебраически независимы. Это частный случай гипотезы Шануэля, но до сих пор остается доказать, что существуют даже два алгебраических числа, логарифмы которых алгебраически независимы. Действительно, теорема Бейкера исключает линейные отношения между логарифмами алгебраических чисел, если для этого нет тривиальных причин; следующий по простоте случай, исключение однородных квадратичных отношений, является все еще открытой гипотезой о четырех экспоненциалах . L {\displaystyle \mathbb {L} }

Аналогично, расширение результата до алгебраической независимости, но в p-адической постановке, и использование функции p -адического логарифма , остается открытой проблемой. Известно, что доказательство алгебраической независимости линейно независимых p -адических логарифмов алгебраических p -адических чисел доказало бы гипотезу Леопольда о p -адических рангах единиц числового поля.

Смотрите также

Примечания

  1. См. последний абзац Гельфонда (1960).
  2. ^ Подробности см. в работах Гельфонда (1960) и Спринджука (1993).
  3. ^ Вальдшмидт (2000), гипотеза 1.15.

Ссылки

Retrieved from "https://en.wikipedia.org/w/index.php?title=Baker%27s_theorem&oldid=1221116536"