В информатике субнормальные числа — это подмножество денормализованных чисел (иногда называемых денормалами ), которые заполняют зазор вокруг нуля в арифметике с плавающей точкой . Любое ненулевое число с величиной, меньшей наименьшего положительного нормального числа, является субнормальным , в то время как денормал может также относиться к числам за пределами этого диапазона.
Форматы с плавающей точкой |
---|
IEEE 754 |
|
Другой |
Альтернативы |
Конусная плавающая точка |
В некоторых старых документах (особенно в документах стандартов, таких как начальные выпуски IEEE 754 и язык C ) термин «денормальный» используется для обозначения исключительно субнормальных чисел. Такое использование сохраняется в различных документах стандартов, особенно при обсуждении оборудования, которое не способно представлять какие-либо другие денормализованные числа, но в данном обсуждении термин «субнормальный» используется в соответствии с редакцией IEEE 754 2008 года . В неформальных обсуждениях термины субнормальный и денормальный часто используются взаимозаменяемо, отчасти потому, что нет денормализованных двоичных чисел IEEE за пределами субнормального диапазона.
Термин «число» используется довольно свободно, для описания определенной последовательности цифр, а не математической абстракции; см. Арифметика с плавающей точкой для получения подробной информации о том, как действительные числа соотносятся с представлениями с плавающей точкой. «Представление» вместо «числа» может использоваться, когда требуется ясность.
Математические действительные числа могут быть аппроксимированы несколькими представлениями с плавающей точкой. Одно представление определяется как нормальное , а другие определяются как субнормальное , ненормальное или ненормальное по их отношению к нормальному .
В обычном значении с плавающей точкой начальные нули в мантиссе (также обычно называемой мантиссой) отсутствуют ; вместо этого начальные нули удаляются путем корректировки показателя степени (например, число 0,0123 будет записано как1,23 × 10 −2 ). Наоборот, денормализованное значение с плавающей точкой имеет мантиссу с ведущей цифрой, равной нулю. Из них субнормальные числа представляют значения, которые при нормализации имели бы показатели ниже наименьшего представимого показателя (показатель имеет ограниченный диапазон).
Мантисса (или мантисса) числа с плавающей точкой IEEE — это часть числа с плавающей точкой, которая представляет значимые цифры . Для положительного нормализованного числа его можно представить как m 0 . m 1 m 2 m 3 ... m p −2 m p −1 (где m представляет значимую цифру, а p — точность) с ненулевым m 0 . Обратите внимание, что для двоичной системы счисления ведущая двоичная цифра всегда равна 1. В субнормальном числе, поскольку показатель степени является наименьшим возможным значением, ноль является ведущей значащей цифрой (0. m 1 m 2 m 3 ... m p −2 m p −1 ), что позволяет представлять числа, более близкие к нулю, чем наименьшее нормальное число. Число с плавающей точкой может быть распознано как субнормальное, если его показатель степени имеет наименьшее возможное значение.
Заполняя таким образом пробел под переполнением, значимые цифры теряются, но не так резко, как при использовании подхода сброса в ноль при под переполнении (отбрасывая все значимые цифры при достижении под переполнении). Поэтому создание субнормального числа иногда называют постепенным под переполнением, потому что это позволяет вычислению медленно терять точность, когда результат мал.
В IEEE 754-2008 ненормальные числа переименованы в субнормальные числа и поддерживаются как в двоичном, так и в десятичном формате. В двоичных форматах обмена субнормальные числа кодируются смещенной экспонентой 0, но интерпретируются со значением наименьшей допустимой экспоненты, которая на единицу больше (т. е. как если бы она была закодирована как 1). В десятичных форматах обмена они не требуют специального кодирования, поскольку формат напрямую поддерживает ненормализованные числа.
Математически говоря, нормализованные числа с плавающей точкой заданного знака приблизительно логарифмически распределены, и, таким образом, любое конечное число с плавающей точкой не может включать ноль . Субнормальные числа с плавающей точкой представляют собой линейно распределенный набор значений, который охватывает промежуток между отрицательными и положительными нормальными числами с плавающей точкой.
Субнормальные числа гарантируют, что сложение и вычитание чисел с плавающей точкой никогда не приведет к потере значимости; два соседних числа с плавающей точкой всегда имеют представимую ненулевую разницу. Без постепенной потери значимости вычитание a − b может привести к потере значимости и дать ноль, даже если значения не равны. Это, в свою очередь, может привести к ошибкам деления на ноль , которые не могут возникнуть при использовании постепенной потери значимости. [1]
Субнормальные числа были реализованы в Intel 8087 , пока писался стандарт IEEE 754. Они были, безусловно, самой спорной функцией в предложении формата KCS , которое в конечном итоге было принято, [2], но эта реализация продемонстрировала, что субнормальные числа могут поддерживаться в практической реализации. Некоторые реализации блоков с плавающей точкой не поддерживают субнормальные числа напрямую в оборудовании, а скорее привязываются к какой-то программной поддержке. Хотя это может быть прозрачно для пользователя, это может привести к тому, что вычисления, которые производят или потребляют субнормальные числа, будут намного медленнее, чем аналогичные вычисления с обычными числами.
В двоичных форматах с плавающей точкой IEEE субнормальные числа представлены как имеющие поле нулевой экспоненты с ненулевым полем мантиссы. [3]
Других денормализованных чисел в двоичных форматах с плавающей точкой IEEE не существует, но они существуют в некоторых других форматах, включая десятичные форматы с плавающей точкой IEEE.
Некоторые системы обрабатывают субнормальные значения на аппаратном уровне так же, как и нормальные значения. Другие оставляют обработку субнормальных значений системному программному обеспечению («assist»), обрабатывая только нормальные значения и ноль на аппаратном уровне. Обработка субнормальных значений на программном уровне всегда приводит к значительному снижению производительности. Когда субнормальные значения полностью вычисляются на аппаратном уровне, существуют методы реализации, позволяющие обрабатывать их со скоростью, сопоставимой с обычными числами. [4] Однако скорость вычислений остается значительно сниженной на многих современных процессорах x86; в крайних случаях инструкции , включающие субнормальные операнды, могут занимать до 100 дополнительных тактовых циклов, в результате чего самые быстрые инструкции выполняются в шесть раз медленнее. [5] [6]
Эта разница в скорости может быть риском безопасности. Исследователи показали, что она обеспечивает временной побочный канал , который позволяет вредоносному веб-сайту извлекать содержимое страницы с другого сайта внутри веб-браузера. [7]
Некоторые приложения должны содержать код, чтобы избежать субнормальных чисел, либо для поддержания точности, либо для того, чтобы избежать ухудшения производительности в некоторых процессорах. Например, в приложениях обработки звука субнормальные значения обычно представляют собой сигнал настолько тихий, что он находится вне диапазона человеческого слуха. Из-за этого распространенной мерой для предотвращения субнормальных значений на процессорах, где может возникнуть ухудшение производительности, является обрезание сигнала до нуля, как только он достигает субнормальных уровней, или смешивание с чрезвычайно тихим шумовым сигналом. [8] Другие методы предотвращения субнормальных чисел включают добавление смещения постоянного тока, квантование чисел, добавление сигнала Найквиста и т. д. [9] Начиная с расширения процессора SSE2 , Intel предоставила такую функциональность в аппаратном обеспечении ЦП, которая округляет субнормальные числа до нуля. [10]
Компиляторы Intel C и Fortran включают флаги DAZ
(denormals-are-zero) и FTZ
(flush-to-zero) для SSE по умолчанию для уровней оптимизации выше -O0
. [11] Эффект заключается DAZ
в том, что входные аргументы, не соответствующие норме, для операций с плавающей точкой обрабатываются как ноль, а эффект заключается в FTZ
том, что возвращается ноль вместо числа с плавающей точкой для операций, которые привели бы к числу с плавающей точкой, не соответствующему норме, даже если входные аргументы сами по себе не являются числами с плавающей точкой. Clang и gcc имеют различные состояния по умолчанию в зависимости от платформы и уровня оптимизации.
Несовместимый с C99 метод включения флагов DAZ
и FTZ
на целевых объектах, поддерживающих SSE, приведен ниже, но он не поддерживается широко. Известно, что он работает на Mac OS X по крайней мере с 2006 года. [12]
#include <fenv.h> #pragma STDC FENV_ACCESS ON // Устанавливает DAZ и FTZ, затирая другие настройки CSR. // См. https://opensource.apple.com/source/Libm/Libm-287.1/Source/Intel/, fenv.c и fenv.h. fesetenv ( FE_DFL_DISABLE_SSE_DENORMS_ENV ); // fesetenv(FE_DFL_ENV) // Отключить оба, затирая другие настройки CSR.
Для других платформ x86-SSE, где библиотека C еще не реализовала этот флаг, может работать следующее: [13]
#include <xmmintrin.h> _mm_setcsr ( _mm_getcsr ( ) | 0x0040 ); // DAZ _mm_setcsr ( _mm_getcsr () | 0x8000 ); // FTZ _mm_setcsr ( _mm_getcsr ( ) | 0x8040 ); // Оба _mm_setcsr ( _mm_getcsr () & ~ 0x8040 ); // Отключить оба
Макросы _MM_SET_DENORMALS_ZERO_MODE
и _MM_SET_FLUSH_ZERO_MODE
создают более читабельный интерфейс для кода выше. [14]
// Чтобы включить DAZ #include <pmmintrin.h> _MM_SET_DENORMALS_ZERO_MODE ( _MM_DENORMALS_ZERO_ON ); // Чтобы включить FTZ #include <xmmintrin.h> _MM_SET_FLUSH_ZERO_MODE ( _MM_FLUSH_ZERO_ON );
Большинство компиляторов уже предоставляют предыдущий макрос по умолчанию, в противном случае можно использовать следующий фрагмент кода (определение для FTZ аналогично):
#определить _MM_DENORMALS_ZERO_MASK 0x0040 #определить _MM_DENORMALS_ZERO_ON 0x0040 #определить _MM_DENORMALS_ZERO_OFF 0x0000#define _MM_SET_DENORMALS_ZERO_MODE(режим) _mm_setcsr((_mm_getcsr() & ~_MM_DENORMALS_ZERO_MASK) | (режим)) #define _MM_GET_DENORMALS_ZERO_MODE() (_mm_getcsr() & _MM_DENORMALS_ZERO_MASK)
Поведение денормализации по умолчанию предписано ABI , и поэтому корректно работающее программное обеспечение должно сохранять и восстанавливать режим денормализации перед возвратом к вызывающей стороне или вызовом кода в других библиотеках.
AArch32 NEON (SIMD) FPU всегда использует режим сброса в ноль [ требуется ссылка ] , что то же самое, что и FTZ + DAZ
. Для скалярного FPU и в AArch64 SIMD поведение сброса в ноль является необязательным и контролируется битом FZ
регистра управления – FPSCR в Arm32 и FPCR в AArch64. [15]
Один из способов сделать это:
#if defined(__arm64__) || defined(__aarch64__) uint64_t fpcr ; asm ( "mrs %0, fpcr" : "=r" ( fpcr )); //Загрузить регистр FPCR asm ( "msr fpcr, %0" :: "r" ( fpcr | ( 1 << 24 ) )); //Установить 24-й бит (FTZ) в 1 #endif
Некоторые процессоры ARM имеют аппаратную обработку субнормальных значений.