This article needs additional citations for verification. (December 2018) |
Bitcrusher — это аудиоэффект , который создает искажение , уменьшая разрешение или полосу пропускания цифровых аудиоданных . Результирующий шум квантования может создавать «более теплое» или резкое звуковое впечатление, в зависимости от степени уменьшения.
Типичный биткрашер использует два метода снижения точности звука: снижение частоты дискретизации и снижение разрешения.
Цифровое аудио состоит из быстрой серии числовых выборок, которые кодируют изменяющуюся амплитуду звуковой волны. Для точного представления широкополосной волны значительной длительности цифровому аудио требуется большое количество выборок с высокой частотой дискретизации. Чем выше частота, тем точнее форма волны; более низкая частота требует, чтобы исходный аналоговый сигнал был отфильтрован низкочастотными фильтрами для ограничения максимальной частотной составляющей в сигнале, иначе высокочастотные компоненты сигнала будут накладываться друг на друга . В частности, частота дискретизации (т. е. частота дискретизации) должна быть как минимум в два раза больше максимальной частотной составляющей в сигнале; эта максимальная частота сигнала, равная половине частоты дискретизации, называется пределом Найквиста .
Хотя распространено заблуждение, что частота дискретизации влияет на «гладкость» представленной в цифровом виде формы сигнала, это не так; теория дискретизации гарантирует, что вплоть до максимальной частоты сигнала, поддерживаемой частотой дискретизации (т. е. предела Найквиста), цифровой (дискретный) сигнал будет точно представлять аналоговый (непрерывный) источник, за исключением искажения шума квантования, возникающего из-за конечной точности отдельных выборок. Исходный сигнал можно точно реконструировать, просто обходя дискретный сигнал нижних частот через идеальный фильтр нижних частот (с идеальным вертикальным профилем среза). Однако, поскольку идеальный фильтр построить невозможно, необходимо использовать реальный фильтр с постепенным переходом между полосой пропускания и полосой задерживания, в результате чего невозможно точно записать все частоты вплоть до предела Найквиста для заданной частоты дискретизации. Решение состоит в том, чтобы увеличить частоту дискретизации на величину, которая учитывает переходные полосы фильтров, используемых как для дискретизации, так и для непрерывной реконструкции; Вот почему, например, компакт-диски используют частоту дискретизации 44,1 кГц для записи звука, который редко превышает 20 кГц, хотя предел Найквиста для этой частоты дискретизации составляет 22,05 кГц. Другое соображение заключается в том, что для идеальной реконструкции образцы должны быть представлены как идеальные импульсы бесконечно малой длительности, но все реальное оборудование генерирует прямоугольные импульсы для образцов; некоторые низкокачественные устройства цифро-аналогового преобразования используют преобразование ступенчатой волны, которое по сути выводит образцы как прямоугольные импульсы, имеющие длительность, равную периоду дискретизации. В этом случае также увеличение частоты дискретизации может уменьшить и компенсировать результирующее искажение. Тем не менее, нельзя переоценить, что, независимо от его мотивации, дополнительный запас, добавленный к частоте дискретизации, не делает восстановленную форму волны более гладкой, он просто предотвращает наложение частот в переходной полосе к более низким частотам, что могло бы нелинейно исказить сигнал.
Сегодня DAW обычно используют частоту дискретизации 44,1 кГц или выше. Раннее цифровое оборудование использовало гораздо более низкие частоты дискретизации для экономии памяти для сохраненного аудио. Например, Speak & Spell 1979 года использовал частоту дискретизации 8 кГц.
Снижение частоты дискретизации (также называемое понижением частоты дискретизации) намеренно снижает частоту дискретизации для ухудшения качества звука. При снижении частоты дискретизации высокие частоты накладываются друг на друга или, если цифровой сигнал сначала фильтруется фильтром нижних частот, они теряются. Если используется примитивный ЦАП с пошаговой волной или если частота среза фильтра ЦАП не регулируется для отслеживания частоты дискретизации, а вместо этого фиксируется на уровне половины частоты Найквиста для максимально поддерживаемой частоты дискретизации, то формы волн также становятся более «грубыми». При экстремальном снижении форма волны становится металлической из-за сильного наложения частот и, возможно, нелинейных искажений из-за плохо настроенного цифро-аналогового преобразования. (Обратите внимание, что всех этих эффектов можно избежать, если сигнал фильтруется фильтром нижних частот перед понижением частоты дискретизации и если параметры ЦАП для воспроизведения соответствуют пониженной частоте дискретизации; тогда форма волны просто звучит ограниченно, как телефон, AM-радио с четким приемом или магнитофон на низкой скорости ленты.)
Сэмплы в цифровом аудио записываются как целые числа или числа с плавающей точкой, хранящиеся в цифровой памяти. Эти числа кодируются с помощью серии включенных и выключенных битов памяти. Чем больше число бит, тем точнее сэмпл кодирует мгновенный уровень громкости сэмплированной звуковой волны. Сегодня DAW обычно используют 32-битные числа с плавающей точкой, поскольку они больше подходят для последовательной многослойной обработки и микширования, но конечный основной выход обычно состоит из 16-битных или 24-битных целочисленных сэмплов. Раннее цифровое аудиооборудование и видеоигры использовали 8-битные целочисленные сэмплы или меньше. Классическая драм-машина TR-909 компании Roland использовала 6-битные целочисленные сэмплы. Количество бит, используемых в каждом сэмпле, напрямую влияет на соотношение сигнал/шум и динамический диапазон цифрового сигнала, в частности, определяя амплитуду шума, называемого шумом квантования , который похож на белый шум, отфильтрованный низкими частотами.
Уменьшение разрешения намеренно уменьшает количество бит, используемых для аудиосэмплов. По мере уменьшения битовой глубины формы волн становятся более шумными, а тонкие изменения громкости теряются, что снижает динамический диапазон на нижнем конце. При экстремальном уменьшении битов формы волн сводятся к щелчкам и жужжанию ( квадратным волнам ), поскольку форма волны резко прыгает от низкого к высокому и обратно без промежуточных значений, при этом многие более низкие пики сглаживаются до нулевой амплитуды.
Эффекты Bitcrusher обычно имеют как минимум два элемента управления: один уменьшает частоту дискретизации, а другой уменьшает разрешение.
Регулятор или ползунок для уменьшения разрешения (также известный как «битовая глубина», «глубина» или «биты») обычно регулируется от 32 бит до 1 бита.
Программное обеспечение LossyWAV Дэвида Робинсона и Ника Карри вычисляет минимальную битовую глубину для представления каждого сегмента формы волны PCM без слышимых искажений. Хотя оно предназначено как препроцессор для снижения битрейта при сжатии звука , понижение настройки качества приводит к искажению bitcrush. [1]
Управление снижением частоты дискретизации (также известное как «понижение частоты дискретизации» или «усреднение») иногда отображается в Гц для новой частоты дискретизации или как коэффициент снижения. Иногда снижение частоты дискретизации отображается как количество последовательных выборок для усреднения вместе для создания новой выборки. Значение 20 снижает частоту дискретизации до 1/20 от ее исходной частоты.