Звук может быть записан , сохранен и воспроизведен с использованием как цифровых , так и аналоговых технологий. Оба метода вносят ошибки и искажения в звук, и эти методы можно систематически сравнивать. Музыканты и слушатели спорили о превосходстве цифровой записи звука над аналоговой. Аргументы в пользу аналоговых систем включают отсутствие фундаментальных механизмов ошибок, которые присутствуют в цифровых аудиосистемах, включая наложение спектров и связанную реализацию фильтра сглаживания , джиттер и шум квантования . [1] Сторонники цифровых технологий указывают на высокие уровни производительности, возможные с цифровым аудио, включая превосходную линейность в слышимом диапазоне и низкие уровни шума и искажений. [2] : 7
Два существенных различия в производительности между двумя методами — это полоса пропускания и отношение сигнал/шум (отношение сигнал/шум). Полоса пропускания цифровой системы определяется, в соответствии с частотой Найквиста , используемой частотой дискретизации . Полоса пропускания аналоговой системы зависит от физических и электронных возможностей аналоговых схем. Отношение сигнал/шум цифровой системы может быть ограничено битовой глубиной процесса оцифровки, но электронная реализация схем преобразования вносит дополнительный шум. В аналоговой системе существуют другие естественные источники аналогового шума, такие как мерцающий шум и несовершенства в носителе записи. Другие различия в производительности характерны для сравниваемых систем, такие как способность к более прозрачным алгоритмам фильтрации в цифровых системах [3] и гармоническое насыщение и изменения скорости аналоговых систем.
Динамический диапазон аудиосистемы — это мера разницы между наименьшими и наибольшими значениями амплитуды, которые могут быть представлены в носителе. Цифровые и аналоговые системы различаются как методами передачи и хранения, так и поведением, демонстрируемым системами из-за этих методов.
Динамический диапазон цифровых аудиосистем намного превосходит возможности аналоговых аудиосистем. Потребительские аналоговые кассетные ленты имеют динамический диапазон от 50 до 75 дБ. Аналоговые FM-трансляции редко имеют динамический диапазон, превышающий 50 дБ. [4] Аналоговые студийные мастер-ленты могут иметь динамический диапазон до 77 дБ. [5] LP, изготовленный из идеального винила, будет иметь теоретический динамический диапазон 70 дБ, [6] хотя измерения показывают фактическую производительность в диапазоне от 60 до 70 дБ. [7] [ проверка не удалась ]
Сравните это с цифровой записью. Обычно 16-битная цифровая запись имеет динамический диапазон от 90 до 95 дБ. [8] : 132
Преимущества использования цифровых рекордеров с точностью более 16 бит можно применить к 16 битам аудио CD. Основатель Meridian Audio Джон Роберт Стюарт подчеркивает, что при правильном дизеринге разрешение цифровой системы теоретически бесконечно, и что возможно, например, разрешать звуки на уровне -110 дБ (ниже цифровой полной шкалы) в хорошо спроектированном 16-битном канале. [9] : 3
Существуют некоторые различия в поведении аналоговых и цифровых систем при наличии сигналов высокого уровня, когда существует вероятность того, что такие сигналы могут привести систему к перегрузке. При наличии сигналов высокого уровня аналоговая магнитная лента приближается к насыщению , а высокочастотная характеристика падает пропорционально низкочастотной характеристике. Хотя это нежелательно, слышимый эффект этого может быть разумно приемлемым. [10] Напротив, цифровые PCM-рекордеры демонстрируют неблагоприятное поведение при перегрузке; [11] : 65 выборок, которые превышают пиковый уровень квантования, просто усекаются, отсекая форму волны под прямым углом, что вносит искажение в виде большого количества высокочастотных гармоник. В принципе, цифровые PCM-системы имеют самый низкий уровень нелинейных искажений при полной амплитуде сигнала. Обратное обычно верно для аналоговых систем, где искажения имеют тенденцию увеличиваться при высоких уровнях сигнала. Исследование Мэнсона (1980) рассматривало требования к цифровой аудиосистеме для высококачественного вещания. Он пришел к выводу, что 16-битной системы будет достаточно, но отметил небольшой резерв, который система обеспечивала в обычных условиях эксплуатации. По этой причине было предложено использовать быстродействующий ограничитель сигнала или « мягкий клиппер », чтобы предотвратить перегрузку системы. [12]
Во многих записях искажения высокого уровня на пиках сигнала могут быть слышно замаскированы исходным сигналом, поэтому большие искажения могут быть приемлемы на пиковых уровнях сигнала. Разница между аналоговыми и цифровыми системами заключается в форме ошибки сигнала высокого уровня. Некоторые ранние аналого-цифровые преобразователи демонстрировали неблагоприятное поведение при перегрузке, когда сигналы перегрузки были «обвернуты» от положительного к отрицательному полному масштабу. Современные конструкции преобразователей, основанные на сигма-дельта-модуляции, могут стать нестабильными в условиях перегрузки. Обычно целью проектирования цифровых систем является ограничение сигналов высокого уровня для предотвращения перегрузки. [11] : 65 Для предотвращения перегрузки современная цифровая система может сжимать входные сигналы, чтобы цифровая полная шкала не могла быть достигнута [13] : 4
В отличие от аналогового копирования, цифровые копии являются точными копиями, которые можно копировать бесконечно и без потери поколения , в принципе. Исправление ошибок позволяет цифровым форматам выдерживать значительное ухудшение качества носителя, хотя цифровой носитель не застрахован от потери данных. Потребительские компакт-диски CD-R имеют ограниченный и переменный срок службы из-за как внутренних, так и производственных проблем с качеством. [14]
С виниловыми пластинками будет наблюдаться некоторая потеря точности при каждом воспроизведении диска. Это происходит из-за износа иглы, контактирующей с поверхностью пластинки. Магнитные ленты, как аналоговые, так и цифровые, изнашиваются из-за трения между лентой и головками, направляющими и другими частями лентопротяжного механизма, когда лента скользит по ним. Коричневый осадок, оседающий на тампонах во время очистки лентопротяжного тракта магнитофона, на самом деле представляет собой частицы магнитного покрытия, сброшенного с лент. Синдром липкого сбрасывания является распространенной проблемой старых лент. Ленты также могут страдать от складок, растяжений и загиба краев пластиковой основы ленты, особенно из-за некачественных или невыровненных ленточных дек.
При воспроизведении компакт-диска физический контакт отсутствует, поскольку данные считываются оптически с помощью лазерного луча. Следовательно, такого ухудшения носителя не происходит, и компакт-диск при надлежащем уходе будет звучать одинаково каждый раз при воспроизведении (не считая старения проигрывателя и самого компакт-диска); однако это преимущество оптической системы, а не цифровой записи, и формат Laserdisc пользуется тем же бесконтактным преимуществом с аналоговыми оптическими сигналами. Компакт-диски подвержены гниению и медленно деградируют со временем, даже если они хранятся должным образом и не воспроизводятся. [15] M-DISC , записываемая оптическая технология, которая позиционируется как остающаяся читаемой в течение 1000 лет, доступна на некоторых рынках, но по состоянию на конец 2020 года никогда не продавалась в формате CD-R . (Однако звук можно было сохранить на M-DISC DVD-R с использованием формата DVD-Audio .)
Для электронных аудиосигналов источники шума включают механический, электрический и тепловой шум в цикле записи и воспроизведения. Количество шума, которое часть аудиооборудования добавляет к исходному сигналу, можно количественно оценить. Математически это можно выразить с помощью отношения сигнал/шум (SNR или отношение сигнал/шум). Иногда вместо этого указывается максимально возможный динамический диапазон системы.
В цифровых системах качество воспроизведения зависит от шагов аналого-цифрового и цифро-аналогового преобразования и не зависит от качества носителя записи, при условии, что он адекватен для сохранения цифровых значений без ошибок. Цифровые носители, способные к бит-совершенному хранению и извлечению, уже некоторое время являются обычным явлением, поскольку они, как правило, разрабатывались для программного хранения, которое не допускает ошибок.
Процесс аналого-цифрового преобразования, согласно теории, всегда вносит искажение квантования. Это искажение может быть представлено как некоррелированный шум квантования с помощью дизеринга . Величина этого шума или искажения определяется числом уровней квантования. В двоичных системах это определяется и обычно указывается в терминах числа бит . Каждый дополнительный бит добавляет приблизительно 6 дБ к возможному SNR (например, 24 x 6 = 144 дБ для 24-битного и 120 дБ для 20-битного квантования). 16-битная цифровая система аудио-CD Red Book имеет 2 16 = 65 536 возможных амплитуд сигнала, что теоретически позволяет получить SNR 98 дБ . [2] : 49
Грохот — это форма шумовой характеристики, вызванной несовершенствами подшипников проигрывателей . Диск, как правило, имеет небольшое количество движения помимо желаемого вращения, а поверхность проигрывателя также немного движется вверх, вниз и из стороны в сторону. Это дополнительное движение добавляется к желаемому сигналу в виде шума, обычно очень низких частот, создавая грохочущий звук во время тихих проходов. Очень недорогие проигрыватели иногда использовали шарикоподшипники , которые с большой вероятностью будут генерировать слышимый гул. Более дорогие проигрыватели, как правило, используют массивные подшипники скольжения , которые с гораздо меньшей вероятностью будут генерировать оскорбительный гул. Увеличенная масса проигрывателя также приводит к уменьшению гула. Хороший проигрыватель должен иметь гул по крайней мере на 60 дБ ниже указанного выходного уровня от звукоснимателя. [16] : 79–82 Поскольку у них нет движущихся частей на пути сигнала, цифровые системы не подвержены гулу.
Вау и детонация — это изменение частоты аналогового устройства, которое является результатом механических несовершенств. Вау — это форма детонации, которая происходит с меньшей скоростью. Вау и детонация наиболее заметны на сигналах, которые содержат чистые тона. Для пластинок LP качество проигрывателя будет иметь большое влияние на уровень вау и детонации. Хороший проигрыватель будет иметь значения вау и детонации менее 0,05%, что является отклонением скорости от среднего значения. [16] Вау и детонация также могут присутствовать в записи в результате несовершенной работы записывающего устройства. Благодаря использованию прецизионных кварцевых генераторов для их временной развертки , цифровые системы не подвержены вау и детонации.
Для цифровых систем верхний предел частотной характеристики определяется частотой дискретизации . Выбор частоты дискретизации в цифровой системе основан на теореме дискретизации Найквиста-Шеннона . Она гласит, что дискретизированный сигнал может быть воспроизведен точно, если он дискретизирован с частотой, превышающей удвоенную ширину полосы пропускания сигнала, частоту Найквиста . Таким образом, частота дискретизации 40 кГц математически достаточна для захвата всей информации, содержащейся в сигнале, имеющем частотные компоненты, меньшие или равные 20 кГц. Теорема дискретизации также требует, чтобы частотный контент выше частоты Найквиста был удален из сигнала перед его дискретизацией. Это достигается с помощью фильтров сглаживания , которым требуется переходная полоса для достаточного уменьшения наложения спектров. Полоса пропускания, обеспечиваемая частотой дискретизации 44 100 Гц , используемой стандартом для аудио-CD, достаточно широка, чтобы охватить весь диапазон человеческого слуха , который примерно простирается от 20 Гц до 20 кГц. [2] : 108 Профессиональные цифровые рекордеры могут записывать более высокие частоты, в то время как некоторые бытовые и телекоммуникационные системы записывают более ограниченный диапазон частот.
Некоторые производители аналоговых лент указывают частотные характеристики до 20 кГц, но эти измерения могли быть сделаны при более низких уровнях сигнала. [16] Компакт-кассеты могут иметь характеристику, простирающуюся до 15 кГц при полном (0 дБ) уровне записи. [17] На более низких уровнях (−10 дБ) кассеты обычно ограничены 20 кГц из-за самостирания ленточного носителя.
Частотная характеристика для обычного проигрывателя LP может быть от 20 Гц до 20 кГц, ±3 дБ. Низкочастотная характеристика виниловых пластинок ограничена шумом гула (описанным выше), а также физическими и электрическими характеристиками всего звукоснимателя и преобразователя. Высокочастотная характеристика винила зависит от картриджа. Записи CD4 содержали частоты до 50 кГц. Частоты до 122 кГц были экспериментально вырезаны на LP записях. [18]
Цифровые системы требуют, чтобы все высокочастотное содержимое сигнала выше частоты Найквиста было удалено перед дискретизацией, что, если не сделать, приведет к тому, что эти ультразвуковые частоты «свернутся» в частоты в слышимом диапазоне, создавая своего рода искажение, называемое наложением спектров . Наложение спектров предотвращается в цифровых системах с помощью фильтра сглаживания . Однако разработка аналогового фильтра, который точно удаляет все частотное содержимое точно выше или ниже определенной частоты среза, нецелесообразна. [19] Вместо этого обычно выбирается частота дискретизации, которая выше требования Найквиста. Это решение называется избыточной дискретизацией и позволяет использовать менее агрессивный и более дешевый фильтр сглаживания.
Ранние цифровые системы могли страдать от ряда ухудшений сигнала, связанных с использованием аналоговых фильтров сглаживания, например, временной дисперсии, нелинейных искажений , пульсаций , температурной зависимости фильтров и т. д. [20] : 8 Используя конструкцию с избыточной выборкой и дельта-сигма-модуляцией , менее агрессивный аналоговый фильтр сглаживания может быть дополнен цифровым фильтром. [19] Такой подход имеет несколько преимуществ, поскольку цифровой фильтр может быть сделан с почти идеальной передаточной функцией частотной области, с низкой внутриполосной пульсацией и без старения или теплового дрейфа. [20] : 18 Однако цифровой фильтр сглаживания может вносить ухудшения из-за отклика во временной области, особенно при более низких частотах дискретизации. [21] [22]
Аналоговые системы не подвержены пределу Найквиста или наложению спектров и, таким образом, не требуют фильтров сглаживания или каких-либо конструкционных соображений, связанных с ними. Вместо этого пределы аналоговых форматов хранения определяются физическими свойствами их конструкции.
Аудио CD-качества дискретизируется на частоте 44 100 Гц ( частота Найквиста = 22,05 кГц) и на 16 бит. Дискретизация формы волны на более высоких частотах и разрешение большего количества бит на выборку позволяют еще больше снизить шум и искажения. DAT может дискретизировать аудио на частоте до 48 кГц, в то время как DVD-Audio может иметь частоту 96 или 192 кГц и разрешение до 24 бит. При любой из этих частот дискретизации информация о сигнале захватывается выше того, что обычно считается диапазоном частот человеческого слуха . Более высокие частоты дискретизации накладывают меньше ограничений на реализацию фильтра сглаживания, что может привести как к меньшей сложности, так и к меньшим искажениям сигнала.
Работа, проделанная в 1981 году Мураокой и др. [23], показала, что музыкальные сигналы с частотными компонентами выше 20 кГц отличались от сигналов без них лишь несколькими из 176 испытуемых. [24] Перцептивное исследование Нишигучи и др. (2004) пришло к выводу, что «не было обнаружено существенной разницы между звуками с очень высокочастотными компонентами и без них среди звуковых стимулов и испытуемых... однако [Нишигучи и др.] по-прежнему не могут ни подтвердить, ни опровергнуть возможность того, что некоторые испытуемые могли различать музыкальные звуки с очень высокочастотными компонентами и без них». [25]
В слепых прослушиваниях, проведенных Бобом Кацем в 1996 году, описанных в его книге «Освоение аудио: искусство и наука» , субъекты, использующие одно и то же оборудование для воспроизведения с высокой частотой дискретизации, не смогли различить никакой слышимой разницы между программным материалом, одинаково отфильтрованным для удаления частот выше 20 кГц по сравнению с 40 кГц. Это показывает, что наличие или отсутствие ультразвукового контента не объясняет слуховые вариации между частотами дискретизации. Он утверждает, что вариации в значительной степени обусловлены производительностью фильтров, ограничивающих полосу пропускания в преобразователях. Эти результаты показывают, что основное преимущество использования более высоких частот дискретизации заключается в том, что оно выталкивает косвенные фазовые искажения от фильтров, ограничивающих полосу пропускания, за пределы слышимого диапазона, и что в идеальных условиях более высокие частоты дискретизации могут не потребоваться. [26] Данн (1998) исследовал производительность цифровых преобразователей, чтобы выяснить, можно ли объяснить эти различия в производительности фильтрами, ограничивающими полосу пропускания, используемыми в преобразователях, и поискать артефакты, которые они вносят. [27]
Сигнал записывается в цифровом виде с помощью аналого-цифрового преобразователя , который измеряет амплитуду аналогового сигнала с регулярными интервалами, указанными частотой дискретизации, а затем сохраняет эти выборочные числа в компьютерном оборудовании. Числа на компьютерах представляют собой конечный набор дискретных значений, что означает, что если аналоговый сигнал цифровым образом дискретизируется с использованием собственных методов (без дизеринга), амплитуда аудиосигнала будет просто округлена до ближайшего представления. Этот процесс называется квантованием, и эти небольшие ошибки в измерениях проявляются на слух как низкоуровневый шум или искажение. Эта форма искажения, иногда называемая гранулярным или квантовым искажением, была указана как недостаток некоторых цифровых систем и записей, особенно некоторых ранних цифровых записей, где цифровая версия, как говорили, уступала аналоговой версии. [28] Однако, «если квантование выполняется с использованием правильного дизеринга, то единственным последствием оцифровки является эффективное добавление белого, некоррелированного, доброкачественного, случайного уровня шума. Уровень шума зависит от количества бит в канале». [9] : 6
Диапазон возможных значений, которые могут быть численно представлены образцом, определяется числом используемых двоичных цифр. Это называется разрешением и обычно упоминается как битовая глубина в контексте PCM-аудио. Уровень шума квантования напрямую определяется этим числом, уменьшаясь экспоненциально (линейно в единицах дБ) по мере увеличения разрешения. При адекватной битовой глубине случайный шум от других источников будет доминировать и полностью маскировать шум квантования. Стандарт Redbook CD использует 16 бит, что удерживает шум квантования на 96 дБ ниже максимальной амплитуды, что намного ниже различимого уровня практически с любым исходным материалом. [29] Добавление эффективного дизеринга означает, что «на практике разрешение ограничено нашей способностью различать звуки в шуме. ... У нас нет проблем с измерением (и прослушиванием) сигналов –110 дБ в хорошо спроектированном 16-битном канале». [9] DVD-Audio и большинство современного профессионального записывающего оборудования допускают образцы 24 бит.
Аналоговые системы не обязательно имеют дискретные цифровые уровни, в которых кодируется сигнал. Следовательно, точность, с которой может быть сохранен исходный сигнал, вместо этого ограничивается собственным уровнем шума и максимальным уровнем сигнала носителя и воспроизводящего оборудования.
Поскольку аналоговые носители состоят из молекул , наименьшая микроскопическая структура представляет наименьшую единицу квантования записанного сигнала. Естественные процессы дизеринга, такие как случайные тепловые движения молекул, ненулевой размер считывающего прибора и другие эффекты усреднения, делают практический предел больше, чем у наименьшей молекулярной структурной особенности. Теоретическая LP, состоящая из идеального алмаза с размером канавки 8 микрон и размером особенности 0,5 нанометра, имеет квантование, которое похоже на 16-битный цифровой образец. [6]
Можно сделать шум квантования слышимо безвредным, применив дизеринг . Для этого к исходному сигналу добавляется шум перед квантованием. Оптимальное использование дизеринга имеет эффект, делающий ошибку квантования независимой от сигнала, [11] : 143 и позволяет сохранять информацию о сигнале ниже младшего бита цифровой системы. [9] : 3
Алгоритмы дизеринга также обычно имеют возможность использовать определенный тип формирования шума , который сдвигает частоту большей части шума дизеринга в области, которые менее слышны человеческому уху, снижая уровень шума, воспринимаемый слушателем.
Дизеринг обычно применяется во время мастеринга перед окончательным снижением битовой глубины [26] , а также на различных этапах цифровой обработки сигнала .
Одним из аспектов, который может ухудшить производительность цифровой системы, является джиттер . Это явление отклонений во времени от того, что должно быть правильным интервалом дискретных выборок в соответствии с частотой дискретизации. Это может быть связано с неточностями синхронизации цифровых часов. В идеале цифровые часы должны выдавать синхронизирующий импульс с точно регулярными интервалами. Другими источниками джиттера в цифровых электронных схемах являются джиттер, вызванный данными, когда одна часть цифрового потока влияет на последующую часть, проходя через систему, и джиттер, вызванный источником питания, когда шум от источника питания вызывает нерегулярность синхронизации сигналов в схемах, которые он питает.
Точность цифровой системы зависит от выборочных значений амплитуды, но она также зависит от временной регулярности этих значений. Аналоговые версии этой временной зависимости известны как ошибка высоты тона и wow-and-flutter.
Периодический джиттер создает модуляционный шум и может рассматриваться как эквивалент аналогового флаттера. [30] Случайный джиттер изменяет уровень шума цифровой системы. Чувствительность преобразователя к джиттеру зависит от конструкции преобразователя. [11] Было показано, что случайный джиттер длительностью 5 нс может быть значительным для 16-битных цифровых систем. [30]
В 1998 году Бенджамин и Ганнон исследовали слышимость джиттера с помощью прослушивания тестов. [11] : 34 Они обнаружили, что самый низкий уровень джиттера, который можно было услышать, составлял около 10 нс ( среднеквадратичное значение ). Это было на 17 кГц синусоидальном тестовом сигнале. При прослушивании музыки ни один слушатель не обнаружил слышимого джиттера на уровнях ниже 20 нс. В статье Ашихары и др. (2005) была предпринята попытка определить пороги обнаружения случайного джиттера в музыкальных сигналах. Их метод включал прослушивание тестов ABX . При обсуждении своих результатов авторы отметили, что:
До сих пор фактический джиттер в потребительских товарах, по-видимому, слишком мал, чтобы быть обнаруженным, по крайней мере, для воспроизведения музыкальных сигналов. Однако неясно, будут ли пороги обнаружения, полученные в настоящем исследовании, действительно представлять предел слухового разрешения или они будут ограничены разрешением оборудования. Искажения из-за очень малого джиттера могут быть меньше искажений из-за нелинейных характеристик громкоговорителей. Ашихара и Кирю [8] оценили линейность громкоговорителя и наушников. Согласно их наблюдениям, наушники кажутся более предпочтительными для создания достаточного звукового давления на барабанных перепонках с меньшими искажениями, чем громкоговорители. [31]
После первоначальной записи аудиосигнал обычно каким-то образом изменяется, например, с помощью компрессии , эквализации , задержек и реверберации . В аналоговом формате это происходит в форме внешних аппаратных компонентов , а в цифровом формате то же самое обычно достигается с помощью плагинов в цифровой звуковой рабочей станции (DAW).
Сравнение аналоговой и цифровой фильтрации показывает технические преимущества обоих методов. Цифровые фильтры более точны и гибки. Аналоговые фильтры проще, могут быть более эффективными и не вносят задержек.
При изменении сигнала с помощью фильтра выходной сигнал может отличаться по времени от сигнала на входе, который измеряется как его фазовая характеристика . Все аналоговые эквалайзеры демонстрируют такое поведение, при этом величина фазового сдвига отличается по некоторому шаблону и центрируется вокруг регулируемой полосы. Хотя этот эффект изменяет сигнал иным образом, чем строгое изменение частотной характеристики, он обычно не вызывает возражений у слушателей. [32]
Поскольку задействованные переменные могут быть точно указаны в расчетах, цифровые фильтры могут быть сделаны так, чтобы объективно работать лучше, чем аналоговые компоненты. [3] [33] Другая обработка, такая как задержка и микширование, может быть выполнена точно.
Цифровые фильтры также более универсальны. Например, линейный фазовый эквалайзер не вносит частотно-зависимый фазовый сдвиг. Этот фильтр может быть реализован в цифровом виде с использованием фильтра с конечной импульсной характеристикой , но не имеет практической реализации с использованием аналоговых компонентов.
Практическим преимуществом цифровой обработки является более удобный вызов настроек. Параметры плагина можно сохранить на компьютере, тогда как параметры аналогового устройства должны быть записаны или иным образом зафиксированы, если устройство необходимо повторно использовать. Это может быть обременительно, когда все миксы должны быть вызваны вручную с помощью аналоговой консоли и внешнего оборудования. При работе в цифровом формате все параметры можно просто сохранить в файле проекта DAW и мгновенно вызвать. Большинство современных профессиональных DAW также обрабатывают плагины в реальном времени, что означает, что обработка может быть в значительной степени неразрушающей до окончательного сведения.
Сейчас существует множество плагинов, включающих аналоговое моделирование. Есть аудиоинженеры , которые их одобряют и считают, что они сравнимы по звучанию с аналоговыми процессами, которые они имитируют. Аналоговое моделирование имеет некоторые преимущества по сравнению с аналоговыми аналогами, такие как возможность удалять шум из алгоритмов и модификации, чтобы сделать параметры более гибкими. С другой стороны, другие инженеры также считают, что моделирование все еще уступает подлинным внешним компонентам и все еще предпочитают микшировать «нестандартно». [34]
Субъективная оценка пытается измерить, насколько хорошо аудиокомпонент работает в соответствии с человеческим ухом. Наиболее распространенной формой субъективного теста является тест прослушивания, где аудиокомпонент просто используется в контексте, для которого он был разработан. Этот тест популярен среди рецензентов hi-fi, где компонент используется в течение определенного времени рецензентом, который затем описывает производительность в субъективных терминах. Обычные описания включают, имеет ли компонент яркий или теплый звук, или насколько хорошо компоненту удается представить пространственное изображение .
Другой тип субъективного теста проводится в более контролируемых условиях и пытается устранить возможную предвзятость из тестов прослушивания. Эти виды тестов проводятся с компонентом, скрытым от слушателя, и называются слепыми тестами . Чтобы предотвратить возможную предвзятость со стороны человека, проводящего тест, слепой тест может быть проведен таким образом, чтобы этот человек также не знал о тестируемом компоненте. Этот тип теста называется двойным слепым тестом. Этот вид теста часто используется для оценки производительности сжатия звука с потерями .
Критики двойных слепых тестов считают, что они не позволяют слушателю полностью расслабиться при оценке системного компонента, и поэтому не могут судить о различиях между различными компонентами, а также в зрячих (неслепых) тестах. Те, кто использует метод двойного слепого тестирования, могут попытаться снизить стресс слушателя, предоставив определенное количество времени для его обучения. [35]
Ранние цифровые аудиомашины давали неутешительные результаты, поскольку цифровые преобразователи вносили ошибки, которые мог обнаружить слух. [36] Звукозаписывающие компании выпустили свои первые пластинки на основе цифровых аудиомастеров в конце 1970-х годов. Компакт-диски стали доступны в начале 1980-х годов. В то время аналоговое воспроизведение звука было зрелой технологией .
Была смешанная критическая реакция на ранние цифровые записи, выпущенные на CD. По сравнению с виниловыми пластинками, было замечено, что CD гораздо лучше раскрывает акустику и окружающий фоновый шум среды записи. [37] По этой причине методы записи, разработанные для аналоговых дисков, например, размещение микрофонов, необходимо было адаптировать для соответствия новому цифровому формату. [37]
Некоторые аналоговые записи были ремастерированы для цифровых форматов. Аналоговые записи, сделанные в естественной акустике концертного зала, как правило, выигрывали от ремастеринга. [38] Процесс ремастеринга иногда критиковали за то, что он был плохо обработан. Когда исходная аналоговая запись была довольно яркой, ремастеринг иногда приводил к неестественному акценту на высоких частотах. [38]
Формат Super Audio CD (SACD) был создан Sony и Philips , которые также были разработчиками более раннего стандартного формата аудио CD. SACD использует Direct Stream Digital (DSD) на основе дельта-сигма-модуляции . Используя эту технику, аудиоданные хранятся в виде последовательности фиксированных амплитудных (т. е. 1-битных) значений с частотой дискретизации 2,884 МГц, что в 64 раза превышает частоту дискретизации 44,1 кГц, используемую CD. В любой момент времени амплитуда исходного аналогового сигнала представлена плотностью единиц или нулей в потоке данных. Таким образом, этот цифровой поток данных может быть преобразован в аналоговый путем пропускания его через аналоговый фильтр нижних частот.
Формат DVD-Audio использует стандартную линейную PCM с переменной частотой дискретизации и битовой глубиной, которые, по крайней мере, соответствуют, а обычно значительно превосходят таковые стандартного CD-аудио (16 бит, 44,1 кГц).
В популярной Hi-Fi-прессе высказывалось предположение, что линейная PCM «вызывает [a] реакцию на стресс у людей», и что DSD «является единственной цифровой системой записи, которая не [...] имеет этих эффектов». [39] Это утверждение, по-видимому, берет начало в статье доктора Джона Даймонда 1980 года . [40] Суть утверждения о том, что записи PCM (единственная доступная в то время технология цифровой записи) создают реакцию на стресс, основывалась на использовании псевдонаучного метода прикладной кинезиологии , например, доктора Даймонда на 66-й конвенции AES (1980) с докладом под тем же названием. [41] Ранее Даймонд использовал похожую технику, чтобы продемонстрировать, что рок-музыка (в отличие от классической) вредна для вашего здоровья из-за наличия «остановленного анапестического ритма». [42] Утверждения Даймонда относительно цифрового аудио были подхвачены Марком Левинсоном , который утверждал, что в то время как записи PCM вызывают реакцию на стресс, записи DSD — нет. [43] [44] [45] Однако двойной слепой субъективный тест между линейным PCM высокого разрешения (DVD-Audio) и DSD не выявил статистически значимой разницы. Слушатели, участвовавшие в этом тесте, отметили, что им было очень трудно услышать разницу между двумя форматами. [46]
Возрождение винила отчасти связано с несовершенством аналогового аудио, которое добавляет «тепла». [47] Некоторые слушатели предпочитают такое аудио CD. Основатель и редактор журнала The Absolute Sound Гарри Пирсон говорит, что «LP определенно более музыкальны. CD истощают душу из музыки. Эмоциональная вовлеченность исчезает». Продюсер даб-музыки Эдриан Шервуд испытывает схожие чувства по поводу аналоговой кассетной ленты, которую он предпочитает из-за ее «более теплого» звука. [48]
Сторонники цифрового формата указывают на результаты слепых тестов, которые демонстрируют высокую производительность, возможную с цифровыми рекордерами. [49] Утверждается, что «аналоговый звук» является скорее продуктом неточностей аналогового формата, чем чем-либо еще. Одним из первых и крупнейших сторонников цифрового звука был классический дирижер Герберт фон Караян , который сказал, что цифровая запись «определенно превосходит любую другую форму записи, которую мы знаем». Он также был пионером неудачной цифровой компакт-кассеты и провел первую запись, когда-либо выпущенную в коммерческих целях на CD: Eine Alpensinfonie Рихарда Штрауса . Восприятие аналогового звука как явно превосходящего качество звука также было поставлено под сомнение музыкальными аналитиками после того, как выяснилось, что аудиофильский лейбл Mobile Fidelity Sound Lab тайно использовал файлы Direct Stream Digital для производства виниловых релизов, продаваемых как исходящие с аналоговых мастер-лент, а адвокат и аудиофил Рэнди Браун заявил, что «эти люди, которые утверждают, что у них золотые уши и они могут слышать разницу между аналоговым и цифровым звуком, на самом деле, вы не можете этого сделать». [50] [51]
В то время как слова «аналоговое аудио» обычно подразумевают, что звук описывается с использованием подхода непрерывного сигнала, а слова «цифровое аудио» подразумевают дискретный подход, существуют методы кодирования звука, которые находятся где-то между этими двумя. Действительно, все аналоговые системы демонстрируют дискретное (квантованное) поведение в микроскопическом масштабе. [52] В то время как виниловые пластинки и обычные компакт-кассеты являются аналоговыми носителями и используют квазилинейные физические методы кодирования (например, глубина спиральной канавки, напряженность магнитного поля ленты ) без заметного квантования или наложения спектров, существуют аналоговые нелинейные системы, которые демонстрируют эффекты, похожие на те, которые встречаются в цифровых системах, такие как наложение спектров и «жесткие» динамические полы (например, частотно-модулированное hi-fi аудио на видеокассетах, сигналы, кодированные с помощью ШИМ ).
Таким образом, 16-битная система дает теоретическое отношение сигнал/шум 98 дБ...
Сигнал-шум NAB (1/4-дюймовая двухдорожечная дорожка 2,0 мм, RMS, A-взвешенная) 30 ips - 75 дБ
{{cite conference}}
: CS1 maint: постскриптум ( ссылка ){{cite conference}}
: CS1 maint: постскриптум ( ссылка )