AC3Filter
Громкость и динамический диапазон

Александр Виговский

AC3Filter home :: Donate :: Download :: Support forum

Качество звука - это очень сложное понятие, которое зависит от огромного количества факторов и их взаимосвязи: типа акустической системы, условий прослушивания, качества исходной записи, самого слушателя и многих прочих. Невозможно дать однозначные рекомендации как добиться качества, нет единого рецепта, как нет и идеального звука: запись, подготовленная для одних условий прослушивания, в других условиях может звучать совершенно неприемлемо. Однако можно попытаться изложить некоторые главные принципы, которые помогут понять, что необходимо делать в каждом конкретном случае.

Содержание

 1 Что такое громкость
 2 Гистограмма громкостей
 3 Проблема громкости DVD
 4 Изменение уровня. Переполнение, обрезание и ограничение.
 5 Нормализация
 6 Однопроходная нормализация
 7 Сжатие динамического диапазона
 8 Микширование и громкость
 9 Рекомендации

1 Что такое громкость

Что такое громкость? Этот, казалось бы, очевидный вопрос достаточно трудно формализовать, поскольку в разных случаях подразумеваются совершенно разные вещи.

Наиболее очевиден смысл громкости, когда мы говорим о , поскольку это то, что непосредственно воспринимается ухом.

- давление, дополнительно возникающее при прохождении звуковой волны в жидкой и газообразной среде. Распространяясь в среде, звуковая волна образует сгущения и разрежения, которые создают добавочные изменения давления по отношению к среднему значению давления в среде. Т.о., звуковое давление представляет собой переменную часть давления, т.е. колебания давления относительно среднего значения, частота которых соответствует частоте звуковой волны. (Большая Советская Энциклопедия)

Таким образом, мы можем оценить любой звук - громкие звуки создают большое давление, тихие - малое. Давление измеряется в Паскалях, однако в акустике звуковое давление обычно измеряется в (дБ) относительно . По определению, величина порога принята равной pt = 0.00002Па = 20мкПа. Порог слышимости принимается за 0дБ, а вычисляется как l = 20 * log(p / pt), где l [дБ] - громкость (в смысле звукового давления), p [Па]- звуковое давление, pt [Па]- порог слышимости. При этом: все слышимые звуки имеют положительную величину громкости; неслышимые (ниже порога громкости) - отрицательную; изменение громкости на 6дБ соответствует двукратному изменению давления; изменение на 20дБ - изменению давления в 10 раз. Громкость в смысле звукового давления далее мы будем называть .

Несколько типичных значений громкости:




Звук Громкость Давление



Порог слышимости 0dB 20 мкПа



Шелест листвы и слабого ветра
Тиканье наручных часов
Дыхание 10-20dB 60 - 200 мПа



Тихий шепот
Тиканье настенных часов 20-30dB 200 - 600 мПа



Шум в помещении 30-40dB 0.6 - 2 мПа



Тихий разговор 40-50dB 2 - 6 мПа



Разговор средней громкости 50-60dB 6 - 20 мПа



Громкий разговор 60-70dB 20 - 60 мПа



Шумная улица 70-80dB 60 - 200 мПа



Двигатель грузового автомобиля  80dB 200 мПа



Шум в метро во время движения
Отбойный молоток  90dB 600 мПа



Громкая дискотека 100-120dB 2 - 20 Па



Самолет на взлете 120dB 20 Па



Болевой порог 130dB 60 Па



Обратите внимание на диапазон воспринимаемых давлений: давление у порога слышимости и создаваемое самолетом отличаются в миллион раз! Поэтому логарифмическая шкала гораздо лучше согласуется с физиологией слуха - линейное изменение звукового давления не соответствует ощущению линейного изменения громкости. Например, изменение звукового давления на 50мПа при разговоре будет очень заметно, однако совершенно незаметно при взлете самолета. Изменение же звукового давления на 6дБ (в два раза) будет воспринято как примерно равное изменение громкости в обоих случаях, хотя в первом случае это будет соответствовать изменению давления на 25мПа, а во втором - 10Па.

Другая громкость - это ( ). Эта громкость не является звуковым давлением (это может быть напряжение, намагниченность и т.д.), однако, звуковое давление создается в соответствии с громкостью сигнала записи при помощи системы воспроизведения. Каждой определенной громкости сигнала соответствует определенное звуковое давление. Громкость сигнала также может измеряться в децибелах. Однако если звуковое давление обычно измеряется относительно порога слышимости (минимального слышимого звукового давления), то громкость цифрового сигнала обычно измеряется относительно максимального цифрового уровня, принятого за 0дБ. Таким образом, громкость цифрового сигнала выражается отрицательными величинами (-3дБ, -20дБ) поскольку громкость записи всегда должна быть ниже максимальной. Чем меньше значение громкости, тем тише сигнал (-20дБ тише, чем -3дБ). Если громкость цифрового сигнала положительна, то это означает переполнение и, как следствие, возникновение цифровых искажений. (Суть этих искажений будет рассмотрена далее).

Регуляторы громкости на усилителе, в настройках системы, в плеере не создают звукового давления вообще. При отсутствии сигнала даже при максимальных установках громкости мы не услышим ничего (при условии, что сама система воспроизведения не создает шума). Таким образом, они влияют на громкость лишь косвенно и имеют смысл сигнала (усиление может означать и ослабление сигнала). В дальнейшем термин громкость не будет использоваться для обозначения уровней усиления, за исключением , поскольку это уже устоявшийся термин. Под системной громкостью будет пониматься как уровень усиления установленный в настройках операционной системы, так и в плеере, усилителе/ресивере и т.д.

Уровень усиления также может измеряться в децибелах. Это удобно, поскольку громкость сигнала и уровень усиления в таком случае просто складываются. Например, сигнал с громкостью 70дБ, усиленный на 10дБ будет звучать с громкостью 80дБ. Однако, несмотря на одинаковые единицы измерения необходимо всегда отличать громкость от усиления.

При воспроизведении сигнал записи преобразуется в звуковое давление при помощи акустической системы. Пусть максимальное давление создаваемое акустической системой составляет 100дБ. Тогда запись громкостью 0дБ будет создавать давление 100дБ, запись громкостью -30дБ будет создавать давление 70дБ и т.д. При изменении уровня усиления абсолютная громкость тоже будет изменяться. Таким образом, изменяя уровень усиления всегда возможно установить соответствие между громкостью записи и необходимой абсолютной громкостью. Например, если уровень диалогов в фильме составляет -30дБ, и мы хотим слышать их с естественной громкостью, то необходимо, чтобы громкость записи равная -30дБ соответствовала давлению 50дБ. Т.к. при максимальном уровне усиления (0дБ) уровень записи -30дБ создает давление 70дБ (что многовато), то при уровне усиления -20дБ, та же громкость записи создаст необходимые 50дБ давления. Отрегулированная таким образом акустическая система называется , т.е. откалиброванная акустическая система - это система, где звуки воспроизводятся с правильной абсолютной громкостью. (На самом деле процесс калибровки может быть гораздо сложнее и включать намного больше параметров, однако здесь и далее мы будем говорить только о калибровке громкости). На большинстве бытовых приборов регулятор уровня усиления никак не маркируется (или наносятся абстрактные проценты или другие ничего не обозначающие цифры), поэтому для пользователя произвести точную калибровку акустической системы достаточно сложно.

На восприятие громкости также влияет свойство слуха. Слух приспосабливается к громкости окружающего шума, и соответственно корректирует восприятие громкости. Многие наверняка замечали, что человек в наушниках, в которых играет громкая музыка, начинает говорить громко (согласно восприятию окружающих), однако с его точки зрения это нормальная громкость речи (относительно громкости звука в наушниках). И наоборот - в полной тишине люди начинают говорить шепотом, и при этом шепот все равно кажется громким. В условиях обычного городского шума тиканье механических часов услышать очень сложно - этот звук воспринимается как очень тихий. То же самое тиканье часов в полной тишине ночью может восприниматься как четко слышимое. Таким образом, возникает третья громкость - . Мы не будем говорить о каком-либо измерении субъективной громкости, а только о качественном сравнении звуков (громче/тише).

Таким образом, звук одной и той же абсолютной громкости может восприниматься как громкий или тихий в зависимости от окружающих условий. Допустим, мы отрегулировали уровень усиления так, чтобы громкость диалогов в фильме приблизительно соответствовал реальности. Тогда, если в фильме есть звук тикающих в тишине часов, то при просмотре фильма в условиях городского шума мы не услышим часов вовсе, поскольку звук часов значительно тише окружающего шума, а слух адаптирован отсеивать окружающий шум. В хороших условиях прослушивания, когда окружающего шума нет, те же самые часы будут ясно слышны.

Во многих случаях громкость записи удобно измерять относительно некоторого опорного уровня. Например, если громкость записи составляет -20дБ - это громко или тихо? А если нам известно, что громкость диалогов в той же записи составляет -30дБ, то сразу можно сказать, что это достаточно громко. Если же громкость диалогов равна -10дБ, то можно сказать, что это достаточно тихо. (средняя громкость разговора) - это очень удобный опорный уровень, относительно которого можно легко ориентироваться. Если громкость звука на 10дБ выше уровня диалогов, то это громко, а если на 10дБ ниже - то это тихо. При этом сам уровень диалогов может быть произвольным и зависеть от записи - в одной записи уровень диалогов может составлять -10дБ, а в другой и все -30дБ. В любом случае звуки громкостью ниже уровня диалогов будут восприниматься как тихие, а выше уровня диалогов - как громкие, даже в случае если акустическая система будет неправильно откалибрована, и диалоги будут звучать с абсолютной громкостью в 40дБ или 60дБ. Благодаря свойству адаптации слух приспосабливается к текущей средней громкости и вносит соответствующую ’поправку’. Однако правильное восприятие громкости будет нарушено, когда громкость окружающего шума приближается к громкости диалогов (или даже превышает его) - в этом случае все воспроизводимые звуки будут казаться тихими.

Таким образом, можно ввести еще одну шкалу громкости (в дополнение к шкале громкости цифрового сигнала и шкале абсолютной громкости) - громкость относительно уровня диалогов. При сопоставлении разных громкостей получим:








Громкость реальных звуков

Громкость относительно уровня диалогов

Громкость записи-1

Громкость записи-2

Громкость при воспр. записи 1

Громкость при воспр. записи 2








Тихие звуки








Тихий шепот

10dB

-40dB

-70dB

-50dB

10dB

10dB








Норма шума в жилых помещениях

20..30dB

-20..-30dB

-50..-60dB

-30..-40dB

20..30dB

20..30dB








Тихий разговор

40dB

-10dB

-40dB

-20dB

40dB

40dB








Уровень диалогов








Разговор средней громкости

50dB

0dB

-30dB

-10dB

50dB

50dB








Громкие звуки








Шум пишущей машинки

70dB

+20dB

-10dB

0dB

70dB

60dB








Двигатель грузового автомобиля

80dB

+30dB

0dB

0dB

80dB

60dB








Громкий автомобильный сигнал на расстоянии 5–7м

100dB

+50dB

0dB

0dB

80dB

60dB








Шум работающего трактора на расстоянии 1м

120dB

+70dB

0dB

0dB

80dB

60dB








Болевой порог

130dB

+80dB

0dB

0dB

80dB

60dB








В таблице также приведены две гипотетические записи, записанные в разных условиях: уровень диалогов в записи-1 составляет -30дБ, а в записи-2 -10дБ. Видно, что при воспроизведении на откалиброванной системе первая запись значительно лучше передает громкие звуки - возможно воспроизводить звуки громкостью до 80дБ, в то время как вторая запись воспроизводит звуки громкостью всего лишь до 60дБ.

Заметим также, что для двух приведенных записей требуется разная калибровка акустической системы. Так, для акустики, способной создавать давление в 100дБ уровень усиления, необходимый для первой записи составляет -20дБ, а для второй - -40дБ. Т.о. первая запись требует значительно бОльшего усиления, и при воспроизведении обоих записей при одинаковых настройках уровня усиления первая запись будет звучать значительно тише. Поэтому вторая запись удобна для некалиброванных систем, поскольку допускает сильные отклонения в уровне усиления.

Таким образом, запись-1 хорошо передает громкие звуки, но требует большего уровня усиления; при недостаточном усилении и наличии внешних шумов будет восприниматься как черезмерно тихая. Запись-2 не требует большого усиления, хорошо слышна даже на малых уровнях усиления и при наличии шума, но не может хорошо передавать громкие звуки.

А теперь вспомним, что звуковой сигнал - переменный:

PIC

Что брать для расчета громкости? Очевидно, что изменение давления за один период звуковой волны не имеет смысла изменения громкости звука, поскольку мы не слышим отдельные колебания. Поэтому громкость определяется не для одной точки, а на определенном промежутке времени. Есть много разных способов для определения громкости. Простейшие - это определение максимума и вычисление энергии сигнала. Более сложные методики учитывают неравномерность слуха к звукам разной частоты и интенсивности.

При определении громкости как максимума сигнала мы просматриваем диапазон и ищем максимум сигнала:

PIC

Найденный уровень, выраженный в дБ, и будет характеризовать громкость. Чтобы отличить эту громкость от полученных другим способом, эта громкость также называется -. В дальнейшем мы будем пользоваться только таким определением громкости. В действительности это определение не очень хорошо отражает реальное восприятие громкости, однако оно удобно для последующих рассуждений и поэтому мы не будем более подробно останавливаться на других, более точных методах определения громкости.

2 Гистограмма громкостей

PIC

Этот рисунок иллюстрирует распределение громкостей типичного DVD фильма (DVD FightClub, здесь и далее берутся только оригинальные аудио-треки, без перевода и без микширования, дабы не искажать звуковую картину). По оси Х откладывается громкость в децибелах, по оси Y - насколько часто звук с этой громкостью появляется. Проще говоря, на протяжении фильма постоянно контролировалась текущая громкость, и чем чаще встречается какая-то громкость, тем выше в этом месте график. Т.е. можно сказать, что громких взрывов было мало, зато очень много разных фоновых звуков. График поделен на несколько условных областей:

  1. Голос. Уровень диалогов для фильмов - это один из наиболее важных параметров. Он является отправной точкой для всех остальных звуков: все, что ниже - считается тихими звуками, все, что выше - громкими. Хорошая слышимость диалогов это один из главных критериев настройки (о которой мы будем говорить дальше).
  2. Фоновые звуки - проезжающие автомобили, звуки шагов, фоновая музыка
  3. Очень тихие звуки - легкий ветер, шуршание травы и т.д.
  4. Громкие звуки - звонок телефона, удары и прочее
  5. Взрывы и прочие глобальные катастрофы
  6. Шумы записи

Границы между областями весьма условны и могут изменяться для разных записей. В данном случае известно, что уровень диалогов равен -27дБ.

Рассматривая график можно отметить несколько интересных моментов. Во-первых, чаще всего в фильме встречались звуки с громкостью -40дБ. Пока просто отметим этот факт. Во-вторых, главный горб расположен от 0дБ (максимальный уровень) до -70дБ (минимальный уровень). Разумно предположить, что все важные звуки расположены внутри этого горба, а все, что тише - просто шумы. Разность максимального и минимального уровней составляет 70дБ. Эта величина называется и C