Запись аудиороликов и сам процесс воспроизведения работает на наш на слух, а точнее на наши уши. Давай поговорим о том, как мы воспринимаем звуки.
Чувствительность
Обычно громкость принято измерять в децибелах. Ноль – это тот минимум, который человек слышит. Мы можем слышать звуки громкостью примерно до 120 дБ. При 140 дБ человек начинает ощущать боль. Обычная беседа - это примерно 60 дБ. Чувствительность нашего уха ко всему спектру частот заметно отличается. Максимальная чувствительность лежит в районе 1 - 4 кГц – это основные тона голоса. При разнице в 1 дБ мы можем заметить, что два звука отличаются по громкости.
Тоже самое касается и спектральной чувствительности (это не только про дикторский голос). Мы слышим, когда два звука отличаются по частоте, если разница между ними составляет примерно 0.3% в районе 3 кГц, а в районе 100 Гц необходима различие уже на 4%! Чтобы было понятно приведу пример: частоты нот на фортепиано отличаются примерно на 6%.
Если говорить про цифровую обработку, то в дБ идёт отсчёт от нуля и вниз, в область отрицательных значений. Ноль – максимум.
Фаза
Фазовое соотношение отдельных частот изменяется от движения головы, реверберации, резонансов - да много чего ещё. Мозг игнорирует эту информацию, и поэтому мы не воспринимаем фазы частот. Но есть небольшие изменения в фазе, а есть значительные, когда звук меняет свою длительность (когда дикторский рекламный голос неграмотно обработан).
Итак, к небольшим вариациям фаз наш слух абсолютно не чувствителен. Но это скорее об одинаковых изменениях фазы в обоих каналах!
Объём
Stereos – с греческого переводится как - пространственный. Частоты, что ниже 1 кГц, не встречают на своём пути препятствий - они просто огибают голову. Если сигнал в одно ухо приходит раньше другого, мы распознаём его местоположение в пространстве - ведь задержка происходит из-за того, что звук проходит еще какое-то расстояние до второго уха, затратив на это дополнительное время. Частоты выше 2 кГц, которые закрываются головой и ушной раковиной - просто определение разности в громкости между ушами(например, запись рекламных аудиороликов). Так же много значит громкость обоих каналов, а в частотах, где это возможно, до 1 - 2 кГц.
Итак, в очень ограниченном диапазоне воспринимается особенность помещения, в котором присутствует человек. В этом нам помогает - задержка, и реверберация.
Объём
Слово «гармоника» можно перевести как созвучный, стройный. Например, тон 200 Гц сопровождают гармоники 300, 400, 500 и так далее Гц. Характер звучания музыкального инструмента зависит от наличия и мощностей его гармоник, тогда как основной тон определяет ноту. Гармоники есть всегда - даже если инструмент передаёт только один основной тон, высшие гармоники мы услышим в процессе спектрального восприятия звука (потом мы рассмотрим вопрос - озвучивание видео). Особенность человеческого звуковосприятия заключается в следующем: два звука, 1 кГц и 4 кГц, вместе будут звучать гармонично - ведь это одна нота только через две октавы. Но если мы возьмём два тона 1 кГц и 3.2 кГц - будет звучать неприятно. Так что же такое аккорд? Это как раз и есть те три ноты, четные гармоники которые не препятствуют друг другу, не находятся близко друг от друга, чтобы не раздражать слух слушателя.
Есть ещё одно важное для нас понятие - октава. Частота изменяется в два раза. Мы слышим примерно 10 октав. Это относится к любому инструменту - основные тона почти никогда не выходят за 5 кГц. Даже если бы и существовали музыкальные инструменты с более высокими тонами - гармонический состав их звучания был бы крайне скоромным. У инструмента в 5 кГц основного тона есть только одна гармоника, которую мы слышим - 10 кГц. Этого недостаточно для красивого звучания, какого тембра мы бы не хотели добиться в итоге (даже если это озвучивание рекламы и видео).
Надеюсь, как ответил на какие-то ваши вопросы и комментарии по этой теме.