Откройте записанный дикторский голос в своём аудио- редакторе, например в Sound Forge. Воспользуйтесь эквалайзером, чтобы выровнять звук, перед тем как сохранить его. Небольшие манипуляции с EQ позволят вам аккуратно поработать с частотной характеристикой голоса. Вы можете прибавить определенные частоты, такие как «мясо» голоса или убавить, например излишний бубнёж на низах.
Чтобы подготовить ваш файл к использованию вам необходимо:

Для MP3 и другого кодирования, лучше привести динамический диапазон приблизительно к 12 дБ. Это означает, что вам нужно скомпрессировать звук. Компрессия – это выравнивание звука: более громкие фрагменты становятся тише. Для голоса пороговый уровень или самый высокий пик должен составлять 3 - 6 дБ.
Другими словами, если ваш самый громкий пик в в –3dB попробуйте следующие значения:
- ratio в дикторской записи голоса 4:1,
- attack 10 ms,
- threshold -9 db,
- release 500 ms

Эти настройки «причешут» вашу запись, сжимая только самые громкие звуки. Заметьте, что с помощью компрессора голос стал звучать гораздо мягче, а на диаграмме он выглядит ровнее. Если вы чувствуете, что голосу нужно больше компрессии – экспериментируйте с threshold и ratio. Но не идите на поводу у желания сильно зажать начитку, чтобы она звучала ещё громче - это негативно отразится на звуке.
Некоторые дикторские демо записи слишком зажаты и звучат с перегрузом. Все, что нам нужно сделать - уплотнить звук. Не стоит кричать в уши ваших клиентов!
Теперь, когда мы выровняли динамический диапазон, нам нужно максимизировать его с помощью нормализации. По сути, нормализация поднимает громкость звукового файла. У вас есть два варианта: поднять звук по пикам и RMS. По пикам вы устанавливаете максимальную громкость звука. Тогда программа берет самый громкий пик в озвучке текста и приводит остальную часть звука к этому уровню пика.
Если вы устанавливаете пиковую нормализацию в –1dB (это прекрасно подходит для MP3), а самый высокий уровень пика в файле –6dB - программа поднимет громкость до 5dB для всего файла.
Это удобно, потому что громкость увеличится без перегруза и зашкаливания. Используйте нормализацию –1.0 или.5dB - что достаточно громко для использования такого звука в интернете. RMS нормализация поднимает средний объем файла, что можно было бы назвать как - воспринаемая громкость. Нормализация по RMS ведёт себя непредсказуемо и трудна для новичка. Советую вам использовать пиковую нормализацию.
Теперь озвучка вашего текста готова к кодированию в формат MP3. Не забывайте оставлять исходный WAV файл, в случае если вы захотите вернуться к оригиналу.