Pull to refresh

Простая компрессия звука в Audacity

Reading time3 min
Views49K
В принципе, записанный голос сразу же можно выкладыать в виде подкаста. Но лучше немного посидеть, разобраться хотя бы в азах и провести простую обработку звука. Есть одно минимальное действие, совсем не сложное ни в понимании, ни в реализации, при этом структура звучание резко изменится в лучшую сторону. Речь идет о компрессии звука.

Когда я впервые услышал о компрессии, я конечно подумал о mp3 или ogg, или любых других форматах, позволяющих сжать звуковые файлы в размере. Как оказалось, компрессия — вовсе не сюда :)

Чтобы понять, что такое компрессия, давайте сразу начнем с практики и по ходу будем вникать в суть дела. Перед вами фрагмент моей речи без какой-либо обработки (из какого-то выпуска первого сезона «Кадров»):



Скачать файлик

А вот так этот звук выглядит графически, в редакторе Audacity:

На первый взгляд, звук как звук. Но все познается в сравнении. У этого фрагмента есть один недочет — звук «скачет». По графику можно легко увидеть, как мой голос становится то тише, то громче, передвигаясь по стулу я менял в процессе разговора расстояние до микрофона, да к тому же то шептал, то активно что-то доказывал, повышая голос и тон. В итоге, если слушать такую запись, звук будет то бить по ушам, то его будет слышно черезчур тихо.

Задача компрессии — «сжать» звучание, усреднить, сделать плотнее, уменьшить расстояние между самыми тихими моментами и самыми громкими. Вот и все! Это все, что делает компрессор!

Делает он это, конечно же, не как ему захочется, а как мы ему укажем. Здесь и начинается вроде как сложные термины и непонимание, на деле же все — проще простого.

Давайте выделим весь фрагмент (Ctrl+A, от английского «all» — «все») и зайдем в Эффекты->Компрессор (Effects->Compressor). На скриншоте ниже я поставил все значения в максимум, просто чтобы показать, как выглядит это окно.

Здесь три ползунка.

Первый — «порог» (пороговое значение, threshold). Все, что выше указанного порога будет звучать тише после компрессии. Грубо говоря, порог — это значение, при достижении которого срабатывает компрессор, некая точка кипения.

Второй — «коэффициент» (ratio). Это значение выставляется как отношение число к числу. Максимальное значение на скриншоте — 10:1. Это означает, что как только сигнал достигнет порога, громкость уменьшится в 10 раз. Это происходит очень просто — на каждые 10 децибел входного сигнала, компрессор пропустит только 1, в результате громкость уменьшится.

Третий — время атаки (attack time). Это значение времени, за которое компрессор будет реагировать на повышение сигнала. В примере выше стоит значение 1,0 секунда. Вот как это работает: сигнал достигает значения порога, компрессор думает 1 секунду, если сигнал так и остается в этой зоне (не снижается ниже порга), то громкость понижается. Если в записи звучит выстрел из пистолета, то при значении 1 секунда его громкость даже не изменится — выстрел слишком быстрый, компрессор «не успеет» среагировать". В более продвинутых редакторах компрессор имеет больше настроек, как минимум есть еще и release time — время восстановления. Это то же самое, только с другого конца: сколько времени нужно компрессору, чтобы перестать понижать громкость.

Галочка «Нормализовать до 0 Дб после компрессии» говорит сама за себя. После компресси общий уровень сигнала как правило уменьшится, звук станет хоть и плотнее, но тише. С этой галочкой звук станет громче, достигнет уровня 0 Дб, что является стандартом для подкастинга.

Это и есть весь механизм компрессии звука! Давайте попробуем на практике применить эти знания. Вот что я сделаю:
  • Значение порога выставлю в -25 Дб
  • Значение коэффициента — в 6:1
  • Значение времени атаки — в 0,1 секунд
  • Поставлю галочку «Нормализовать до 0 Дб после компрессии»
  • … и нажму ОК :)


После недолгого процесса мы увидим следующую картину:

А звуком — такое вот:

Скачать файлик

Чувствуете разницу? Даже если вы скажете «нет», то это поспешный вывод. Переслушайте первые 6 секунд обоих записей и вы поймете, что скомпрессированный звук слушать приятнее, не нужно прислушиваться «че он там промямлил??!..». А если вы слушаете подкаст в полтора часа (О, Кадры!..), то плохо скомпрессированного или вообще без компрессии звука просто устают уши и мозг. Хорошее качество звучания не отвлекает, расслабляет.

Нужно понимать, что описанное в статье действие: во-первых, не самое лучшее. Этот же фрагмент звука можно скомпрессировать куда как лучше. Во-вторых, не является универсальным для всех записей: в вашем конкретном случае возможно понадобятся другие значения.
...
Как видите, совсем не сложно, а результат влияет на очень многое! Хотя бы из уважения к слушателям, им стоит преподносить хороший звук. Приятный.

Сам я с компрессией познакомился благодаря подкасту "Теория и Практика Звукозаписи" от небезызвестного Умпутуна. Чего и вам советую. У него же можно почитать небольшие статейки о компрессии:

В следующий раз займемся другими аспектами обработки звука.

Оригинал на Подкастим.ру
Tags:
Hubs:
+17
Comments12

Articles