Пользователь
0,0
рейтинг
14 апреля 2014 в 20:16

Разработка → Гармонические колебания

На хабре было несколько статей по преобразованию Фурье и о всяких красивостях типа Цифровой Обработки Сигналов (ЦОС), но неискушённому пользователю совершенно не понятно, зачем всё это нужно и где, а главное как это применить.


АЧХ шума.

Лично мне после прочтения этих статей (например, этой ) не стало понятно, что это и зачем оно нужно в реальной жизни, хотя было интересно и красиво.
Хочется не просто поглядеть красивые картинки, а так сказать, ощутить нутром, что и как работает. И я приведу конкретный пример с генерацией и обработкой звуковых файлов. Можно будет и послушать звук, и поглядеть его спектр, и понять, почему это так.
Статья не будет интересна тем, кто владеет теорией функций комплексной переменной, ЦОС и прочими страшными темами. Она скорее для любопытствующих, школьников, студентов и им сочувствующих :).


Сразу оговорюсь, я не математик, и многие вещи могу даже сказать неправильно (поправляйте личным сообщением), и данную статью пишу, опираясь на собственный опыт и собственное понимание текущих процессов. Если вы готовы, то поехали.

Пару слов о матчасти



Если мы вспомним школьный курс математики, то для построения графика синуса мы использовали круг. В общем-то так и получается, что вращательное движение можно превратить в синусоиду (как и любое гармоническое колебание). Самое лучшая иллюстрация этого процесса приведена в википедии


Гармонические колебания

Т.е. фактически график синуса получается из вращения вектора, который описывается формулой:

f(x) = A sin (ωt + φ),

где A — длина вектора (амплитуда колебаний), φ — начальный угол (фаза) вектора в нулевой момент времени, ω — угловая скорость вращения, которая равна:

ω=2 πf, где f — частота в Герцах.

Как мы видим, что зная частоту сигнала, амплитуду и угол, мы можем построить гармонический сигнал.

Магия начинается тогда, когда оказывается, что представление абсолютно любого сигнала можно представить в виде суммы (зачастую бесконечной) различных синусоид. Иначе говоря, в виде ряда Фурье.
Я приведу пример из английской википедии. Для примера возьмём пилообразный сигнал.


Пилообразный сигнал

Его сумма будет представлена следующей формулой:



Если мы будем по очерёдно суммировать, брать сначала n=1, затем n=2 и т.д., то увидим, как у нас гармонический синусоидальный сигнал постепенно превращается в пилу:



Наверное красивее всего это иллюстрирует одна программа, найденная мной на просторах сети. Выше уже говорилось, что график синуса является проекцией вращающегося вектора, а как же быть в случае более сложных сигналов? Это, как ни странно, проекция множества вращающихся векторов, а точнее их суммы, и выглядит это всё так:


Вектора рисуют пилу.

Вообще рекомендую сходить самим по ссылке и попробовать самим поиграться с параметрами, и посмотреть как меняется сигнал. ИМХО более наглядной игрушки для понимания я ещё не встречал.

Ещё следует заметить, что есть обратная процедура, позволяющая получить из данного сигнала частоту, амплитуду и начальную фазу (угол), которое называется Преобразование Фурье.


Разложение в ряд Фурье некоторых известных периодических функций (отсюда)

Я детально на нём останавливаться не буду, но покажу, как это можно применить по жизни. В списке литературы порекомендую то, где можно почитать подробнее о матчасти.

Переходим к практическим упражнениям!



Мне кажется, что каждый студент задаётся вопросом, сидя на лекции, например по матану: зачем мне весь этот бред? И как правило, не найдя ответа в обозримом будущем, к сожалению, теряет интерес к предмету. Поэтому я сразу покажу практическое применение данных знаний, а вы эти знания уже будете осваивать сами :).

Всё дальнейшее я буду реализовывать на сях. Делал всё, конечно, под Linux, но никакой специфики не использовал, по идее программа будет компилироваться и работать под другими платформами.

Для начала напишем программу для формирования звукового файла. Был взят wav-файл, как самый простой. Прочитать про его структуру можно тут.
Если кратко, то структура wav-файла описывается так: заголовок, который описывает формат файла, и далее идёт (в нашем случае) массив 16-ти битных данных (остроконечник) длиной: частота_дискретизации*t секунд или 44100*t штук.

Для формирования звукового файла был взят пример здесь. Я его немного модифицировал, исправил ошибки, и окончательная версия с моими правками теперь лежит на гитхабе тут

github.com/dlinyj/generate_wav

Сгенерируем двухсекундный звуковой файл с чистым синусом частотой 100 Гц. Для этого модифицируем программу таким образом:

#define S_RATE  (44100) //частота дискретизации
#define BUF_SIZE (S_RATE*10) /* 2 second buffer */
….

int main(int argc, char * argv[])
{
...
	float amplitude = 32000; //берём максимальную возможную амплитуду
	float freq_Hz = 100; //частота сигнала
	/* fill buffer with a sine wave */
	for (i=0; i<BUF_SIZE; i++)
	{

		buffer[i] +=(int)(amplitude * sin((float)(2*M_PI*i*freq_Hz/S_RATE))); 
	}
	write_wav("test.wav", BUF_SIZE, buffer, S_RATE);
 
	return 0;
}


Обращаю внимание, что формула чистого синуса соответствует той, о которой мы говорили выше. Амплитуда 32000 (можно было взять 32767) соответствует значению, которое может принимать 16-ти битное число (от минус 32767 до плюс 32767).

В результате получаем следующий файл (можно его даже послушать любой звуковоспроизводящей программой). Откроем данный файл audacity и увидим, что график сигнала в действительности соответствует чистому синусу:


Чистый ламповый синус

Поглядим спектр этого синуса (Анализ->Построить график спектра)


График спектра

Виден чистый пик на 100 Гц (логарифмический масштаб). Что такое спектр? Это амплитудно-частотная характеристика. Существует ещё фазочастотная характеристика. Если помните, выше я говорил, что для построения сигнала надо знать его частоту, амплитуду и фазу? Так вот, можно из сигнала получить эти параметры. В данном случае у нас график соответствий частот амплитуде, при чём амплитуда у нас не в реальных единицах, а в Децибелах.



Величина, выраженная в децибелах, численно равна десятичному логарифму безразмерного отношения физической величины к одноимённой физической величине, принимаемой за исходную, умноженному на десять.

В данном случае просто логарифм амплитуды, умноженный на 10. Логарифмический масштаб удобно использовать при работе с сигналами.

Мне, честно говоря, не очень нравится анализатор спектра в этой программе, поэтому я решил написать свой с блекджеком и шлюхами, тем более, что это несложно.

Пишем свой анализатор спектра



Здесь может быть скучно, поэтому можете перейти сразу к следующей главе.

Поскольку я прекрасно понимаю, что тут портянки кода размещать нет смысла, те, кому реально интересно — сами найдут и поковыряют, а тем, кому это неинтересно, будут скучать, то я остановлюсь только на основных моментах написания анализатора спектра wav-файла.

Во-первых, нам wav-файл необходимо читать. Там необходимо прочитать заголовок, чтобы понять, что содержит данный файл. Я не стал реализовывать море вариантов чтения данного файла, а остановился только на одном. Пример чтения файла был взят отсюда практически без изменений, ИМХО — отличный пример. Там же есть реализация на питоне.

Следующее, что нам нужно, это быстрое преобразование Фурье. Это то самое преобразование, которое позволяет получить из конечного набора точек вектора исходных сигналов. Пусть вас пока это не пугает, дальше я объясню.
Опять же, велосипед изобретать не стал, а взял готовый пример отсюда.

Я понимаю, что чтобы объяснить, как работает программа, надо объяснить, что такое быстрое преобразование Фурье, а это как минимум ещё на одну некислую статью.

Для начала алокируем массивы:

	c = calloc(size_array*2, sizeof(float)); // массив поворотных множителей
	in = calloc(size_array*2, sizeof(float)); //входный массив
	out = calloc(size_array*2, sizeof(float)); //выходной массив


Скажу лишь, что в программе мы читаем данные в массив длиной size_array (которое берём из заголовка wav-файла).

	while( fread(&value,sizeof(value),1,wav) ) {
		in[j]=(float)value;
		j+=2;
		if (j > 2*size_array)  break;
}


Массив для быстрого преобразования Фурье должен представлять собой последовательность {re[0], im[0], re[1], im[1],… re[fft_size-1], im[fft_size-1]}, где fft_size=1<< p — число точек БПФ. Объясняю нормальным языком:
это массив комплексных чисел. Я даже боюсь представить, где используется комплексное преобразование Фурье, но в нашем случае мнимая часть у нас равна нулю, а действительная равна значению каждой точке масива.
Ещё одна особенность именно быстрого преобразования Фурье, что оно обсчитывает массивы, кратные только степени двойки. В результате мы должны вычислить минимальную степень двойки:

int p2=(int)(log2(header.bytes_in_data/header.bytes_by_capture));


Логарифм от количество байт в данных, делённых на количество байт в одной точке.

После этого считаем поворотные множители:

fft_make(p2,c);// функция расчёта поворотных множителей для БПФ (первый параметр степень двойки, второй алокированный массив поворотных множителей). 


И скармливаем наш считанный массив в преобразователь Фурье:

fft_calc(p2, c,	in,	out, 1); //(единица означает, что мы получаем нормализованный массив).


На выходе мы получаем комплексные числа вида {re[0], im[0], re[1], im[1],… re[fft_size-1], im[fft_size-1]}. Для тех, кто не знает, что такое комплексное число, поясню. Я не зря начал эту статью с кучи вращающихся векторов и кучи гифок. Так вот, вектор на комплесной плоскости определяется действительной координатой a1 и мнимой координатой a2. Или длиной (это у нас амплитуда Am) и углом Пси (фаза).


Вектор на комплексной плоскости

Обратите внимание, что size_array=2^p2. Первая точка массива соответствует частоте 0 Гц (постоянная), последняя точка соответствует частоте дискретизации, а именно 44100 Гц. В результате мы должны рассчитать частоту, соответствующей каждой точке, которые будут отличаться на частоту дельта:

double delta=((float)header.frequency)/(float)size_array; //частота дискретизации на размер массива.


Алокируем массив амплитуд:

	double * ampl;
	ampl = calloc(size_array*2, sizeof(double));


И смотрим на картинку: амплитуда — это длина вектора. А у нас есть его проекции на действительную и мнимую ось. В результате у нас будет прямоугольный треугольник, и тут мы вспоминаем теорему Пифагора, и считаем длину каждого вектора, и сразу пишем её в текстовый файл:

for(i=0;i<(size_array);i+=2) {
		fprintf(logfile,"%.6f %f\n",cur_freq, (sqrt(out[i]*out[i]+out[i+1]*out[i+1])));
		cur_freq+=delta;
	}


В результате получаем файл примерно такого вида:

…
11.439514 10.943008
11.607742 56.649738
11.775970 15.652428
11.944199 21.872342
12.112427 30.635371
12.280655 30.329171
12.448883 11.932371
12.617111 20.777617
...


Окончательная версия программы обитает на гитхабе вот тут:
github.com/dlinyj/fft

Пробуем!



Теперь скармливаем получившейся программе тот звуковой файл синуса

./fft_an ../generate_wav/sin\ 100\ Hz.wav 
format: 16 bits, PCM uncompressed, channel 1, freq 44100, 88200 bytes per sec, 2 bytes by capture, 2 bits per sample, 882000 bytes in data

chunk=441000
log2=18
size array=262144 
wav format
Max Freq = 99.928 , amp =7216.136


И получаем текстовый файл АЧХ. Строим его график с помощью гнуплота

Скрипт для построения:

#! /usr/bin/gnuplot -persist
set terminal postscript eps enhanced color solid
set output "result.ps"
#set terminal png size 800, 600
#set output "result.png"

set grid xtics ytics
set log xy
set xlabel "Freq, Hz" 
set ylabel "Amp, dB"

set xrange [1:22050]
#set yrange [0.00001:100000]

plot "test.txt" using 1:2 title "AFC" with lines linestyle 1


Обратите внимание на ограничение в скрипте на количество точек по X: set xrange [1:22050]. Частота дискретизации у нас 44100, а если вспомнить теорему Котельникова, то частота сигнала не может быть выше половины частоты дискретизации, следовательно сигнал выше 22050 Гц нас не интересует. Почему так, советую прочитать в специальной литературе.
Итак (барабанная дробь), запускаем скрипт и лицезреем:


Спектр нашего сигнала

Обратите внимание на резкий пик на частоте 100 Гц. Не забывайте, что по осям — логарифмический масштаб! Шерсть справа, как я думаю, ошибки преобразования Фурье (тут на память приходят окна).

А давайте побалуем?



А давайте! Давайте поглядим спектры других сигналов!

Вокруг шум…

Для начала построим спектр шума. Тема про шумы, случайные сигналы и т.п. достойна отдельного курса. Но мы её коснёмся слегка. Модифицируем нашу программу генерации wav-файла, добавим одну процедуру:

double d_random(double min, double max)
{
    return min + (max - min) / RAND_MAX * rand();
}


она будет генерировать случайное число в заданном диапазоне. В результате main будет выглядеть так:

int main(int argc, char * argv[])
{
	int i;
	float amplitude = 32000;
	srand((unsigned int)time(0)); //инициализируем генератор случайных чисел
	for (i=0; i<BUF_SIZE; i++)
	{
		buffer[i] +=(int)amplitude*d_random(-1.0, 1.0); //nois		
	}
	write_wav("test.wav", BUF_SIZE, buffer, S_RATE);
 	return 0;
}


Сгенерируем файл, (рекомендую к прослушиванию). Поглядим его в audacity.


Сигнал в audacity

Поглядим спектр в программе audacity.


Спектр

И поглядим спектр с помощью нашей программы:


Наш спектр

Хочу обратить внимание на очень интересный факт и особенность шума — он содержит в себе спектры всех гармоник. Как видно из графика, спектр вполне себе ровный. Как правило, белый шум используется для частотного анализа пропускной способности, например, аудиоаппаратуры. Существуют и другие виды шумов: розовый, синий и другие. Домашнее задание — узнать, чем они отличаются.

А компот?


А теперь давайте посмотрим другой интереснейший сигнал — меандр. Я там выше приводил табличку разложений различных сигналов в ряды Фурье, вы поглядите как раскладывается меандр, выпишите на бумажку, и мы продолжим.

Для генерации меандра с частотой 25 Гц мы модифицируем в очередной раз наш генератор wav-файла:

int main(int argc, char * argv[])
{
	int i;
	short int meandr_value=32767;
	/* fill buffer with a sine wave */
	for (i=0; i<BUF_SIZE; i++)
	{
		//meandr
		if (!(i%(S_RATE/((int)freq_Hz/2)))) {
			if (meandr_value==32767) {
				meandr_value=-32767;
			} else { 
				meandr_value=32767;
			}
		}
		buffer[i]=meandr_value;
	}
	write_wav("test.wav", BUF_SIZE, buffer, S_RATE);
	return 0;
}


В результате получим звуковой файл (опять же, советую послушать), который сразу надо посмотреть в audacity


Его величество — меандр или меандр здорового человека

Не будем томиться и поглядим его спектр:


Спектр меандра

Пока не очень что-то понятно, что такое… А давайте поглядим несколько первых гармоник:


Первые гармоники

Совсем другое дело! Ну-ка поглядим табличку. Смотрите-ка, у нас есть только 1, 3, 5 и т.д., т.е. нечётные гармоники. Мы так и видим, что у нас первая гармоника 25 Гц, следующая (третья) 75 Гц, затем 125 Гц и т.д., при этом у нас амплитуда постепенно уменьшается. Теория сошлась с практикой!
А теперь внимание! В реальной жизни сигнал меандра у нас имеет бесконечную сумму гармоник всё более и более высокой частоты, но как правило, реальные электрические цепи не могут пропускать частоты выше какой-то частоты (в силу индуктивности и ёмкости дорожек). В результате на экране осциллографа можно часто увидеть вот такой сигнал:


Меандр курильщика

Эта картинка прям как картинка из википедии, где для примера меандра берутся не все частоты, а только первые несколько.


Сумма первых гармоник, и как меняется сигнал

Меандр так же активно используется в радиотехнике (надо сказать, что — это основа всей цифровой техники), и стоит понимать что при длинных цепях его может отфильтровать так, что, родная мама не узнает. Его так же используют для проверки АЧХ различных приборов. Ещё интересный факт, что глушилки телевизоров работали именно по принципу высших гармоник, когда сама микросхема генерировала меандр десятки МГц, а его высшие гармоники могли иметь частоты сотни МГц, как раз на частоте работы телевизора, и высшие гармоники успешно глушили сигнал вещания телевизора.

Вообще тема подобных экспериментов бесконечная, и вы можете теперь сами её продолжить.

Рекомендации по прочтению




Книга

Для тех, кто нифига не понял, что мы тут делаем, или наоборот, для тех, кто понял, но хочет разобраться ещё лучше, а так же для студентам, изучающим ЦОС, крайне рекомендую эту книгу. Это ЦОС для чайников, которым является автор данного поста. Там доступным даже для ребёнка языком рассказываются сложнейшие понятия.

Заключение



В заключении хочу сказать, что математика — царица наук, но без реального применения многие люди теряют к ней интерес. Надеюсь, данный пост подстегнёт вас к изучению такого замечательного предмета, как обработка сигналов, и вообще аналоговой схемотехнике (затыкайте уши, чтобы не вытекали мозги!). :)
Удачи!
Сергей @dlinyj
карма
453,5
рейтинг 0,0
Пользователь
Реклама помогает поддерживать и развивать наши сервисы

Подробнее
Спецпроект

Самое читаемое Разработка

Комментарии (48)

  • +2
    У спектра чистого лампового синуса шум что ли на уровне -48дБ? Или что это?
    • +4
      Преобразование Фурье конечной выборки эквивалентно оконному преобразованию с прямоугольным окном. То есть мы взяли бесконечную синусоиду и умножили ее на прямоугольную функцию. Преобразование Фурье произведения равно свертке преобразований каждой. Преобразование бесконечной синусоиды «хорошее», а вот прямоугольной функции не очень, оно равно sinc = sin(x)/x. На графике именно она дает такой вклад.
      А если на пальцах — это из-за не кратных периодов анализируемой функции и гармоник преобразования Фурье. «Шерсть» у автора, видимо, тоже оттуда же, где-то лучше совпадение, где-то не очень.
      • +2
        хмм, свертка sinc с преобразованием синуса (пара дельта-функций) даст пару sinc-ов, в области f > 0 — один смещенный sinc
        для 100 Гц и 2 с, если не напутал
        www.wolframalpha.com/input/?i=cos%28628t%29*rect%28t%2F4%29+fourier+transform

        Вопрос: как audacity получает свой ровненький спектр?
        • +1
          Мне кажется, что audacity просто закрашивает по локальным максимумам sinc
          • 0
            Судя по данным, которые экспортируются, там действительно ровненькая функция с одним максимумом
        • +1
          Вероятно, там для получения спектра используется не просто преобразование Фурье от всего файла, а что-нибудь типа периодограммы. Грубо говоря, сигнал бьется на куски, от каждого из них вычисляется квадрат модуля от БПФ, полученные результаты усредняются. При таком подходе реально видно, что спектр шума стремится к сплошному, а не гуляет туда-сюда.
    • 0
      48 dB = 2^16

      То есть это шум дискретизации 16-битного формата, используемого автором.
  • НЛО прилетело и опубликовало эту надпись здесь
    • +2
      Поддерживаю! Тоже сразу об этом подумал.
  • 0
    Я правильно понял, если сложить синусы 25, 75, 125 и так далее до частоты дискретизации, при этом амплитуда обратно пропорциональна частоте, то мы получим на выходе меандр?
    • +1
      Почти. Для идеального меандра потребуется бесконечность синусоид. А чтобы получить дискретизированный меандр, нужно складывать синусоиды заметно превышающих частоту дискретизации, хотя бы раз в 8. Впрочем, если точно известно, что исходный непрерывный сигнал прямоугольный, то можно восстановить его и по гармоникам с меньшей частотой.
      • НЛО прилетело и опубликовало эту надпись здесь
        • +2
          Да, вы правы конечно же.
  • +2
    Спасибо за статью!
    Дошел до
    Меандр курильщика

    и сразу проскролил ставить плюс :-))

    Вы хорошо пишите, с юмором и просто. Приятно читать!

    И все-же проскакивают фразочки, которые внезапно заставляют вернуться из мира пушистых математических котиков в суровый реальный мир и напрячь корку, как то:
    Величина, выраженная в децибелах, численно равна десятичному логарифму безразмерного отношения физической величины к одноимённой физической величине, принимаемой за исходную, умноженному на десять
    • 0
      Так последнее — это цитата из википедии :)
      • 0
        Ну, я так и подумал, что вы кого-то процитировали :-)
        • 0
          Забавно:

          И все-же проскакивают фразочки, которые внезапно заставляют вернуться из мира пушистых математических котиков в суровый реальный мир и напрячь корку...


          И у вас в профиле:

          Защитил диссертацию в аспирантуре на мат-мехе.


          Нестыковочка'с :)
          • +1
            Почему же нестыковочка? :-)
            Конечно, во время учебы привыкаешь читать сухой, формальный научный язык. Но это не значит, что его читать легче, чем что-то научно-популярное. Так корка расслаблена, и вдруг встречаешь что-то, от чего она начинает напрягаться, прямо посреди милых котиков и сисек :-)
      • +1
        dB = 10 lg(«Разы») — это для квадрата амплитуды (мощности).
        • 0
          Т.е.?
          • 0
            То есть надо исправить на 20*log10(A / A0). Тот же 16-битовый АЦП даёт, как известно, 96 дБ, а это 20*16*log10(2). В той же Википедии ниже идёт объяснение разницы между 10 и 20. В итоге нам без разницы: по мощности ли, по напряжению — децибел он и есть децибел. Видимо децибелы были придуманы для мощностей, а для амплитуд — это уже следствие.
  • +1
    Большое спасибо за статью! Буду с радостью ожидать продолжение!

    Могу порекомендовать для тех, кто больше заинтересовался компьютерной музыкой и её оцифровкой книгу Curtis Roads — The Computer Music Tutorial.
    В интернете есть в не очень хорошем качестве, но читать можно и нужно.
    Пусть слово «Tutorial» не вводит в заблуждение — это талмуд размером в 1200 страниц, в котором очень подробно объясняются все алгоритмы генерации, параметры звука, а в конце есть дополнения, в которых подробно рассматривается математическя сторона преобразований Фурье и прочих особенностях цифрового звука.
    • 0
      Большое спасибо за статью! Буду с радостью ожидать продолжение!


      Спасибо за спасибо :)

      А вот продолжения не предвидится. Я надеюсь, что люди сами по теме накопают. Может разве что перевести статью по обработке изображений.
  • 0
    кстати к теме обработки сигналов, на курсере скоро стартанет курс по сабжу https://www.coursera.org/course/dsp
  • +1
    Сергиенко, кстати, вполне понятно пишет по обработке сигналов.
    P.S. В данном случае спектрограммы красивее смотрелись бы в линейном масштабе по оси Y. А то в логарифмическом вылезает всякая дрянь.
    • 0
      Ну я надеюсь люди внимательны и сами могут отсечь лишнее :)
    • +2
      Так это как раз хорошо. Слабые сигналы видны на фоне сильных. И где дрянь — тоже видно. А спектрограммы часто нужны именно для того, чтобы увидеть, где и сколько дряни имеется.
  • 0
    Пост годный, но надо в него добавить как можно больше примеров восхитительной фильтрации!
    Фильтрация изображений, коммуникационных сигналов, сигналов радаров и т.п. -)
    В духе до и после. Так слепой, а так всевидящий!
    • +1
      По фильтрации можно написать отдельный пост. Однако я не владею должным образом темой :(
      • 0
        Ну тогда больше развеселых методов частотного анализа, а не только Фурье -)
        Или же по фурье ТОП5 наикрутейших алгоритмов.
        • 0
          Ну так, зачем дело. Напишите :). Я вообще электронщик, вы же приводили видео со мной ;)
      • 0
        ООО! А еще же тема аппаратного ускорения частотных преобразований и фильтрации — вообще не копана!
  • +2
    Тут гораздо интереснее «приземлить» математику на реальную жизнь.
    Например:
    говорят, что «тёплый ламповый звук» обусловлен тем, что ламповые усилители вносят искажения в чётных гармониках, в отличие от полупроводниковых, которые гадят на нечётных.
    Что это значит для художников?
    Да вот то, что ламповый усилитель «сглаживает» и «скругляет» форму сигнала. А полупроводниковый наоборот, делает её более «угловатой», похожей на меандр.
    А что то же самое значит для музыкантов?
    То, что ламповый усилитель к чистому звуку добавит октавы (каждая целая октава = удвоение частоты).
    А полупроводниковый туда добавит квинты (каждая квинта = полторы частоты).

    Ещё интересно: на очень высоких нотах сложно различить тембры различных инструментов.
    А это на самом деле прямое следствие теоремы Котельникова. Тембр — это смесь разных гармоник (у подавляющего большинства инструментов наиболее выражен основной тон, т.е. первая гармоника).
    Если взять на любом инструменте, скажем, «ля» шестой октавы — это частота 14080 герц в первой гармонике. А если возможность человеческого слуха ограничена, скажем 30кГц — это значит, что фактически для звуков с частотой от 15кГц до 30кГц он услышит только первую гармонику. А все остальные, которые как раз и передают тембр, окажутся отрезанными естественным фильтром ВЧ.
    • 0
      Прекрасно! Мне кажется, что это тянет на отдельный пост. Я даже для вас готов отфотографировать старые книжки по ламповой технике, которые показывают как они искажают звук.
  • +2
    Почему-то который раз не раскрывается зачем вообще это все в простым смертным программистам. А смысл довольно прост (простите дилетанта если что):

    Очень много нужных и полезных преобразований сводится к свертке. Свертка — это когда есть input[1024], есть filter[100], output считаем как-то так:

    for(int x = 0; x < 1024; x++) {
      sum = 0;
      for(int n = 0; n < 100; n++) {
        sum += input[x] * filter[x + n]
      }
      output[x] = sum
    }


    Примеры таких преобразований — фильтры blur и sharpen для картинок, всякие эквалайзеры и реверберация для звука, и еще много чего.

    В тупую (как выше), свертка требует O(sizeof(input) * sizeof(filter)) операций. Грубо говоря для blur-а 3x3 пикселя еще терпимо, а при 100x100 будет уже печально.

    Чтобы стало побыстрее, используют немного матана:

    Во-первых свертка преобразованного в фурье фильтра с преобразованным в фурье сигналом — это перемножение каждого с каждым элементов входного массива и фильтра. Это как ручки на эквалайзере примерно — умножаем ручку для определенный частоты, на частоту входа. Т.е. если есть input и filter в фурье-пространстве, мы можем делать свертку за O(N).

    Во-вторых был придуман алгоритм быстрого преобразования фурье, который действует за N*Log(N) от размера входного сигнала. Обратное преобразование вообще делается за O(N)

    Короче это все применяется чтобы из O(N*M), получить O(N*log(N)). Скажем blur-у после такого становится все равно какого он радиуса — будет считаться с одинаковой скоростью.

    Но не все так гладко: фурье-преобразование математически правильно делать только на бесконечном периодическом сигнале. Поэтому сверху надо еще немного матана в виде оконных функций — это уберет всякий совсем уж мусор, но совсем честно оно работать не станет все равно.
    • 0
      Совсем честно работать не станет, но вроде как можно его делать сколь угодно точным, чтобы ошибок не было даже во младших битах получаемых данных.
  • 0
    Я даже боюсь представить, где используется комплексное преобразование Фурье


    Странно видеть такую фразу в статье, где в первом предложении фигурирует аббревиатура «ЦОС». Вот в этой самой ЦОС и используется, направо и налево, причем как прямое, так и обратное.
    • 0
      Имелось в виду комплексные входные данные, но потом вспомнил что при обработке изображений
      • 0
        Почитайте про аналичитические сигналы, про квадратурное представление сигналов. Как правило, цифровая обработка радиосигнала производится на «нулевой частоте» в квадратурном представлении.
  • 0
    Вообще говоря, в общем случае нельзя напрямую брать БПФ случайного сигнала. Согласно теореме Хинчина-Колмогорова для оценки спектральной плотности мощности случайного сигнала, надо взять БПФ от автокорреляционной функции.
    • 0
      Или, если избегать наукообразности, просто усреднить пару десятков спектров мощности, посчитанных для кусков сигнала, взятых со сдвигом, равным половине длины куска — если уж ссылаетесь на теорему, которая как раз об этом.
  • +1
    При измерении напряжений и токов для децибелов берут множитель 20, а АЦП и ЦАПы я так понимаю регистрируют напряжение, а не мощность, тут точно должно быть 10?
    • 0
      Честно признаюсь, что не знаю однозначного ответа на данный вопрос.
  • +1
    Самое лучшее в статье — это анимация.
    • 0
      Как мне кажется, каждый для себя сможет найти что-то полезное. Кто-то картинки, кто-то создание звукового файла, а кто-то даже алгоритм преобразования Фурье.
      • +1
        Не в обиду — статья действительно хорошая, но иллюстрации в таких статьях обычно не очень. В большинстве статей о ЦОС или прикладных статьях яркие и нестандартные иллюстрации найти сложно. Мне часто не хватает ярких и понятных иллюстраций для объяснения таких вещей — потому и отмечаю именно это )))
        • 0
          Ну ради них все и затевалось
  • +1
    Спасибо за статью, мне тоже нравится эта тема. За примерами применения далеко ходить не надо, это ближе чем кажется. Даже балансировка колёс без этого не обходится ))

    Когда-то проходил курс www.coursera.org/course/dsp
    Он скоро опять начнётся, в конце апреля.

    Мне понравилось то, как они подходят к сути Преобразования Фурье. Не так как сам Фурье, а через линейную алгебру. Мне это здорово сэкономило усилия, т.к. с тригонометрией дружу плохо и вообще не математик.

    Эта тема особенная, потому что как только основные вещи становятся понятными, тут же появляется множество вопросов о границах применимости и разных инженерных трюках. Применение этого инструмента сродни маленькой науке внутри науки (математики).

Только зарегистрированные пользователи могут оставлять комментарии. Войдите, пожалуйста.