/sci/ - Спектрограмма и звук

Спектрограмма и звук Аноним 28/03/17 Втр 12:52:13 №408528

Сап, /sci/
Дело в том, что мне нужно сделать синтезатор а-ля FLдля себя, конечно же, но для этого мне нужно разобраться с представлением звука. Спектрограмма - самое очевидное, что может быть, но как так получается, что за 1 шаг дискретизации на спектрограмме может быть отображена целая гамма частот? Разве динамик может одновременно выдать такую гамму? Есть версия, что он просто очень быстро выдаёт все частоты по-очереди, поэтому спектрограмма должна быть как бы "под углом", который при большой частоте дискретизации незаметен, но инфы по этому варианту я не нашёл. И ещё - я проигрываю звук в 440Гц, но на пике появляется какая-то вертикальная линия в самом начале и плюс две горизонтальных линии около 15КГц вместо одной линии на 440Гц. Как всё это понимать?

Аноним 28/03/17 Втр 13:00:09 №408529

>>408528 (OP)
Алсо, пишу на мерзком шарпе, чему сам не рад. На пикрл я генерирую синусоидальную волну на 440Гц
sample_rate = 8000
freq = 440
duration = 3

Может, я генерирую её неправильно?

Аноним 28/03/17 Втр 13:00:28 №408530

2017-03-28-1258[...].png (15Кб, 1305x57)

>>408529
Отклеилось

Аноним 28/03/17 Втр 19:25:19 №408565

Ну и в каком разделе мне искать помощь?

Аноним 28/03/17 Втр 20:45:59 №408575

>>408528 (OP)
>Разве динамик может одновременно выдать такую гамму?
Аплитуда описывается чем-то подобным A =\sum A_i sin(w_i t + \phi_i). Поэтому вопрос несколько странен. Динамик все сразу и выдает. Напиши простенькую программу основанную на дискретном фурье преобразовании, и разберись, как заданные тобой гармоники после такого преобразования, будет типа такого. Что касается дополнительных пиков, я хз. Это и не связано ни с зеркальным эффектом, ни с теоремой котельникова. И вообще я мимопроходил

Аноним 29/03/17 Срд 00:25:09 №408595

Не уверен, но по-моему тут замешана форма колебаний и преобразование Фурье.
мимодаун

Аноним 29/03/17 Срд 00:36:39 №408596

>>408595
Фикс, не преобразование, а ряды Фурье.

Аноним 29/03/17 Срд 00:41:19 №408598

>>408595
Хорошо. Можешь в двух словах расписать, как ряд фурье становится звуком? Или без вдумчивого чтения статей это понять не получится?

Аноним 29/03/17 Срд 00:46:31 №408599

>>408598
Я возможно ошибаюсь, но суть вкратце такова: если у тебя форма волны отличается от синусоиды (прямоугольный, пила и тд), то она представляется в виде суммы элементарных синусоид, среди которых есть синусоида с основной частотой (в твоем случае 440Гц) и кратные ей гармоники, частота которых отличается от основной на целое число.

Аноним 29/03/17 Срд 00:47:31 №408600

>>408599
> на целое число
Снова быстрофикс в целое число раз.

Аноним 29/03/17 Срд 01:03:32 №408603

>>408599
Хорошо, это я понял
Какая форма волны будет у аккорда Am, например, который состоит из трёх звуков?

Аноним 29/03/17 Срд 09:04:11 №408614

>>408603
Суперпозиции 6 синусоид, если речь о гитаре.

Аноним 29/03/17 Срд 09:08:44 №408615

>>408603
А вообще, прочитай про волновое уравнение на отрезке хотя бы в Википедии.

Аноним 29/03/17 Срд 10:35:00 №408620

>>408598
Синусоиды суммируются и в зависимости от их частоты и амплитуды в сумме можно получить колебание любой формы. гугли ряд фурье, там будут картинки для понимания
Динамик воспроизводит всю сумму, т.е. непосредственно прямоугольное колебание или пиковый импульс, например. Спектр - это просто теоретическое разложение этой суммы на составляющие ее синусоиды.

Аноним 29/03/17 Срд 15:22:50 №408630

>>408620
Почему анон >>408614 говорит про суперпозицию, когда там сумма?

Аноним 29/03/17 Срд 16:19:21 №408635

>>408630
Мой косяк, там сумма, конечно. как я и писал выше>>408575

Аноним 29/03/17 Срд 16:20:58 №408636

>>408630
потому что это одно и тоже?

Аноним 29/03/17 Срд 16:21:27 №408637

>>408635
я уже загоняюсь, это одно и то же.

Аноним 29/03/17 Срд 16:41:39 №408638

короче тут вроде уже всё ответили, правда возможно не понятно для не посвященных, поэтому я в кратце просто опишу все тоже самое в одном посте.
>Есть версия, что он просто очень быстро выдаёт все частоты по-очереди
мне очень интересно как такая "умная" версия пришла в голову и как эта выдача частот по очереди вообще возможна? я честно говоря не представляю. оп может и представляет, но оп - то, что ты при этом представляешь будет скорее всего просто какой то другой, более высокой частотой. хотя нет, нет и еще раз нет. все равно какая-то херня.
>Разве динамик может одновременно выдать такую гамму
зачитай на вике импульсно кодовую модуляцию. хотя опять же наверное нет, почитал - посвященным эта статья нахуй не нужна, для непосвященных думаю будет непонятна.
вообще суть такова - ты пиздишь в микрофон, в нем колеблется мембрана, дроча сердечник в катушке, возбуждая ток в этой катушке с какой то там частотой. аналогично всё наоборот с динамиком. если пищать на одной частоте, будет колебаться с одной частотой. если пищать на разных или даже трепаться, несчастная мембрана будет подвергаться воздействию суммарных синусоид, отвечающих за каждую конкретную частоту.
это всё аналоговые технологии. ты же тут дискретизацию упомянул. маза дискретизации в том, что раз в сколько нить секунд или меньше делается замер текущего значения амплитуды сигнала. а сама процедура замера называется квантованием. и вот ты получил какое то циферное значение, нолями-единичками послал ччерез канал. на другой стороне сперва наоборот из конкретного закодированного послания получают текущую амплитуду и её собственно на обмотку катушки у динамика и выдают. пришел следующий отсчет выдали следующую амплитуду. как видишь работают вообще с текущим значием амплитуды и как бы говорят мембране динамика где конкретно относительно своего положения покоя она должна находится. про твои графики ничего сказать не могу, кроме разве что можно сюда дельта функцию приплести (в начале же не было ничего, а потом внезапно стало, вот тебе и точечное воздействие в начале), но не уверен, уже слабо помню всю эту теорию.

Аноним 29/03/17 Срд 16:44:12 №408639

>>408638
>суммарных синусоид, отвечающих за каждую конкретную частоту.
суммарной еботе, получающейся если графически сложить все синусоиды, каждая из которых будет отображать конкретную частоту.
оно же суперпозиция этих синусоид.
быстрофикс

Аноним 29/03/17 Срд 17:18:35 №408640

>>408636
f(g(h(x))) - разве не это называют суперпозицией?

Аноним 29/03/17 Срд 18:11:42 №408646

>>408640
ну тут мы немного в терминологии наверное разъебались. что я >>408638
что >>408637
имели ввиду суперпозицию из физики. "Принцип суперпозиции — один из самых общих законов во многих разделах физики. В самой простой формулировке принцип суперпозиции гласит:

Результат воздействия на частицу нескольких внешних сил есть векторная сумма воздействия этих сил.
Любое сложное движение можно разделить на два и более простых." ц ВИКА )) а ты привел компзицию функций из математики. причем я хз, может они еще и эквивалентны, в матане не силен. с другой стороны пока читал про твою композицию, увидел что от порядка следования функций в композиции зависит конечный результат. а в случае звука совершенно похуй, будешь ты сперва рассматривать одно элементарное колебание или другое)

Аноним 30/03/17 Чтв 12:32:59 №408689

sine.png (1Кб, 94x480)

square.png (15Кб, 94x480)

Возникло ещё немного вопросов

Первый пик - синусоидальная волна, второй пик - меандр. Все по 440Гц. Как так получилось? Разве не должен меандр выдать просто ровную горизонтальную линию, как и синус, но без сглаживаний по краям?

Аноним 30/03/17 Чтв 12:49:32 №408690

triangle.png (1Кб, 94x480)

saw.png (7Кб, 94x480)

>>408689
Вот для треугольной волны и для пилы. Нихуя не понял, подскажите

Аноним 30/03/17 Чтв 12:54:24 №408691

>>408689
>>408690
Это из-за того, что метод Фурье хорошо работает только для синусоидальных волн?

Аноним 30/03/17 Чтв 12:58:02 №408693

>>408689
Меандр состоит из основной гармоники + бесконечное число нечетных высших гармоник.

Аноним 30/03/17 Чтв 13:00:36 №408694

>>408693
А если разложить синус на комбинацию меандров, то его тоже распидорасит?

Аноним 30/03/17 Чтв 13:06:35 №408695

>>408694
Ну если взять 2 меандра - первый с f, а второй в противофазе с f*2, то нет.

Аноним 30/03/17 Чтв 13:11:14 №408696

>>408695
Кажется, я что-то начинаю понимать

Почему при разложении звука на спектр используют разложение по синусам? Ведь есть много других ортогональных функций. Может, есть какой-нибудь софт, где можно получить другие спектрограммы?

Аноним 30/03/17 Чтв 19:52:56 №408724

Возник ещё один вопрос
При постройке спектрограммы используется свёртка функции волны? Как правильно выбрать её размер и шаг?

Аноним 30/03/17 Чтв 20:27:33 №408727

>>408696
Потому что синус соответствует простейшему виду свободных колебаний.

>>408724
Возникает встречный вопрос
Как ты вообще собрался что-то делать с таким уровнем понимания? Как ты вообще собираешься что-то понять, получая знания на сосаче?

Аноним 30/03/17 Чтв 20:30:30 №408729

>>408727
Ну не всем же бородатыми профессорами быть. Как быть со свёрткой и правильно ли я её понял?

Аноним 30/03/17 Чтв 21:01:19 №408730

>>408729
Так и что же ты про нее понял?

Аноним 30/03/17 Чтв 21:04:24 №408732

>>408730
Что она делается для волны, по которой строится спектрограмма? Или нет?

Аноним 31/03/17 Птн 12:07:53 №408749

>>408528 (OP)
Ты не туда смотришь. Начни с ворм волны, модуляции и простых фильтров. Это основы синтеза. Разглядывать спектр - глупо.

Аноним 31/03/17 Птн 12:08:35 №408750

>>408749
Но для этого даже есть отдельный жанр

Аноним 01/04/17 Суб 17:22:09 №408904

>>408729
насколько я помню свертка это вообще ебота, использующаяся для расчета четырех полюсников.типа на вход подают сигнал. известно что внутри четырехполюсника с сигнлаом будут происходить по такой то функции. сигнал на выходе с четырехполюсника это свертка функции сигнала на входе и функции самого четырехполюсника. причем тут твои бесконечные спектры я хз. я тебе писал про дельтафункцию? почитай про неё. пойми что у такой функции спектр бесконечен. оттуда же вытекают твои линии на рисунках с меандрами. если сигнал не синусоида у него скорее всего будет бесконечный спектр. правда на конкретных частотах его мощность будет близка к нулю. если вспомню как в инсте связи назывался предмет, где всё это проходят, отпишу

Аноним 01/04/17 Суб 18:05:10 №408917

>>408904
Ну надо же как-то поделить длинную волну мелодии на части, чтобы разложить каждый кусочек на спектр?

Аноним 01/04/17 Суб 18:15:52 №408921

>>408917
называется это "разложение функции в ряд фурье". типа есть у тебя функция, отображающая эту мелодию. разлогая её в ряд фурье ты как бы собираешь эту "функцию мелодию" из бесконечного ряда синусоид. в вике статья меандр(радиотехника) есть гифка слева. она очень хорошо показывает как именно из кучи синусоид получают меандр.

Аноним 01/04/17 Суб 18:17:02 №408922

>>408921
Я это уже и так понял
Но не буду же я 2-минутную волну раскладывать в ряд Фурье?

Аноним 01/04/17 Суб 18:26:54 №408923

>>408904
бля открыл сча даже свой диплом. посмотрел на список предметов и хуй его знает... изначально со свертками мозги ебали на матане. на всяких теориях передачи сигнала вроде вообще не про то говорили. на проектировании цифровых систем тоже. с одной стороны помню вроде четко о чем на каждом из предметов трепались. с другой складывается впечатление что на половине из них про спектры что нить да обсуждали. правда после самого ряда фурье на матане все эти обсуждендия уже были в духе "ну вы и так всё понимаете".

Аноним 01/04/17 Суб 18:30:55 №408924

>>408922
я наверное тебя не понимаю. че ты хочешь то? если хочешь известную сложную функцию разложить на простые - раскладывай рядом фурье. есть даже так называемое "быстрое преобразование" чтобы это быстро делать. если ты хочешь что нибудь другое, то что именно то? к слову, для того чтобы передать эту мелодию на расстояние тебе вообще ряд фурье не нужен, надо амплитуду сигнала замерять раз в сколько нить времени и передавать свои замеры, на другой стороне из них получая исходный сигнал. но и про это я уже писал выше.

Аноним 01/04/17 Суб 18:37:02 №408925

saw.png (7Кб, 94x480)

>>408924
Например, вот этот спектор 3-секундной пилообразной волны. Каждая вертикальная линия содержит ~0.03191489361702127660 секунды, если я правильно всё понял(94 пикселя / 3 секунды). Получается, берётся свёртка функции волны с шириной и шагом равными 0.03191489361702127660 секунды? Чем мотивировано именно такое значение и можно ли шаг брать меньше ширины свёртки?

Аноним 01/04/17 Суб 18:47:39 №408927

>>408925
вот тебя шлют к ряду фурье и шлют. а ты всё спектр да спектр. что вообще такое спектр? он кстате разный бывает. ну в смысле твои линии насколько я понял это частотный спектр. другими словами на рисунке на твоем линиями изображены синусоиды. у синусоиды есть период - расстояние от её начала до того момента как график повторится. если 1 разделить на период получим частоту синусоиды.
взял ты пилообразный сигнал, разложил его в ряд фурье, получил много много синусоид. на графике они и отображены. типа в твоем пилообразном сигнале вот такие синусоиды, с такими частотами. если все их вместе сложить графически, получится пилообразный сигнал. это, еще раз повторяю хорошо отображено на гифке в статье вики меандр(радиотехника).
а еще спектр может быть амплитудным, тогда такие линии будут отображать амплитуды синусоид.
причем тут свертка я не знаю. хотя, как я уже писал, единственное что помню о свертке - что она используется для расчета четырехполюсника.

Аноним 01/04/17 Суб 18:51:43 №408928

>>408927
Мой вопрос не в том, как раскладывать волну(про FFT я уже прочитал и готов его применить), а в том, как правильно нарезать музыкальную дорожку, чтобы получить спектр для каждой получившейся такой нарезкой части

Аноним 01/04/17 Суб 18:53:03 №408929

>>408925
к вопросу шага дискретизации. допустим у тебя есть синусоида с частотой 4 килогерца. тебе надо её оцифровать и передать в цифровом канале. ноликами и единичками. спрашивается как часто надо делать замеры, чтобы на другом конце твою синусоиду можно было восстановить? ответ даёт теорема котельникова - замерять надо в два раза чаще чем частота твоей синусоиды. т.е. с частотой 8 килогерц. или сколько там мили секунд сам посчитай)). теперь усложним ситуацию - у тебя мелодия из 5 разных синусоид. ну или из тех,что на твоем последнем рисунке. чтобы на другом конце можно было восстановить твою мелодию без потерь надо делать замеры амплитуд в два раза чаще, чем самая верхняя полосочка на твоем рисунке.

Аноним 01/04/17 Суб 18:56:18 №408930

>>408929
А если брать 1/4 от частоты самой быстрой синусоиды, то спектрограмму распидорасит?

Аноним 01/04/17 Суб 19:00:46 №408931

>>408928
возьми самую высокую частоту в музыкальной дорожке, которую ты хотел бы слышать, после чего режь дорожку с частотой в два раза большей. при этом не обращай внимания на то, что у тебя есть частоты выше, чем та максимальная, которую ты хотел бы слышать. потому что частот там один хер бесконечное множество.
имей так же ввиду что человеческое ухо имеет предел слышимости по частоте - ультразвук, что присутствует в твоей дорожке один хер мусор и на него можно забить.

Аноним 01/04/17 Суб 19:05:37 №408932

>>408931
http://www.fon.hum.uva.nl/praat/manual/Sound__To_Spectrogram___.html
Вот тут, кажется, то, что мне нужно.
> time step never needs to be smaller than 1/(8√π) of the window length, and the frequency step never needs to be smaller than (√π)/8 of the inverse of the window length
Что такое time step я понял, но формулировку inverse of the window length для frequency step я не понял. Разве не должно быть написано window height?

Аноним 01/04/17 Суб 19:06:21 №408933

>>408932
Блядь, там про другие окна говорится, в глаза ебусь
Посижу, почитаю про них

Аноним 01/04/17 Суб 19:06:29 №408934

>>408930
1/4 от частоты в смысле реже в 4 раза чем самая большая желаемая частота? ничего не распидорасит, просто слышать будешь только то, что еще в два раза реже будет, чем твои замеры. если имелось ввиду в 4 раза чаще - тоже ничего не распидорасит, просто в твоем нарезаном сигнале будет ненужная тебе состовляющая, которая в два раза опять же реже чем шаг дискретизации.
вообще теорема котельникова она для чего - тебе надо передать сигнал, а канал не резиновый. спрашивается как бы поменьше его засирать и вообще какой он нужен чтобы звук передать. вот котельников дал ответ - достаточно мерять в два раза чаще чем самая высокая желаемая частота. по дефолту человеческое ухо збс слышит на диапозоне частот от 0,3 до 4 кгц. поэтому дефолтовая импульсно кодовая модуляция замеряет треп с частотой 8 кгц

Опции
Имя
Тема
Пост	[S] 15000

	Sage Ватермарка Мод тег ОП треда
Файлы	Макс объем: 40Mб, макс кол-во файлов: 4 Кликни/Брось файл/ctrl-v
Captcha

Перед отправкой сообщения прочтите FAQ, FAQ раздела и правила раздела. vk.com/ru2ch - оФФициальная группа VK 2channel.hk - Пасскодач