Pull to refresh

Comments

Слушать не буду, потому как знаю, что разница есть. Убедился в этом лично, когда построил в своей машине достаточно хорошую аудио систему с поканальной задержкой сигнала. Теперь записываю в основном FLAC разных калибров, также понял, насколько разные артисты по-разному записывают музыку, раньше этого не слышал и домашней "акустике". Не могу похвастаться хорошим музыкальным слухом, но боюсь большинство пользователей не заметят разницу на стандартных колонках, нужно что-то более серьезное.
Больше всего хотелось бы прочитать сравнение людьми, с таким хорошим слухом и оборудованием как у вас.
И на более-менее бюджетном варианте акустики слышно, и даже иногда на примитивных ушных вкладышах. Но то, что от качества оригинала зависит — однозначно.
А можно подробнее про поканальную задержку.
Конечно разница есть, и заметить её не сложно даже на простеньких Edifier R2800 подключенных через оптику.
Ждал красивых графиков и численных показателей.
меандр на реалтек, услышать разницу между флаком и 320 мп3 сомнительная затея.

может у мп3 все еще хуже.
прокомментирую осциллограмму, меандр это прямоугольные импульсы (прямоугольника тут нет и рядом) показан фронт(нарастание), жёлтый и синий это левый и правый канал.
Судя по тому что фронт размазан в обе стороны у реалтека серьёзные проблемы с временем прохождения сигнала разной частоты, и связано это не в последнюю очередь с фильтром высокого порядка и однобитным ЦАП.
И попрошу заметить осциллограф 8 битный — динамический диапазан гараздо уже чем у человеческого уха,
То что зафиксировал осциллограф нарушает восприятие "объёма" звука.
Спасибо за коментарий. Но возможно меандр прогнаный через мр3 128 будет еще менее прямоугольным.
Кстати идеального меандра не существует в реальном мире. Он бы потребовал бесконечного спектра и соотв бесконечной энергии. Главное определить частоту среза, если она выше 10кгц — то 99% людей ни чего не заметят.
Задержка между каналами у вас 44 мкс, а это примерно равно частоте 22 кгц, такие отличия человек не заметит.
Переходной процесс занял около 6кмс, а это 144кгц, это вообще за гранью человеческих возможностей.
Тут специально вызвал курсорные функции разница 83,5 микросекунды, что соотвествует 11,9 килогерцам(указано в правом нижнем углу) 44,2 микросекунды это сдвиг осциллограммы от времени срабатывания триггера (триггер настроен на нарастание при 0 вольт если докопаться то получается что минимум -1 с копейками вольт, а максимум почти 2 вольта то есть присутствует постоянная составляющая. что вообще не хорошо, но скажется на звуке в наушниках только при громкости близкой к максимальной. переходной процесс кстати составил 50 мкс (если замерять от первого гребешка до последнего, если замерять выброс то да около 6 мкс)
Ясно, ошибся, но 11.9 кгц все равно не будет заметно практически ни кому. Насчет 6мкс — просто чтобы сделать более крутой фронт нужны более высокие гармоники, выше 144кгц, а это скорее всего значит, что для человека крутость этого фронта (на разумной громкости) будет не отличима от более крутых. И скорее всего звукоизлучатели не смогут обеспечить даже этого. Наверняка есть приблизительные формулы для расчета мощности необходимой что-бы сдвинуть диффузор, сжать воздух и растянуть подвес, на нужную амплитуду с учетом громкости. Кроме того на 144кгц уже может оказывать влияние и провод, и паразитные емкости и индуктивности остальной системы.
Это может показаться диким на первый взгляд, но слух очень чувствителен разности прихода звука в левое и правое ухо, на частотах до 3 килогерц — на слух можно отличить отклонение источника звука на 10 градусов, а это уже около 80-90 мкс, в зависимости от расстояния между ушей и скорости звука которая зависит от кучи параметров, выше 3 килогерц слух уже ориентируется по громкости, отсюда выходит что до 3 килогерц будет смещение источника звука, а выше не будет, как воспримут мозги такой обман это уже индивидуально.
Т.е. вы утверждаете, что звон (волны), которые мы тут видим — это плохо?
Что тут однозначно плохо так это задержка между правым и левым каналом, а как вы выразились "звон" побочный эффект работы фильтра высокого порядка который обязательно присутствует в схеме однобитных ЦАП'оп, подавляющее большинство современной техники использует именно такой цап, и как мне кажется большинство пользователей цифровых форматов вообще не слышало и не видело мультибиных цапов (я кстати только видел на картинках в интернете ) для борьбы с этой пакостью в дорогих звуковухах используют ресемплинг до 192/24 для такой частоты фильтр настроен на более высокую частоту и можно использовать порядок поменьше.
На счет звона — это абсолютно здорОво и наоборот говорит о наличии реконструкционного фильтра на выходе.
Почему? Слышно и вполне хорошо. Слышно больше деталей.

Вот аудиофиольское прослушивать да, искать темный или светлый звук)
дважды слепой тест или очередной самообман?
Ближе к слепому тесту, раньше(когда музыка либо таскалась на дисках в mp3 с каким-угодно битрейтом, либо рипилась c Audio-CD) когда слушал музыку пытался угадывать битрейт и чаще всего попадал.
Флак Флаку рознь, надо сравнить какой-нибудь рип 192/24 с обычным.
А потом загоняем этот рип в аудасити, смотрим и оказывается что его получили из 41/16 нойз шарингом и ресеплингом, жалуемся на раздачу, и модератор её[жалобу] благополучно трёт потому, что почти все раздачи такие.
Я как-то скачал 1.5 гиговый альбом Арии "Герой Асфальта", рип был сделан с пластинки, когда я первый раз услышал его в машине я офигел, столько лет слушая на стандартной системе я не мог услышать физически некоторых нюансов в музыке, тут же альбом просто преобразился… эх, столько места нет на флешке, чтобы все сохранить в таком качестве :)
Переконвертируйте его в 44.100 16 бит и не заметите разницы.
Кодируйте в vorbis (ogg) или opus (или даже aac, но с чуть повыше битрейтом). Битрейта 128 kbps хватит, чтобы не отличить от оригинала. 160, если слышите 20-22 kHz.
18+ килогерц в формате 44,1/16 модулируется несущей с образование весьма слышимых частот, на фоне которых оригинальный писк теряется.

opus не кодирует выше 20kHz. На любом битрейте. Могу ткнуть пальцем в код.
к первым альбом исходники вообще утеряны. и все пм3/сд-аудио оцифровки с обычных кассет
А не подскажете, где можно купить 192/24 уши? У кого не спрошу — у всех максимум 16 битные уши, разве 24 битные уже выпустили? Где можно проапгрейдить?
Проапгрейдить уши (свои, биологические) можно проживанием в тихом месте и прослушиванием певчих птиц. Тут в комментариях я пытался донести, что в аудиотракте всё должно быть прекрасно — аппаратура, записи с их мастерингом, помещение и слушатель, но не поняли:
https://geektimes.ru/company/audiomania/blog/270580/

Проапгрейдить выше 16 бит не получится. Ни один двойной слепой тест с людьми которые говорят что слышат разницу — не показал что они ее слышат. Никаких свидетельств того что человек расслышит разницу я не знаю.
Можно подробней лично, что вы именно ожидали увидеть?
У меня походу дела такой отстойный звук у ноутбука, что я даже в наушниках не смог отличить 128 и флак 0_О
При этом я всегда считал, что у меня достаточно хороший слух.
Залил в свой плеер Sony NWZ-E584, в котором всегда слушаю музыку, он не смог прочитать, говорит, возможно файлы повреждены.
Попозже поэксперементирую, запишу на болванку и попробую послушать в своём всеядном дисковом плеере.
А вообще, храню музыку в 320 и не заморачиваюсь особо, так как не обладаю настолько хорошей аппаратурой воспроизведения, которая способна вытащить малейшие оттенки звука.
При этом я всегда считал, что у меня достаточно хороший слух.
Тоже так думал. Скачал файлы, тыкал-тыкал в A-B сравнении через аудасити… И не услышал разницы.
А у меня ведь Mackie MR5 mk3 и Akai EIE Pro. Да, не сильно-то студийно, не, как говорится, Lynx.
Теперь незнаю чего думать.
Sennheiser CX 300-II, встроенный риалтек звук на компе. 8 лет музыкальной школы и разницы нет вовсе для меня. Я тоже думал что у меня хороший слух, но увы.
Это встроенный реалтек все портит. Послушайте на хорошем аудиотракте, может у кого из знакомых есть. Разница колоссальная, иначе не продавались бы дискретные аудиокарты, ЦАПы и прочие источники звука.

Обоснуйте, чем realtek плох?
Ответ качеством звучания, я так понимаю вас не устроит?

На отдельных аудиокартах:



  • лучше ЦАП
  • качественней разводка
  • меньший шум и наводки
  • снижается нагрузка на процессор

Если слушаете только mp3 и имеете отстойные колонки типа Genius, Defender и прочий шлак, то внешняя вам не нужна.
На самом деле проще сказать, чем лучше Realtek. Только ценой.
Да бывают отдельные реализации, которые неплохо звучат, но это скорее исключение.
И ниже 2-битный тест, на встроенной я не услышал ничего.
— Что значит лучше ЦАП? Какие-нибудь формальные метрики приведите. И как-то обоснуйте, почему человек может действительно это услышать.
— Разводка и шумы зависят от тяп-ляпости некоторых инженеров, можно найти и нормальную мамку. На моей никаких шумов и искажений не обнаружилось.
— Не вижу причин снижения нагрузки на процессор.
— И о каком 2-битном тесте речь?
Приглашаю покурить мат.часть.
Качество ЦАПов отличается, это надо объяснять? SNR для вас я так понимаю не показатель?
На материнке слишком много других элементов, которые наводками портят звук. Да и нет там места для нормальной разводки, видели размер хороших звуковух? Смысл тратить место на текстолите ради чипа стоимостью менее доллара?
На встроенном звуке в играх звук обрабатывается процессором, на внешних на самой звуковухе.
Всю ветку комментов почему-то затерли.

www.ant-audio.co.uk/test/2bit_fragment.zip
Услышите ли вы что-нибудь на встроенном звуке?
Я не услышал ничего, но явно слышал на на ЦАПе.

И если вы не слышите разницу в звучании 320kbps mp3 на встроенном звуке и даже простой audigy или asus xonar, то вам это не нужно.

Могу заверить большую часть звука в встроенной звуковухе портит связка приёмник звука — ОУ, а не ЦАП.
Сопротивление ОУ и приёмника должно быть согласовано, в противном случае будет наблюдаться или передемфирование или недодемпфирование, хотя для наушников это не так сильно заметно, для высокоомных приёмников начинается эпопея с тепловыми шумами и наводками на кабель.


и это даже не режим пикдетектора,
SNR встроенной звуковухи намного ниже SNR типичной комнаты даже ночью.
Наводки — это аддитивные искажения, их должно быть слышно даже при выводе тишины. У меня полная тишина.
Звук в играх уже давно не обрабатывается аппаратно. Да и не надо особо, учитывая наличие кучи ядер у современных процессоров.
Двухбитный фрагмент слышу как на Focusrite Scarlett 2i4, так и на realtek alc1150.

И как же хорошо, что я не слышу разницу 320kbps mp3 между чем-то и чем-то. А может и услышу, но тратить время на выяснение не вижу смысла.
SNR это не уровень фонового шума, а соотношение сигнал/шум. Делая громче уровень звука, повышается уровень шумов.

Вам повезло, 1150 меня тоже удивил в свое время, лучшее из встроенного, что я слышал.
Я знаю, что такое SNR. Имелось в виду, что сигнал-шум только воспроизводящего устройства будет ниже сигнал-шума всей системы в целом, включая помещение, причем намного. Так что SNR звуковухи можно пренебречь.
Мда уж

результат
Are you sure you have connected your audio system correctly? Check and try again.

У меня все работает. Хотя на встроенной звуковухе почти не слышу разницы.

Куда звук выводите? ОС, аудиотракт.
Да нет, это они посмеялись над тем, что правильно ответил на 1 из 5. :) У меня Plantronics .Audio 628. Дома еще проверю на динамиках.
Plantronics весьма специфичные гарнитуры они больше на голос рассчитаны, нежели на музыку, сам владею уже 4 года Gamecom 780. Дужка сломалась, провод потрескался, но все равно пользуюсь.


1 из 5 тоже показатель, вы слышите разницу, но не можете верно распознать. Mp3 дает немного окраски звуку. Из других форматов со сжатием с потерями, OGG звучит шикарно. А вот регулярные 2 или 3 из 5, это явный признак, что разницы не слышно.
3 из 5 в ушах Jabra UC Voice 150. Хмм…
Да-да, тест звука в браузере, супер-супер.
Согласен, что сама по себе задача не тривиальная вывести FLAC через веб, браузер и ОС. Да я разницы слышу меньше, чем при проигрывании с диска.
Честно пытался поймать хоть какую-то разницу. Тщетно. По сути отвечал практически наугад. 3 из 5. Наушники игровые: SteelSeries Siberia V2. Похоже мне нет никакого смысла коллекционировать flac :)
Попробуйте с диска послушать, все таки вывод FLAC через веб. Неизвестно что у них под капотом. Да и не знаю я как браузер обрабатывает и воспроизводит звук. Я сам там немного слышу.

На таких ушах нет особого смысла слушать музыку. Да будет слышно разницу, но не будет удовольствия от нее. Сам имею игровые уши(Plantronics Gamecom 780), но музыку слушаю только на Sennheiser HD205, которые в 2 раза дешевле.
5/5 через динамики ноутбука. Его величество рандом зарешал.
3 из 5 машинка древняя аудио встроенное прослушивал через sven ms1090
Всего 5 вопросов? Пфф, с вероятностью 1/32 случайный тык даст 5/5
Раньше проверял — на компьютерных колонках отличал CD от 128, а вот от 192 уже нет. Интересно глянуть, что там остается. Кстати, если остается и даже слышно — не факт, что будет слышно на общем фоне музыки. Алгоритм же еще убирает звуки, которые не слышно из-за того, что перед ними громкий звук какой-то.
минус у теста в том, что фрагменты таки слишком короткие, на полном треке определить совсем было бы просто, и не очень насыщенные звуком, но думаю справился.
Эммм. Только я не понял очём пост?)
Я ожидал увидеть техническое описание разницы… Оно потом будет?
Расскажите, пожалуйста, мне лично, о чем именно вы говорите.
Содержание всего поста сводится к: скачайте, сравните, напишите. И всё. Я думал, что тут будет какое-то свежее детальное разбирательство форматов, частотный анализ, таблички, диаграммы, "что именно теряется при сжатии из lossless в mp3 128 kbps или 320 kbps" :)

Я бы название статьи изменил. Нечто типа "Опрос: слышите ли вообще разницу между mp3 128 kbps, 320 kbps или flac".
Как раз чуть ниже разница "что именно теряется при сжатии из lossless в mp3 128 kbps или 320 kbps"
Сам не с первого раза вник в статью.
Не совсем, в конце статьи предлагаю непосредственно услышать звуки, которые потерялись при сжатии. Вместо очередных графиков, чтоб прям совсем наглядно.
Дополнил первый абзац. Понятнее теперь он?
UFO just landed and posted this here
а просто слушать музыку в хорошем качестве ещё лучше
На хорошей акустике, хотя бы под 200-300 Вт разница очень заметна)
Решил даже поучаствовать в опросе, но не смог достоверно различить ни одного из 4х треков. Знал, конечно, что у меня не суперзвук в компе, но как-то обидно даже стало)
Было бы неплохо спектрограмму для всех трёх вариантов качества показать. Было бы интересно увидеть что ты не услышал. :)
Там дифф есть, ссылка в конце.
Могли бы и скриншот в 320*240 кинуть, а спектрограммы разрешением выше не нашлось?
Там график до 8к только.

Вот такая лучше бы сказала.

image
В Audacity легко настроить спектрограмму:

Window type (apodization function) = Blackman-Harris or Hanning or Kaiser
Window size (fast Fourier transform window) = 1024
Minimum frequency = 0 Hz
Maximum frequency = 23000 Hz or 23 kHz
Gain = 20 dB
Range = 110-120 dB

p.s. Взято с what.cd.
Параметры конвертации в mp3
44.1kHz, stereo, 128 kbps или 320 kbps
остальные параметры дефолтные? И для всех представленных треков одинаковые?
лезем в доку по Lame и читаем:
-q n Internal algorithm quality setting 0..9.
0 = slowest algorithms, but potentially highest quality
9 = faster algorithms, very poor quality
Default is 3.

а там вообще-то ещё просто дофига параметров, (в старых версиях было больше, типа:
ATH related:
--noath turns ATH down to a flat noise floor
--athshort ignore GPSYCHO for short blocks, use ATH only
--athonly ignore GPSYCHO completely, use ATH only
--athtype n selects between different ATH types [0-5]
--athlower x lowers ATH by x dB
--athaa-type n ATH auto adjust types 1-3, else no adjustment
--athaa-loudapprox n n=1 total energy or n=2 equal loudness curve
--athaa-sensitivity x activation offset in -/+ dB for ATH auto-adjustment

PSY related:
--short use short blocks when appropriate
--noshort do not use short blocks
--allshort use only short blocks
--cwlimit [freq] compute tonality up to freq (in kHz) default 8.8717
--notemp disable temporal masking effect
--nspsytune experimental PSY tunings by Naoki Shibata
--nssafejoint M/S switching criterion
--nsmsfix M/S switching tuning [effective 0-3.5]
--interch x adjust inter-channel masking ratio
--substep n use pseudo substep noise shaping method types 0-2
--ns-bass x adjust masking for sfbs 0 — 6 (long) 0 — 5 (short)
--ns-alto x adjust masking for sfbs 7 — 13 (long) 6 — 10 (short)
--ns-treble x adjust masking for sfbs 14 — 21 (long) 11 — 12 (short)
--ns-sfb21 x change ns-treble by x dB for sfb21

В результате файл с одного исходника с одним и тем же битрейтом мог быть реально очень разным, реально различимо на слух разным — даже больше чем при разном битрейте.
Но народ массово накодил в пакетном режиме с дефолтными настройками и потом делает выводы о качестве формата/кодека.
Вцелом это конечно качество формата "в среднем" да, но в не меньшей степени это качество — мера халтуры/лени того, кто занимался перекодированием. Извините если кого обидел, понимаю что "98% людей не меняет дефолтных настроек" (и даже не догадываетмся о них), но если уж делать вроде как анализ с выводами — то можно было бы если не копнуть поглубже, то хотя бы оговорить фигуры умолчания явно..
А лучше vorbis (ogg) или opus.
Тест некорректен. У меня была как-то идея сделать корректный тест и опубликовать его здесь, но я решил, что это никому не нужно.
Некорректен он потому, что люди будут использовать разные аудиоплееры с разными настройками на разных картах. Необходимо сделать дистрибутив Linux с прямым декодированием аудио, с выставлением той частоты дискретизации на карте, которая соответствует файлу.
Что толку от того, что вы даете файлы 192 кГц 24 бита, если их с большой вероятностью воспроизводят в стандартном плеере с ресемплированием операционной системой до 48 кГц 16 бит, далеко не самым качественным алгоритмом?
Ещё бы opus поддерживался получше. Пока приходится на телефон vorbis-ом кодировать.
Вот еще вспомнил, почему тест некорректен — кривые драйверы. Однажды, на компьютере друга, мы выставили частоту 192 кГц по умолчанию, и получили звук гораздо лучше, таким, каким он и должен был быть. Причем, если не устанавливать драйвер на звук от производителя, звук был лучше, чем с драйвером.
Согласен с вами, на основе данного теста делать общий итоговый вывод будет совсем некорректно, но каждый человек может сделать вывод для себя (для своего аудиотракта и своих ушей) самостоятельно, и в связи с этим выводом уже принимать решение "надо ли что-то менять или оставить как есть".

Опрос это побочный момент, изначально хотел наглядно показать, что же потерялось при сжатии, чтобы человек, мог сам услышать какие детали исчезли, если произошло сжатие до 128 kbps, а какие до 320 kbps, не вслушиваюсь напряженно в каждый из треков, предназначенных для опроса.

Пока что мне не удавалось отличить MP3 320 от lossless. MP3 192, возможно, отличу — зависит от конкретной записи.
Слушаю на EMU 0404 и ортодинамических наушниках Hifiman HE-400.

Только что закончил аудиоинсталляцию в авто, буду ещё там аудиофильствовать — может, что-то новое услышу :)
Интересно мнение аудиофила.
Для авто говорят AAC 96 достаточно (AAC iTunes
qaac --cvbr 96 -o ). Напиши, слышно разницу?

В этом топике: поставил колонки в машину! буду слушать!
Cowon J3 или cowon с лучшим железом + уши от AKG с толстым кабелем, или от AT.
Для сопротивления. На фото сталь, а нужна медь и серебро. Срочно меняйте!
Попробовал послушать на своем Fiio X1 с весьма обычными наушниками Xiaomi Piston 3.
Разницу действительно слышно. В средних частотах сложно что-то отличить, но на заметных басах и высоких становится понятно где что.
Разница есть точно, а вот с определением проблемы. Для меня, не всегда Flac лучше mp3. На опрос ответил, с удовольствием гляну на результаты.
При сжатии в первую очередь теряются высокие частоты, так как они занимают больше всего места. Вот сравнение одного трека на 128 Кбит и 192 Кбит:

image
Хорошо видно, что у 128 битного файла высокие частоты резко обрезаны.
Скопирую свой прошлогодний комментарий в подобной теме на другом сайте. Вкратце, разница есть, и если её слушать отдельно, то она слышна. А если слушать сам сжатый звук, то надо сильно постараться, чтобы её найти:

Я вот заинтересовался, сделал сам разность двух файлов в Audacity. Выложил оригинал и разницу его с тремя разными битрейтами в mp3, https://drive.google.com/folderview?id=0B433Andu0p_cWm15T0cxSTNOdGc&usp=sharing. В 128кбит/c можно слушать песню :) Для желающих повторить: берём песню в loseless, конверитим в wav (оригинал), потом конвертим в mp3 и из него тоже в wav (файл с потерями). Качаем Audacity, открываем оригинал, импортим файл с потерями вторым треком, выделяем его, Effect –> Invert, выделяем оба трека, Tracks –> Mix and render to new track. Экпортируем третий трек с разницей и слушаем.

PS mp3 от flac не отличаю на слух, изредка нюансы разве что
Не очень понимаю, что конкретно показывает подобная процедура? Очевидность изменения трека после прохождения через лосси энкодер?
Данная процедура показывает какие именно звуки исчезли. Вы можете скачать архив с наглядной демонстрацией в конце моей статьи и послушать. В заархивированных файлах именно звучит именно то, что при сжатии из flac в mp3 потерялось.

Вот вы правильно ниже написали, вы уверены что в конверсиях ничего никуда не убежало? Интереса ради я провёл описанную процедуру, в результате получил примерно тоже самое только тише звучащее. Предлагаю эквивалентный эксперимент, сделайте действия предложенные f1ac’ом, только в качестве второго трека используйте не пережатый материал, а такой же что и первый, т.е. оба трека должны быть одинаковыми, и перед миксом сдвиньте один из них на 1–2 семпла.
Уверен.
Для каждого трека я проводил 5 сравнений. В начале делал "грубую" прикидку на основании показателей тонового сигнала, а затем по семплу вперед, по семплу назад, и в зависимости от изменяющихся итоговых треков, становилось понятно, какой смещение наиболее точным было.

практически любой кодек прогоняет входной сигнал через один или несколько фильтров (например для исключения постоянной составляющей). Эти фильтры имеют далеко не идеальную ФЧХ. На слух фазовые искажения (в разумных пределах) не слышны. А вот разницы таким методом вы намеряете вагон с тележкой.

Кстати, дабы не искать задержку вручную можно воспользоваться такой утилиткой:
http://www.csee.umbc.edu/portal/help/sound/AFsp-V2R1/html/audio/CompAudio.html

вам нужна опция '-d'

Всё новое — хорошо забытое старое…
А вы не помните, как боролись с тем, что после конвертирования в mp3 полученный трек убегает вперед?
Хочу обратить ваше внимание, что глобально данный опрос ничего не значит, так как ответившие были не в одинаковых условиях, тем не менее каждый человек, на основе своих результатов, может задуматься над тем, что же делать дальше.

В целом результаты голосования распределись следующим образом:


Что, еще раз подчеркну, ни в коем случае не подтверждает, что между mp3 128, 320 или lossless разницы нет.

Желающию построить свои красивые графики, ознакомиться подробней с результатами могут открыть файл на docs.google.com в который вошли все данные из опроса за исключением описания системы на которой люди слушали треки.
Победитель конкурса twist_ua_losslEssMan. Бьет без промаха.
Без промаха, да, но победителем его это не делает.
Это делает его человеком с самым тонким слухом? )
Может быть да, а может быть нет, такой фактор как везение отрицать нельзя. ABX тест дал бы более объективную картину.
При наличии файлов любой человек знакомый с аудиоредакторами может без слуха, без ушей и даже вообще не проигрывая их определить сжатый он или не сжатый.
Честно прослушал два раза, в разное время, на разных наушниках, 1 и 4 трек — 100% попадание, 2 — ни одного, 3 — перепутаны lossless и 320. Можно сделать вывод, что на некоторых треках есть ощутимая разница. На других ее уловить сложнее. Но это не делает lossless бессмысленным и бесполезным, как считают "антиаудиофилы".


Для меня разница проявляется в следующем — на сжатых треках теряются удары тарелок, на 320 vs lossless хуже стереопанорама.
Тарелки и кастаньеты самая сложная часть для MP3 потому что их спектр уходит за 18 килогерц, где даже у несжатого 44,1/16 наблюдаются проблемы в виде модуляции с появлением звуков которых не было.

Про панораму вообще отдельный разговор — компьютер не знает зависимости ФАЧХ ваших ушей от направления прихода звука, и как не старайся без этого знания панорама будет неестественной, хоть из кости мамонта делай оборудование.
Да, для меня звучание тарелок тоже является неким маркером, на 128 Kbps звук становится металлическим, менее детальным, нет послезвучий. Разницу между 320 и Lossless думал, что слышу уверенно, ощущение, будто звук более грязный, теряются некоторые послезвучия, или панорамная картина меняется, или басовая линия, особенно чувствуется, если слушаешь и тот и другой трек впервые за день. Правда, при ABX тесте, выяснилось, что вероятность угадывания равна вероятности выпадения "орла" монеты… Означает ли это, что заменю всё на mp3? Вряд ли, психоакустика может сыграть злую шутку.

Интересно было бы услышать мнения других людей о разнице звучания, особенно от профессионалов или людей тесно, связанных с музыкой, я отправлял приглашение представителю Аудиомании timshick принять участие в опросе, ему и его коллегам, и даже получил подтверждение, но к сожалению ответа не дождался...
Eсть такой диск аудиодоктор (http://rutracker.org/forum/viewtopic.php?t=2093973), в нём для проверки "слуха" используются очень короткие отрезки потому, что звуковая память у подавляющего большинства людей очень и очень короткая, прослушав 15 секунд А и 15 секунд Б большинство людей уже не в состоянии их различить, хотя отлично слышат разницу на короткой нарезке.
Тестировал подобную методику на себе давным давно ещё (хоть это и не дважды слепой тест с большим количеством участников) но результат был такой при полном прослушивании трека отличить не зная что включил очень сложно если только не ниже 192 Kbps уже 256 от Lossless сложно отличить, при коротких нарезках характерных мест (тарелки например) определить становится куда проще, но всё равно 320 уже на грани.
Сейчас уже не парюсь и слушаю какую-то фигню с сервисов яндекса, хотя и могу различить разницу в конечном счёте дело не в разнице, а отношении к ней.

К сожалению, я сейчас в Риге и в ближайшее время в Москву не собираюсь.

Что касается разницы в звучании, то у меня лично нет никакого желания кому-либо что-либо доказывать, поэтому данный тест не имеет значения. Величина разницы в звучании между сжатым с потерями сигналом и несжатым (или сжатым без потерь) зависит от двух вещей всего

  1. Музыкальная композиция (и работа над ней звукорежиссёра, который может запросто использовать, например, компрессор динамического диапазона, что делает "несжатую" музыку "сжатой" еще до применения каких бы то ни было алгоритмов).

  2. Качества используемой для прослушивания аппаратуры (само собой, и самих условий прослушивания).

Здоровые уши мы подразумеваем по умолчанию, хотя, например, у более взрослых людей слух не такой, как у молодых. И это тоже наложит свои ограничения на проведение теста.

Поэтому, я совершенно ясно допускаю, что существует в мире музыка, а также аппаратура, а также люди, которые, собрав всё это вместе в одной конкретной комнате не услышат разницы между 128 kpbs потоком и CD аудио.
>где даже у несжатого 44,1/16 наблюдаются проблемы в виде модуляции с появлением звуков которых не было
Можете пояснить поподробнее?
на пальцах
При сложении двух частот образуются ещё две частоты, (F1+F2)/2 и (F1-F2)/2 да там амплитуды маленькие, но уже слышимые.
Какие частоты складываются, и при чем тут «44,1/16»?
44,1к и 18к


18к, 16к, и 12к — выглядит хуже чем на самом деле, в какой-то мере можно побороть интерполяцией sin(x)/x при ресемплинге, или специальным фильтром на выходе(вариант похуже) и применяется в звуковухах подешевле.
Звуковой редактор adobe audition в окне редактора сразу отображает результат восстановления.

на выходе получается вот так
Осциллограммы с встройки ALC 892


18 килогерц, тут результат сложения даже на взгляд не просто увидеть


21 килогерц
да эти ВЧ после 16 кгц не на всяком оборудовании и не всякий слышит, а вот результат их сложения с несущей (44,1к) уходит в слышимый диапазон, а в случае ультразвука(21кгц) с очень слышимой амплитудой.
Вот такая она проблема формата 44,1/16. Кстати говоря в виниловых пластинках хватает того самого ультразвука который может подпортить запись при рипе.

Так и говорите, что на каких-то звуковухах, где ядро свертки короткое, а частота среза слишком высокая…
Это проблема в первую очередь формата, а не длинны костыля для её решения.
и проблема не в частоте среза, а крутизне среза, что кстати говоря очень большая проблема потому что фильтровать при записи сигнал надо до оцифровки, а при воспроизведении это выливается в звон там где его не было на записи, и не в свёртке проблема, а в том что она нужна в принципе, и даже правильное ядро требует для точного восстановления сигнала в конкретный момент времени бесконечности в обе стороны от этого момента, которую мы не можем предоставить по той простой причине что звуковой сигнал не повторяется.
Значит, вся проблема формата 44100 сводится к частоте Найквиста, все частоты [исходного сигнала] выше которой в лучшем случае превращаются в звон.
Но тут возникает вопрос: а нужно ли бороться со звоном? Может ли человек его воспринять? Согласно моим знаниям о слухе, звуковая волна превращается в частоты уже в улитке, т.е. в нервную систему идет сразу в частотном домене. Так так ли важна форма сигнала во временном?
При переходе(превышении) через частоту Найквиста (22,05) сигнал как бы отражается (на анализаторе спектра выглядит так) и при восстановлении также воспроизводится с меньшей частотой что является проблемой в осциллографах (там с крутизной среза совсем плохо) тут же проблема в том что сигнал с частотой меньше частоты найквиста всё равно вызывает появление звуков которых не было.

И форма сигнала также важна меняя фазу некоторых диапазонов частот(при этом меняется только форма сигнала без каких либо других изменений с которыми отождествляют качество звукового тракта) можно добиться перемещения отдельных инструментов на сцене — судя по осциллограммам реалтека не более 10 градусов для лево / право, а вот для ближе / дальше уже сказать сложно, например поворот фазы частот ниже 400 гц у меня вызывал отчётливое ощущение перемещение контрабаса по сцене ближе/ дальше, хотя для уверенного "приёма" приходилось крутить более 90 градусов.
— Я имею в виду что сигнал, где нет частот выше частоты Найквиста, захватывается и восстанавливается в пределе идеально. А там, где есть, приходится сначала обрезать спектр выше частоты Найквиста в результате чего появляется звон. Никакого алиасинга в данном случае не возникает.
— sinc не привносит сдвига фаз. Значит и у звона с фазой все в порядке.
На счет того, что влияет на локализацию звука, почитайте Алдошину «Основы психоакустики», например.
На локализацию звука влияет ФАЧХ ушей семплы снятые с разных людей находятся в свободном доступе и при использовании в качестве фильтров (конвольвер) создают более менее внятное представление о направлении, основы это всего лишь основы.
Меняя фазу [Ф] мы вмешиваемся в работу ФАЧ фильтра под названием "Наружное ухо".
Проблема с обрезанием в том, что у не цифровых фильтров не все хорошо или с фазочастотной или амплитудно частотной характеристиками или с задержкой, все три параметра никак нельзя свести к идеалу. и при большой крутизне среза возле слышимой части спектра рябь от фильтра наползает на слышимый спектр.
— У Алдошиной про это говорится. А вот пример применения, правда никто почему-то не замечает эффекта, кроме меня https://www.youtube.com/watch?v=hsCgaMeTVG0

— Напрашивается такой прием: применить пологий аналоговый фильтр выше частоты среза, оцифровать с существенно более высокой частотой, например 96кГц, а потом цифровым фильтром обрезать до ~22кГц.
правда никто почему-то не замечает эффекта,

потому, что фачх ушей у каждого своя, вам повезло и разработчики применили что-то похожее на ваше.

2) Так и делают.
На себе я пробовал несколько голов из БД IRCAM Listen, и эффект был слышен так или иначе на всех из них. отличия лишь в точности определения направлений. Все равно необъяснимо, почему я не нашел еще никого, кто бы сказал «ухуеть!»
дело не только в точности, но ещё и расстоянии, у меня панорама деформируется так что то что должно быть сзади на метр звучит как будто из головы, лёгкое отклонение по замыслу градусов 10 — 15 уходит чуть ли не в ухо.
Расстояние там не имитируется никак кроме громкости, потому что почти все HRIR в свободном доступе записаны только с расстояния примерно 1,5 метра. Это считается far field.
Кстати, AMD хотела устроить маленькую революцию в области озвучивания игр, но не взлетело. за кучей маркетингового булщита оказался тотже самый конвольвер, но с какими-то совсем "левыми" семплами, обещали чуть ли не построение импульсного отклика по геометрии, а оказалось как всегда, даже до EAX не дотягивает.
"Дяденька, а вы с кем сейчас разговаривали?"

Уважаемые господа, не могли бы удовлетворить любопытство — вы кем работаете?
Foolleren — Оператор технологических установок, судя по профилю.
А я — программист. Моя работа не имеет отношения к DSP.
Работа скучная, и даже не мотивирующая, из кучи предложений по оптимизации, до рассмотрения дошла только одна и ту в конце концов отклонили в конце концов это их проблемы если не хотят экономить по 100к р каждый месяц, но график даёт много свободного времени.
Эх, а я сначала косячил, а потом разогрелся и вслушался.
На 4 треке очень сильно разница слышна.
Sign up to leave a comment.

Articles