ivan2kh Aug 3 2011 at 03:19

Как современные кодеки изображений жмут звук. JPEG2000 vs MP3

3 min

3.8K

Image processing*

From sandbox

+66

Comments 36

xmdy Aug 3 2011 at 03:43

Интересный подход) А можно суммарную таблицу-сравнение?

UFO just landed and posted this here

slaum Aug 3 2011 at 09:27

гуглить «спектрограмма»

-15

Orion Aug 3 2011 at 09:50

Ага жмешь, звук в jpeg, открываешь, а там обложка альбома с названием трека о_О

+15

xanep Aug 3 2011 at 13:31

Картинки 16 бит/канал не очень удобно смотреть в цветовом представлении. Даже не смотря на то, что канал лишь один.

UFO just landed and posted this here

slaum Aug 3 2011 at 17:50

Да кто только этим не забавлялся

Scratch Aug 3 2011 at 09:33

Мсье знает толк )

+19

Jekel Aug 3 2011 at 10:01

А можно пойти от обратного — от изображения к звуку, чтобы картину можно было не только смотреть но и слушать. Интересно, вообще возможно совместить изображение и звук — чтобы это выглядело и звучало не как шумы?

Scratch Aug 3 2011 at 10:02

тогда это будет новое слово в стеганографии. Думаю, даже вышесказанное уже можно как то применить в этом направлении

Imposeren Aug 3 2011 at 10:12

Еще интересный проект ARSS. Позволяет получать спектрограммы изображения, а также переводить самостоятельно нарисованные спектрограммы в звук

И в конце примеров там как-раз есть передача картинки через звук в MP3

darkslesh Aug 4 2011 at 09:45

всё очень просто.
1) берешь картинку цветную 1024*768
2) конвертируешь её в BMP 24 битный.
3) Получаем 2359296 байт данных описывающих цвета (1 байт — 256 оттенков цвета R или G или B).
4) берешь mp3 файл на 250 килобайт.
5) переводишь весь объем в биты. получаем 2000000 бит
6) последовательно у каждого байта картинки меняем младший бит, на те который получились из mp3 файла. т.е. картинка была 2359296, то как и вместит 2359296 бит. так что еще останется место
7) упаковываем картинку в PNG (без потерь) и получаем нормальную картинку которую можно смотреть. отличие от оригинала не значительные — 1/256 оттенка каждого цвета и то не во всех пикселях так что на глаз это незаметно.
8) когда надо вытащить mp3, то прогоняем всё в обратную сторону.

Таким методом можно в картинки прятать любые файл. т.е. в одну картинку может влезть данных на 1/8 её размера. Главное условие — сжатие должно быть без потерь или вообще без сжатия.

demoded Aug 3 2011 at 09:37

а где картинки? мне всегда было интересно если взять картинку и подсунуть ее в mp3 encoder, потом развернуть обратно в несжатый вид и посмотреть как картинку… но руки так и не доходят

xanderZT Aug 3 2011 at 09:46

Даешь картинку в виде звука!

slaum Aug 3 2011 at 10:16

Любой серьезный аудиоредактор, например Adobe Audition, умеет это:) Находите пункт в меню «Открыть как...», выбираете любой файл и указываете, что это звук в формате RAW, при этом указывая дополнительные параметры типа частоты дискретизации, и вуаля — можно слушать хоть исполняемые файлы. Кстати, результаты порой бывают интересны.

Rondo Aug 3 2011 at 10:20

есть способ проще:
cat /dev/urandom >> /dev/dsp

BeCase Aug 3 2011 at 10:27

Это не совсем то: нужно, чтобы пикселы в декодированной jpeg'ом картинке соответствовали аудиосигналу, а не биты в закодированном файле.

megalol Aug 4 2011 at 02:00

используйте bmp

UFO just landed and posted this here

mihuil Aug 3 2011 at 22:24

load ""
Enter

=)

Lertmind Aug 3 2011 at 10:33

Теперь давайте «видео файл без звука» -> «звук». Будет что-то интересное.

ivon Aug 3 2011 at 10:38

«дебил, картину слушает»
© Даун Хаус

-7

Pixelbeat Aug 3 2011 at 10:56

Вы бы копирайты на свои фразы бы то не ставили.

XaLBa Aug 3 2011 at 12:11

Замечу, что у аудиокодеков есть такая штука, как психоакустическая фильтрация, которая позволяет добиться лучшего субъективного качества того, что мы получаем. При этом у более позднего формата AAC банк этих фильтров больше, чем у MP3.
Ещё MP3 появился в ~1994 году, а JPEG2000 — на шесть лет позже. В этом стандарте есть арифметическое сжатие, что позволяет при lossless компрессии наигрывать дополнительно ~10%.

Но в целом, забавный у вас эксперимент вышел.

BupycNet Aug 3 2011 at 17:45

mp3 не lossless.

-1

XaLBa Aug 3 2011 at 17:46

Одним из этапов работы любого lossy-кодека является lossless-сжатие.

BupycNet Aug 3 2011 at 17:54

Ладно уговорили, но тут имеется в виду сравнение сжатия именно lossless кодеков вроде FLAC и jpeg2000

XaLBa Aug 3 2011 at 18:27

Где тут?
В данном топике мне интереснее как раз было узнать на то, как lossy-кодек картинок будет сжимать звук. И JPEG2000 умеет как раз сжимать с потерями.

Vladson Aug 3 2011 at 13:15

Много слов, а информации ноль…

-5

xanep Aug 3 2011 at 13:35

Наверное есть смысл тестировать только алгоритмы сжатия без потери качества. Ничего удивительного в том, что jpeg искажает звук заметно сильнее, чем картинку.

gnomeby Aug 3 2011 at 17:51

Нашли куда заливать результаты. Сделайте лучше RARJPEG и выложите в виде картинки.

Audiophile Aug 3 2011 at 23:08

О, месье знает толк в извращениях!

UFO just landed and posted this here

Audiophile Aug 3 2011 at 23:21

Каждый кодек рассчитан на определенный тип данных и учитывает его особенности для лучшего сжатия. Вот это честно.

UFO just landed and posted this here

dobersoft Aug 8 2011 at 01:17

В mp3 используется косинуснок преобразование, при этом фильтруются замаскированные сигналы исходя из психоакустической модели, что улучшает субъективное качество звука.

В jpeg2000 используется вейвлет-преобразование, при это просто понижается разрядность (точность передачи) высоких гармоник (мелких деталей).

Также в картинках присутствует второе измерение — по нему тоже производится вейвлет-преобразование, что отнимает дополнительные байты.

Во всём остальном разницы между mp3 и jpeg2000 нет.

Show the best of all time