Pull to refresh

Comments 36

Интересный подход) А можно суммарную таблицу-сравнение?
UFO just landed and posted this here
гуглить «спектрограмма»
Ага жмешь, звук в jpeg, открываешь, а там обложка альбома с названием трека о_О
Картинки 16 бит/канал не очень удобно смотреть в цветовом представлении. Даже не смотря на то, что канал лишь один.
UFO just landed and posted this here
Да кто только этим не забавлялся
А можно пойти от обратного — от изображения к звуку, чтобы картину можно было не только смотреть но и слушать. Интересно, вообще возможно совместить изображение и звук — чтобы это выглядело и звучало не как шумы?
тогда это будет новое слово в стеганографии. Думаю, даже вышесказанное уже можно как то применить в этом направлении
Еще интересный проект ARSS. Позволяет получать спектрограммы изображения, а также переводить самостоятельно нарисованные спектрограммы в звук

И в конце примеров там как-раз есть передача картинки через звук в MP3
всё очень просто.
1) берешь картинку цветную 1024*768
2) конвертируешь её в BMP 24 битный.
3) Получаем 2359296 байт данных описывающих цвета (1 байт — 256 оттенков цвета R или G или B).
4) берешь mp3 файл на 250 килобайт.
5) переводишь весь объем в биты. получаем 2000000 бит
6) последовательно у каждого байта картинки меняем младший бит, на те который получились из mp3 файла. т.е. картинка была 2359296, то как и вместит 2359296 бит. так что еще останется место
7) упаковываем картинку в PNG (без потерь) и получаем нормальную картинку которую можно смотреть. отличие от оригинала не значительные — 1/256 оттенка каждого цвета и то не во всех пикселях так что на глаз это незаметно.
8) когда надо вытащить mp3, то прогоняем всё в обратную сторону.

Таким методом можно в картинки прятать любые файл. т.е. в одну картинку может влезть данных на 1/8 её размера. Главное условие — сжатие должно быть без потерь или вообще без сжатия.
а где картинки? мне всегда было интересно если взять картинку и подсунуть ее в mp3 encoder, потом развернуть обратно в несжатый вид и посмотреть как картинку… но руки так и не доходят
Любой серьезный аудиоредактор, например Adobe Audition, умеет это:) Находите пункт в меню «Открыть как...», выбираете любой файл и указываете, что это звук в формате RAW, при этом указывая дополнительные параметры типа частоты дискретизации, и вуаля — можно слушать хоть исполняемые файлы. Кстати, результаты порой бывают интересны.
есть способ проще:
cat /dev/urandom >> /dev/dsp
Это не совсем то: нужно, чтобы пикселы в декодированной jpeg'ом картинке соответствовали аудиосигналу, а не биты в закодированном файле.
UFO just landed and posted this here
Теперь давайте «видео файл без звука» -> «звук». Будет что-то интересное.
«дебил, картину слушает»
© Даун Хаус
Замечу, что у аудиокодеков есть такая штука, как психоакустическая фильтрация, которая позволяет добиться лучшего субъективного качества того, что мы получаем. При этом у более позднего формата AAC банк этих фильтров больше, чем у MP3.
Ещё MP3 появился в ~1994 году, а JPEG2000 — на шесть лет позже. В этом стандарте есть арифметическое сжатие, что позволяет при lossless компрессии наигрывать дополнительно ~10%.

Но в целом, забавный у вас эксперимент вышел.
Одним из этапов работы любого lossy-кодека является lossless-сжатие.
Ладно уговорили, но тут имеется в виду сравнение сжатия именно lossless кодеков вроде FLAC и jpeg2000
Где тут?
В данном топике мне интереснее как раз было узнать на то, как lossy-кодек картинок будет сжимать звук. И JPEG2000 умеет как раз сжимать с потерями.
Наверное есть смысл тестировать только алгоритмы сжатия без потери качества. Ничего удивительного в том, что jpeg искажает звук заметно сильнее, чем картинку.
Нашли куда заливать результаты. Сделайте лучше RARJPEG и выложите в виде картинки.
UFO just landed and posted this here
Каждый кодек рассчитан на определенный тип данных и учитывает его особенности для лучшего сжатия. Вот это честно.
UFO just landed and posted this here
В mp3 используется косинуснок преобразование, при этом фильтруются замаскированные сигналы исходя из психоакустической модели, что улучшает субъективное качество звука.

В jpeg2000 используется вейвлет-преобразование, при это просто понижается разрядность (точность передачи) высоких гармоник (мелких деталей).

Также в картинках присутствует второе измерение — по нему тоже производится вейвлет-преобразование, что отнимает дополнительные байты.

Во всём остальном разницы между mp3 и jpeg2000 нет.
Sign up to leave a comment.

Articles