Comments / Profile of mkarev / Habr

How to become an author

Михаил @mkarev

User

Profile Publications 1Comments 88Bookmarks 22

Гений 21 века. Чем сейчас занимается Фабрис Беллар

mkarev Jan 2 at 18:25

тут перечислен десяток каких то узкополезных кому то утилит

Да Вы, батенька, шутник. FFmpeg - по сути стал стандартом мультимедиа API. Такие компании, как Intel и nVidia в составе сових SDK для аппаратного сжатия сами пишут модули для инфраструктуры FFmpeg. Большинство медиаплееров, пригодных для практического использования, содержат в своей основе FFmpeg явно или косвенно (например, через bad или ugly плагины GStreamer'a).

+13

Как процессоры x86 декодировали инструкции в RISC-форму: история легенды

mkarev Jun 29 2023 at 06:31

Любопытно, а в более сложных CISC инструкциях типа REP (привет memcpy) тоже нет подкапотного разваливания на микрокод и все сделано по-настоящему аппаратно?

+2

Земля круглая, вода мокрая, JPEG шакалит, небо голубое… Или нет?

mkarev Dec 15 2022 at 07:10

Формату JPEG в этом году исполнилось 30 лет, нужно отдать должное его разработчикам, т.к. он до сих пор имеет свою нишу.

Впрочем, интерес представляет даже не сам JPEG, а возможность использования линейных преобразований для сжатия без потерь.

В сжатии изображений преобразование предназначено для минимизации среднеквадратичной ошибки, вносимой квантованием. Оптимальным считается преобразование Карунена-Лоэва, а DCT-II является его наилучшим приближением для сжатия изображений. То есть, пеобразование является необходимым этапом при сжатии с Потерями.

Если интерес представляет именно сжатие без потерь, стоит обратить внимание на соответсвующие инструменты кодирования:

предсказание DCT коэффициентов по соседним (уже закодированным) блокам (H.263/MPEG-4 Part 2)
предсказание пикселей текущего блока, по восстановленным соседним (Intra predict, H.264 и т.п.)
сегментация изображения с целью кодирования больших равномерных областей бОльшими блоками (квадро-дерево H.265 и т.п.)
для "Screen" контента использовать сжатие с палитрой (H.265)
продвинутые алгоритмы энтропийного сжатия остаточной информации Huffman (с фиксированными таблицами) -> CAVLC -> CABAC

В современных форматах сжатия изображений это реализовано в том или ином виде.

+1

Многопоточный энкодинг: переплатить вдвое или уйти на «встройку»?

mkarev Apr 24 2022 at 06:17

Удивительно! Мы получили сравнимые с результатом A4000 цифры. Несмотря на большую частоту работы чипа, больший объем используемой видеопамяти и большее энергопотребление, A5000 осилила энкодинг только 14 потоков и спасовала на пятнадцатом. Это фиаско...

С одной стороны результат вполне ожидаемый, т.к. обе карты имеют на борту один модуль NVENC (см. [1]).

С другой стороны результат странный, т.к. в связи с более высокой частотой чипа "The performance should scale according to the video clocks as reported by nvidia-smi for other GPUs of every individual family" (см. [2]). Как вариант, прирост тактовой частоты был недостаточен для того, чтобы успеть еще один профиль кодирования на целевом разрешении, но это не точно.

Литература
[1] https://developer.nvidia.com/video-encode-and-decode-gpu-support-matrix-new
[2] https://docs.nvidia.com/video-technologies/video-codec-sdk/nvenc-application-note/index.html#nvenc-performance

+1

Реальный Windows. Пишем realtime под окошками

mkarev Feb 19 2022 at 12:01

Нет, так это не работает, увы. Медицинская техника всё-таки

Это на самом деле очень интересный момент. По идее сабжевый агрегат косвенно несет ответственность за здоровье. А следовательно должен пройти серьезную сертификацию, и до кучи, если является средством измерения внесен в единый гос реестр СИ. И вот в этом процессе подобные архитектурные "решения" следовало бы присекать на корню ИМХО.

+3

Реальный Windows. Пишем realtime под окошками

mkarev Feb 19 2022 at 11:49

Поддерживаю, 2^32 уровней квантования хватит, чтобы залезть в область тепловых шумов компонент РЭА, что сводит на нет всякий смысл АЦП таких разрядностей.

+2

Таймер в .NET с интервалом 1 мс. Windows

mkarev Feb 8 2022 at 15:00

не построить буфер, который затем можно двинуть в устройство

Как-то так я полагаю: https://docs.microsoft.com/en-us/windows/win32/multimedia/using-a-callback-function-to-manage-buffered-playback

Производящий поток пушит данные в MIDI устройство вызовами midiOutLongMsg() или midiStreamOut(), а в колбэке MOM_DONE получаем уведомление, что железяка воспроизвела нотки и можно в нее пушить дальше. Но это не точно.

0

Таймер в .NET с интервалом 1 мс. Windows

mkarev Feb 7 2022 at 19:49

Таймер = дёрганье колбэков из потока. И да, потоку нужно в общем случае ставить повышенный приоритет. Если вы про какие-то другие колбэки, то объясните, пожалуйста. Кроме того, воспроизведение аудио != обработка воспроизводимого аудио.

Воспроизведение аудио - это по сути вывод последовательности дискретных отсчетов в ЦАП. ЦАП работает с фиксированной частотой дискретизации. В него невозможно запихать данных больше, чем размер буфера, стоящего перед ним. Устройство вывода звука "подпирает" источник данных и это нормально.

сомнительно, что VLC, Windows Media Player, плеер Chrome и много других программ используют антипаттерн

Я не говорил, что данные проекты используют антипаттерн. Тут скорее сделан ошибочный вывод того, как они работают на основе того факта, что их процесс в планировщеке ОС имеет бОльшее разрешение системного таймера. Без какого-либо анализа кодовой базы.

Расскажите, пожалуйста, как вам видится идеальная реализация плейбека

Много лет назад занимался разработкой нативной кодек SDK для мобильных платформ, с тех пор сохранились заметки на тему рендеров: https://docs.google.com/document/d/1T9T65-NN92e_xHzr4AV15LSHdhMAmTaJy4XQsirwaws/edit?usp=sharing

См. главу 2 Вывод звука. Объяснения там, конечно, на уровне "сначала рисуем один овал, затем другой, а потом дорисовываем сову", но поверхностная суть просматривается.

В случае win32 можно попробовать waveOut из https://docs.microsoft.com/en-us/windows/win32/api/mmeapi/

Либо что-то еще, например DirectShow аудио рендер, но это уже совсем другая история (с)

0

Таймер в .NET с интервалом 1 мс. Windows

mkarev Feb 7 2022 at 17:26

Классический подход при воспроизведении мультимедийных данных – раз в N единиц времени смотреть, что́ нужно подать на устройство вывода (видео-, звуковую карту и т.д.) в данный момент времени, и при необходимости отсылать новые данные (кадр, аудиобуфер) на это устройство

Это антипаттерн. Все вменяемые audio API построены на механизме колбэков, которые дергаются из тредов с повЫшенным приоритетом.

В таких случаях информация часто расположена достаточно плотно (особенно в случае с аудио), а временны́е отклонения в её воспроизведении хорошо заметны ушам, глазам и прочим человеческим органам. Поэтому N выбирается небольшим, измеряется в миллисекундах, и часто используется значение 1.

Высокое разрешение необходимо не для ровного плейбэка, а для достижения низкой задержки. Что, в частности, очень актуально для real-time музыкального ПО.

Если сильно хочется таймер высокого разрешения на win32, то ничего лучше недокументированного API Вам не найти. Как уже писали выше это ф-ции NtSetTimerResolution и NtDelayExecution, но даже первой хватить, чтобы "стандартные" таймерные API стали более отзывчивыми. Также не забываем задать приоритет потоку таймера выше нормального, без этого NtSetTimerResolution может не спасти.

Если хочется точности сверх 1мс, то таймеры можно комбинировать со спинлоками, вот очень интерсеная статья на данную тему: https://timur.audio/using-locks-in-real-time-audio-processing-safely

+1

Пример применения кода Рида-Cоломона

mkarev Jan 8 2022 at 12:55

много езжу на велосипедах ну и испытываю некую склонность к их изизобретению

Ваш новый велосипед похож на Forward Error Correction FEC, используемый в частности для транспорта мультимедиа контента.

0

Не верь всему, что пишут на Хабре

mkarev Jul 16 2021 at 15:52

Да вся наша жизнь – это сплошное преодоление препятствий.

Д. Канеман в своей книге "Думай медленно, решай быстро" дает посыл, что бОльшую часть в формировании успешной карьеры/жизни/… играет удача. Если человеку повезло оказаться в нужном месте в нужное время, то его шансы на успех многократно возрастают.

0

Как регулировать мощность переменного тока

mkarev Apr 2 2021 at 16:33

тиристор можно закрыть… в любой момент времени

Можно, но так никто не делает, т.к для этого управляющий ток должен быть больше тока коммутируемой нагрузки. Поэтому всё-таки нельзя

0

Что есть что в CMake 3.10+ и как это использовать

mkarev Dec 30 2020 at 19:35

PS: Официальная документация cmake зачастую только добавляет вопросов в поиске решения проблемы. ИМХО больше пользы от ресурсов посвященных современным способам использования cmake, например https://cliutils.gitlab.io/modern-cmake/

+1

Что есть что в CMake 3.10+ и как это использовать

mkarev Dec 30 2020 at 17:46

Если внешняя зависимость поддерживает cmake, то для ExternalProject, начиная с 3.11, есть лучшая альтернатива — FetchContent. Она стягивает зависимость в configure time, что заменяет головняки подлючения к основному проекту простым add_subderictory.

0

Устали от глупых шуток о JS? Напишите свою библиотеку

mkarev Dec 27 2020 at 17:25

Ок, резиновый int не переполнися пока есть свободная RAM.
Но тогда появляется другая проблема — сложность арифметических операций будет пропорциональна размерам num, den. Сложность алгоритмов становится неопределенной.

+1

Устали от глупых шуток о JS? Напишите свою библиотеку

mkarev Dec 26 2020 at 21:56

С помощью одного значения BigInt мы можем представлять произвольно большие целые числа. Но если мы создадим пару из целых чисел, то сможем представлять произвольно большие или маленькие числа.

Можем, но практического смысла в этом нет, т.к. арифметические операции с рациональными дробями могут очень быстро раздувать числитель и знаменатель до достижения переполнения. Например, если в цикле складывать числа с разными знаменятелями, метод simplify перестанет справляться со своей задачей. Решая эту проблему, мы введем погрешность, заменив simplify на нормализацию и… изобретем float

+4

Анонс: как российская компания создает кибер-протезы рук для детей

mkarev Dec 21 2020 at 18:47

Могу прикинуть на салфетке элементную базу

Будьте любезны, также интересует стоимость разработки механики, износостойких композиционных материалов, схемотехники, ПО, сборки и настройки.

всяческие «сертификации медицинского оборудования»

Как минимум не помешают гарантии того, что аккумулятор не воспламенится и не сожгет владельца. Или пролитый чай не приведет к короткому замыканию и поражению электрическим током.

+1

Запуск Netflix на телевизорах и приставках. Лишние 40 миллисекунд

mkarev Dec 17 2020 at 07:03

Подобная "архитектурная проблема" есть у любого аудио- или видеопроигрывателя

Вы не правы. В комментарии выше описал почему

0

Запуск Netflix на телевизорах и приставках. Лишние 40 миллисекунд

mkarev Dec 17 2020 at 06:55

Почему это?

Потому, что синхронизация плейбэчных мультимедиа графов должа происходить в конечной точке — аудио/видео рендере, а не где-то по пути перед декодером.
Так работают медиафреймворки DirectShow/GStreamer/OpenMAX и в них нет таких детских болячек, как в сабжевой статье.

Разумеется, если мы пишем аудио рендер, например на Qt, с использованием QAudioOutput, то должны повысить приоритет потоку, разгребающему входную очередь до QThread::TimeCriticalPriority. В противном случае получим заикания.

У нетфликс своеобразное решение, они подпирают аудио/видео ветки посередине.
При том, что потом будет еще один подпор на рендере (скорость работы DMA для звукового ЦАП никто под нас подстраивать не будет, оно потребляет данные монотонно со скоростью штатного кварцевого генератора).

+1

Запуск Netflix на телевизорах и приставках. Лишние 40 миллисекунд

mkarev Dec 16 2020 at 11:56

Похоже, что у нетфликса контент предзакодирован специально для их плеера(ов).
В результате декодеры работают с идеальными входными данными и плеерописателям можно "не напрягаться"

0

1