Пользователь
30,2
рейтинг
6 апреля 2013 в 12:42

Дизайн → Извлечение звука из фотографий пластинок


Отпечаток грампластинки в немецком журнале (февраль 1890 г.) и увеличенный фрагмент отсканированного изображения

Изобретение граммофона датируется 1887 годом, первые пластинки появились в продаже в Европе летом 1890 года. В музеях мира хранится несколько экспериментальных граммофонных записей 1887-1888 годов, которые считаются самыми старыми пластинками в мире. К сожалению, считать звук с них практически нереально. Хуже того, почти все старые пластинки сохранились только в виде фотографий. Именно поэтому в современных цифровых архивах самая старая аудиозапись датируется только 1893 годом. Но специалисты из университета Индианы нашли способ, как восстановить звук с грампластинки по одной фотографии.

Процесс начинается со сканирования в высоком разрешении. Скан режется на фрагменты, чтобы развернуть окружность на плоскости.



Каждый фрагмент спиральной аудиодорожки вырезается и присоединяется к следующему. Стыки аккуратно обрабатываются, так что вся спираль с пластинки преобразуется в прямую аудиодорожку.



Белая линия на скриншоте вверху — это звуковая волна. Чтобы максимально точно восстановить её исходную форму, нужно взять чёрные области сверху и снизу от звуковой волны — и отправить на обработку в программу ImageToSound. На выходе мы получаем файл WAV.



На иллюстрации показана оригинальная звуковая волна со скана (вверху), пара чёрных областей сверху и снизу от неё (посередине) и результат работы ImageToSound (внизу).

Специалисты из университета Индианы смогли таким способом восстановить несколько аудиозаписей. Например, одна из них — запись от 11 ноября 1889 года, сделанная в Ганновере. Она содержит речь на немецком языке, где изобретатель граммофона Эмиль Берлинер демонстрирует процесс записи иногороднему гражданину по имени Луис Розенталь, а тот собирается взять устройство домой для экспериментов с записью звука. До сих пор считалось, что это самая старая граммофонная запись, послушать её можно здесь.

Отпечаток в самом начале статьи — это ранее неизвестная аудиозапись, которая встретилась как иллюстрация к статье о граммофоне в немецком журнале Über Land und Meer за февраль 1890 года.



Журналист в статье рассказывает, как изготовить копию звукового диска и что для воспроизведения звука нужно прокручивать его с частотой 50 оборотов в минуту, а снимать звук можно палочкой бамбука длиной 15 см и толщиной ¾ см, к одному концу которой нужно прикрепить швейную иголку на 1 см, под углом, и мягко прижать её к поверхности вращающегося диска. После этого можно услышать слова, которые записаны на звуковой пластинке, особенно если одеть в уши затычки из хлопка. В статье было написано, что на грампластинке записана поэма Шиллера «Перчатка».

В университете Индианы сумели восстановить эту аудиозапись. По мнению специалистов, это ещё одна запись, которую сделал лично Берлинер (в то время граммофонов не было ни у кого, кроме изобретателя).

Послушать её можно здесь, mp3 (транскрипция, перевод на русский).

Вероятно, эта пластинку Берлинер дал Розенталю как образец, вместе с граммофоном. Таким образом, запись была сделана до 11 ноября 1889 года и является де-факто самой старой граммофонной записью в мире.
Анатолий Ализар @alizar
карма
749,5
рейтинг 30,2
Пользователь
Реклама помогает поддерживать и развивать наши сервисы

Подробнее
Реклама

Самое читаемое Дизайн

Комментарии (54)

  • –18
    Весь апрель — никому не верь?
    • –16
      Это же Alizar
  • +3
    я верю в науку и видел даже пластинки распечатанные на 3Д принтере… но в такое что-то не очень верю…
    как-то не очень правдоподобно… это из серии как снять звук с глиняных горшков
    • +2
      а какая проблема снять звук с глиняных горшков?

      ЗЫ. Сразу вспоминается анекдот.

      Работодатель (Р) задаёт вопросы, девушка (Д) отвечает.
      Р: Сколько знаков в минуту печатаете?
      Д: 2000.
      Р: Так много???????
      Д: Да, но такая херня получается!
      • +2
        Слушайте, действительно, а в чём проблема?
        Записать перед обжигом, всё равно они на гончарном круге делаются, а он крутится :) A снять потом вполне себе можно.
        • 0
          Ну как, если коротко — в чувствительности и точности такого «звукозаписывающего» устройства.
          • 0
            Дорожки поглубже, скорость вращения побыстрее, и глиняная пластинка готова )
        • 0
          Предполагалось, что на глиняных горшках 100500 летней давности должна остаться запись голоса гончара, или звуков вокруг. Но увы, там ничего нет, либо шума много больше, чем полезного сигнала.
          • 0
            Задавший вопрос про возраст глиняных горшков не уточнил )
            Хотя, кто его знает, может и ждёт своего часа в музее склянка со странными спиральными узорами… Вон, Троя (если не ошибаюсь) тоже считалось выдумкой Гомера, пока не нашёлся археолог-фанатик…
      • 0
        Я так понимаю, основная проблема не в чувствительности, а в неспособности звука деформировать глину горшка в принципе. То есть, конечно, упругая деформация иметь место вполне может, а вот пластическая деформация — нет.

        Это, конечно, если я верно понял исходную мысль автора коммента про горшки, ибо в школе попадалась мне книжка с набором таких вот курьёзных идей, и там описывалась идея, что на горшке в виде деформаций запечатлены те звуки, которые его окружали в момент его создания. То есть ни о каких дорожках речи не шло, а говорилось чисто о деформациях под прямым воздействием звуковых волн.
        • 0
          Чувствительность «звукосъемника» — это чувствительность «устройства» через которое считывается звук.
          Применительно к горшкам это палочка/тростинка с помощью которых делались узоры (особенно интересуют линии).

          Точность «записывающего устройства» — это харакетристика качества записи (вот тут можно говорить о деформациях, и она более чем возможна применительно к глине), другой вопрос что при той чувствительности что есть у простой палочки, точности горшка явно не достаточно.

          Идею автора, думается, поняли не так, дорожки или их аналоги нужны, потому что «момент создания» весьма растянут во времени (вообще о звуке в малом отрезке времени говорить мало смысла). Звук — это волна, соответственно его запись требует фиксации на определенной протяженности времени.
  • +3
    На пластинках ведь глубина меняется, а не дорожки кривые с зазубринами. Как можно отсканировать как можно по фотке понять глубину?

    PS: ну-ну, в 1890 печатали газеты с офигеть каким разрешением.
    • 0
      длительности записи 2 минуты, по 50 оборотов на минуту — 100 дорожек. на фото толщина данных минимум сантиметра 4. не так и мало

      это современную пластинку пытался отсканировать ничего не вышло, а упервых пластинок плотность записи была меньше
    • +21
      В монофонических — кривые дорожки с зазубринами. В стерео — и зазубрины, и глубина меняется.
    • +4
      Возможно для создания печати использовалась сама пластинка =)
    • +31
      «В отличие от фонографа Эдисона, Берлинер для записи звука разработал специальный аппарат — рекордер, а для воспроизведения звука создал другой — граммофон, на который и был получен патент 26 сентября 1887 года.[4] Вместо глубинной записи Эдисона Берлинер применил поперечную, при которой игла оставляла извилистый след постоянной глубины» (википедия)
  • +42
    В Samsung дают похожее тестовое задание девелоперам.
    • +4
      Ого! Вот это задание, так задание! Это, должно быть, на весьма серьезную и высокооплачиваемую должность, в которой высокое число кандидатов на место?
      • +3
        К сожалениею, я подробностей не знаю.
      • +2
        Скорее, это в исследовательский центр самсунга.
      • –2
        Интересное задание, я бы написал такое, но вот только не за 5 дней. Имхо, месяц минимум. Ну или надо уже на руках иметь все заготовки и уметь работать как с изображениями так и с голосом.
        • +6
          два часа
          www.youtube.com/watch?v=T_RI5y_867s&feature=youtu.be
          с голосом до этого не работал в принципе, с изображениями — курс машинной графики 7 лет назад :)
          • 0
            Если у вас 2 часа ушло на весь их ТЗ — снимаю шляпу.
            У меня 3 часа ушло только на написание звукового декодера в WAV (C#), по вбитым в приложение параметрам для конкретной пластинки (радиус, позиция иглы).
            А ведь по идее еще нужно написать код для определения этих параметров из самой картинки, подаваемой на вход…
            • +2
              ну если быть честным, то два часа ушло на игры с конкретной пластинкой до состояния «воспроизведение в реальном времени». До адаптации до тз надо приделать сохранение полученного потока в файл (с генерацией хедера, если raw pcm они не принимают) и поиграться с константами для поддержки других файлов (на это наряду с оптимизацией ушло полчаса в электричке, но с этими константами играются все файлы. начальная позиция у меня изначально искалась (единственное допущение — что центр пластинки расположен не сильно дальше 10 пиксеелй от центра картинки)).

              Вот только тут все почему-то говорят про распознавание речи, а в тз про это ни слова (за исключением контрольной суммы непонятного назначения). Если самсунг хочет и распознавание голоса — это уже интереснее, но поскольку тут сэмплов распознавать нужно мало, думаю, времени потребуется немного.
              • +2
                За 9 часов с перерывами решил задачу в общем виде. Программу и исходники для Delphi Object Pascal можно скачать здесь: prosolver.kiev.ua/SamsungTaskSolver.zip
                • +1
                  Тоже решил эту задачу и ещё написал программу создающую такие пластинки(но большей плотности), язык Object Pascal собирал в Delphi XE2, D7 тоже должна собрать, скачать исходник и программу, на написание ушло порядка 12 часов.
                  PS: в исходники выше не подглядывал ;)
              • 0
                покомментировал, добавил вывод в wav
                java: pastebin.com/nw3XdDz4
                • 0
                  Хорошая у вас идея выводить звук в реальном времени, так было бы интереснее :)
          • 0
            Что это было?!

            (http://www.youtube.com/watch?v=x4Q108If5WU)
          • 0
            Тут мелькало три пластинки:
            04.png: ответ 5382194069730 77
            06.png: ответ 1778467976305 00
            07.png: ответ 0947188315136 66

            Делал на джаве, заняло часа 4.

            Может собрать все решения и написать пост со сравнением алгоритмов?

        • +7
          Данное задание скорее на сообразительность и решается «устно», как в школе.
          Обрати внимание как нарисована пластинка — дорожки широкие, изменения только яркости и строго поперек самой дорожки.
          Остается только написать функцию спирали (синус и косинус из школы думаю все помнят) и взять яркостные value. Звук готов.
          Можно конечно извратиться с субпиксельными смещениями и попробовать получить большее разрешение звука.
          Распознавание речи — для цифр хватит простого peak match, особенно при небольшом семплрейте.

          Жаль, что меня в самсунг не берут и тестов таких не дают.
          • 0
            Да, посмотрел фото, действительно тут все проще. Мне кинули на почту первую картинку без изображения самой пластинки. Я думал, что речь идет про настоящее изображение дорожек. То есть вроде того, что в изображении поста.
      • +5
        Делал такое для исследовательского центра в Киеве. Сделал за 3.5 дня (был отпуск + интересно). Отослал, позвали на беседу с ПМ-ом.
        В итоге предложили денег сильно меньше чем я получал на тот момент в EPAM (запрашивал у них такую же зп, просто хотел заниматься чем-то интересным). Еще и ПМ сказал что у них постоянно авралы и вообще он ни за кем из соискателей гоняться не будет.
        Адекватно объяснить почему запрашиваемую ЗП дать не может тоже не смог (видимо, просто был ограничен в бюджете и искал подешевле людей). Я впоследствии общался с одногруппниками из Самсунга — сказали, что для старта это очень высокая ЗП (был февраль 2012).
        Должность была — Lead Engineer (у корейцев это как в простых компаниях Senior). К слову, в EPAM у меня была должность Software Engineer (для оценки зп)
        Ну и да, на вопрос «как много людей проходит собеседование + такое тестовое задание» ответил «1 из 10».
      • 0
        С высокооплачиваимостью у них там туго, есть много корпоративных плюшек в зависимости от позиции, но платят не много, ИМХО это сознательная политика компании… Билет в один конец, в общем.
        Их хантеры расчитывают на всяких сотрудников не богатых НИИ, для которых квартира\машина и всё такое очень круто и о будущем они не думают…
        • 0
          А почему это не думают о будущем-то? Работа в такой компании — это опыт. После 3-х лет можно искать и з/п.
    • 0
      О! А там откуда вы вызли самое залание, не найдется ли файлов с данными? Был бы очень благодарен
      • +1
        Вторая ссылка содержит изображение пластинки.
      • +1
        Я это нашел когда-то на сайта dou.ua, сохранил что бы попробовать реализовать на досуге для самообразования (как предлагают в комментарии ниже). К сожалению, ссылку на оригинальный топик я не сохранил. Сейчас удалось найти лишь еще пару картинок. Но это в общем то и все, больше ничего не было. А эти картинки и есть входные данные.
        • +2
          Да, как раз хотел побольше картинок. Задачка хорошая на самом деле.
    • +2
      Это же очень круто! Обязательно надо выполнить для самообразования!
    • +1
      Как раз хотел написать, что я такое у них делал :)
  • –8
    Кажется, это сюда:
    Скрытый текст
    image
  • –15
    Круто, конечно, но если честно, эти запись имеют хоть какую-то ценность? Стоило оно того?
    • +18
      А в чем ценность вашего комментария? Стоил он того?
    • +1
      Первое, что приходит в голову — оценка произношения слов, букв, звуков в те времена.
    • +2
      Скрытый текст
  • +2
    в поисках — правда или нет засунул ссылку на мп3 в гугл, и нашел оригинальный пост:

    mediapreservation.wordpress.com/2012/06/20/extracting-audio-from-pictures/

    там есть еще несколько восстановленных аудиозаписей, например первая известная английская речь восстановленная из журнала, в котором были напечатаны звуковые волны
  • +8
    Теперь будем фотки слушать!
    • 0
      Я тут пару пластинок сфотал, пиходи вечером послушаем ;)
  • +1
    Пластинки давно сканируют и распознают в mp3 — www.phys.huji.ac.il/~springer/DigitalNeedle/

    кстати, все open source — www.cs.huji.ac.il/~springer/app/source.tgz

    вот и статья, правда от 2002 года… websound.ru/issues/81_83.htm
  • +1
    Какая шикарная типографика в журнале…
  • 0
    Эх, вот сделали бы лазерный проигрыватель обычных пластинок. Чтобы считывал дорожку не повреждая её. Красота была бы!
  • 0
    Давно хотел спросить, зачем так сильно сужают спектр, сохраняя все в mp3? Ведь у того же wav битрейт 900 kbps минимум а mp3 — максимум 320.

    P. S. Прежде чем ставить минусы, чем Хабр так любит заниматься — прошу помощи ответить на мой вопрос.

    Заранее благодарен!)

Только зарегистрированные пользователи могут оставлять комментарии. Войдите, пожалуйста.