Извлечение звука из фотографий пластинок


    Отпечаток грампластинки в немецком журнале (февраль 1890 г.) и увеличенный фрагмент отсканированного изображения

    Изобретение граммофона датируется 1887 годом, первые пластинки появились в продаже в Европе летом 1890 года. В музеях мира хранится несколько экспериментальных граммофонных записей 1887-1888 годов, которые считаются самыми старыми пластинками в мире. К сожалению, считать звук с них практически нереально. Хуже того, почти все старые пластинки сохранились только в виде фотографий. Именно поэтому в современных цифровых архивах самая старая аудиозапись датируется только 1893 годом. Но специалисты из университета Индианы нашли способ, как восстановить звук с грампластинки по одной фотографии.

    Процесс начинается со сканирования в высоком разрешении. Скан режется на фрагменты, чтобы развернуть окружность на плоскости.



    Каждый фрагмент спиральной аудиодорожки вырезается и присоединяется к следующему. Стыки аккуратно обрабатываются, так что вся спираль с пластинки преобразуется в прямую аудиодорожку.



    Белая линия на скриншоте вверху — это звуковая волна. Чтобы максимально точно восстановить её исходную форму, нужно взять чёрные области сверху и снизу от звуковой волны — и отправить на обработку в программу ImageToSound. На выходе мы получаем файл WAV.



    На иллюстрации показана оригинальная звуковая волна со скана (вверху), пара чёрных областей сверху и снизу от неё (посередине) и результат работы ImageToSound (внизу).

    Специалисты из университета Индианы смогли таким способом восстановить несколько аудиозаписей. Например, одна из них — запись от 11 ноября 1889 года, сделанная в Ганновере. Она содержит речь на немецком языке, где изобретатель граммофона Эмиль Берлинер демонстрирует процесс записи иногороднему гражданину по имени Луис Розенталь, а тот собирается взять устройство домой для экспериментов с записью звука. До сих пор считалось, что это самая старая граммофонная запись, послушать её можно здесь.

    Отпечаток в самом начале статьи — это ранее неизвестная аудиозапись, которая встретилась как иллюстрация к статье о граммофоне в немецком журнале Über Land und Meer за февраль 1890 года.



    Журналист в статье рассказывает, как изготовить копию звукового диска и что для воспроизведения звука нужно прокручивать его с частотой 50 оборотов в минуту, а снимать звук можно палочкой бамбука длиной 15 см и толщиной ¾ см, к одному концу которой нужно прикрепить швейную иголку на 1 см, под углом, и мягко прижать её к поверхности вращающегося диска. После этого можно услышать слова, которые записаны на звуковой пластинке, особенно если одеть в уши затычки из хлопка. В статье было написано, что на грампластинке записана поэма Шиллера «Перчатка».

    В университете Индианы сумели восстановить эту аудиозапись. По мнению специалистов, это ещё одна запись, которую сделал лично Берлинер (в то время граммофонов не было ни у кого, кроме изобретателя).

    Послушать её можно здесь, mp3 (транскрипция, перевод на русский).

    Вероятно, эта пластинку Берлинер дал Розенталю как образец, вместе с граммофоном. Таким образом, запись была сделана до 11 ноября 1889 года и является де-факто самой старой граммофонной записью в мире.
    Поделиться публикацией
    AdBlock похитил этот баннер, но баннеры не зубы — отрастут

    Подробнее
    Реклама
    Комментарии 54
    • –18
      Весь апрель — никому не верь?
    • +3
      я верю в науку и видел даже пластинки распечатанные на 3Д принтере… но в такое что-то не очень верю…
      как-то не очень правдоподобно… это из серии как снять звук с глиняных горшков
      • +2
        а какая проблема снять звук с глиняных горшков?

        ЗЫ. Сразу вспоминается анекдот.

        Работодатель (Р) задаёт вопросы, девушка (Д) отвечает.
        Р: Сколько знаков в минуту печатаете?
        Д: 2000.
        Р: Так много???????
        Д: Да, но такая херня получается!
        • +2
          Слушайте, действительно, а в чём проблема?
          Записать перед обжигом, всё равно они на гончарном круге делаются, а он крутится :) A снять потом вполне себе можно.
          • 0
            Ну как, если коротко — в чувствительности и точности такого «звукозаписывающего» устройства.
            • 0
              Дорожки поглубже, скорость вращения побыстрее, и глиняная пластинка готова )
            • 0
              Предполагалось, что на глиняных горшках 100500 летней давности должна остаться запись голоса гончара, или звуков вокруг. Но увы, там ничего нет, либо шума много больше, чем полезного сигнала.
              • 0
                Задавший вопрос про возраст глиняных горшков не уточнил )
                Хотя, кто его знает, может и ждёт своего часа в музее склянка со странными спиральными узорами… Вон, Троя (если не ошибаюсь) тоже считалось выдумкой Гомера, пока не нашёлся археолог-фанатик…
            • 0
              Я так понимаю, основная проблема не в чувствительности, а в неспособности звука деформировать глину горшка в принципе. То есть, конечно, упругая деформация иметь место вполне может, а вот пластическая деформация — нет.

              Это, конечно, если я верно понял исходную мысль автора коммента про горшки, ибо в школе попадалась мне книжка с набором таких вот курьёзных идей, и там описывалась идея, что на горшке в виде деформаций запечатлены те звуки, которые его окружали в момент его создания. То есть ни о каких дорожках речи не шло, а говорилось чисто о деформациях под прямым воздействием звуковых волн.
              • 0
                Чувствительность «звукосъемника» — это чувствительность «устройства» через которое считывается звук.
                Применительно к горшкам это палочка/тростинка с помощью которых делались узоры (особенно интересуют линии).

                Точность «записывающего устройства» — это харакетристика качества записи (вот тут можно говорить о деформациях, и она более чем возможна применительно к глине), другой вопрос что при той чувствительности что есть у простой палочки, точности горшка явно не достаточно.

                Идею автора, думается, поняли не так, дорожки или их аналоги нужны, потому что «момент создания» весьма растянут во времени (вообще о звуке в малом отрезке времени говорить мало смысла). Звук — это волна, соответственно его запись требует фиксации на определенной протяженности времени.
          • +3
            На пластинках ведь глубина меняется, а не дорожки кривые с зазубринами. Как можно отсканировать как можно по фотке понять глубину?

            PS: ну-ну, в 1890 печатали газеты с офигеть каким разрешением.
            • 0
              длительности записи 2 минуты, по 50 оборотов на минуту — 100 дорожек. на фото толщина данных минимум сантиметра 4. не так и мало

              это современную пластинку пытался отсканировать ничего не вышло, а упервых пластинок плотность записи была меньше
              • +21
                В монофонических — кривые дорожки с зазубринами. В стерео — и зазубрины, и глубина меняется.
                • +4
                  Возможно для создания печати использовалась сама пластинка =)
                  • +31
                    «В отличие от фонографа Эдисона, Берлинер для записи звука разработал специальный аппарат — рекордер, а для воспроизведения звука создал другой — граммофон, на который и был получен патент 26 сентября 1887 года.[4] Вместо глубинной записи Эдисона Берлинер применил поперечную, при которой игла оставляла извилистый след постоянной глубины» (википедия)
                  • +42
                    В Samsung дают похожее тестовое задание девелоперам.
                    • +4
                      Ого! Вот это задание, так задание! Это, должно быть, на весьма серьезную и высокооплачиваемую должность, в которой высокое число кандидатов на место?
                      • +3
                        К сожалениею, я подробностей не знаю.
                        • +2
                          Скорее, это в исследовательский центр самсунга.
                          • –2
                            Интересное задание, я бы написал такое, но вот только не за 5 дней. Имхо, месяц минимум. Ну или надо уже на руках иметь все заготовки и уметь работать как с изображениями так и с голосом.
                            • +6
                              два часа
                              www.youtube.com/watch?v=T_RI5y_867s&feature=youtu.be
                              с голосом до этого не работал в принципе, с изображениями — курс машинной графики 7 лет назад :)
                              • 0
                                Если у вас 2 часа ушло на весь их ТЗ — снимаю шляпу.
                                У меня 3 часа ушло только на написание звукового декодера в WAV (C#), по вбитым в приложение параметрам для конкретной пластинки (радиус, позиция иглы).
                                А ведь по идее еще нужно написать код для определения этих параметров из самой картинки, подаваемой на вход…
                                • +2
                                  ну если быть честным, то два часа ушло на игры с конкретной пластинкой до состояния «воспроизведение в реальном времени». До адаптации до тз надо приделать сохранение полученного потока в файл (с генерацией хедера, если raw pcm они не принимают) и поиграться с константами для поддержки других файлов (на это наряду с оптимизацией ушло полчаса в электричке, но с этими константами играются все файлы. начальная позиция у меня изначально искалась (единственное допущение — что центр пластинки расположен не сильно дальше 10 пиксеелй от центра картинки)).

                                  Вот только тут все почему-то говорят про распознавание речи, а в тз про это ни слова (за исключением контрольной суммы непонятного назначения). Если самсунг хочет и распознавание голоса — это уже интереснее, но поскольку тут сэмплов распознавать нужно мало, думаю, времени потребуется немного.
                                  • +2
                                    За 9 часов с перерывами решил задачу в общем виде. Программу и исходники для Delphi Object Pascal можно скачать здесь: prosolver.kiev.ua/SamsungTaskSolver.zip
                                    • +1
                                      Тоже решил эту задачу и ещё написал программу создающую такие пластинки(но большей плотности), язык Object Pascal собирал в Delphi XE2, D7 тоже должна собрать, скачать исходник и программу, на написание ушло порядка 12 часов.
                                      PS: в исходники выше не подглядывал ;)
                                    • 0
                                      покомментировал, добавил вывод в wav
                                      java: pastebin.com/nw3XdDz4
                                      • 0
                                        Хорошая у вас идея выводить звук в реальном времени, так было бы интереснее :)
                                  • 0
                                    Что это было?!

                                    (http://www.youtube.com/watch?v=x4Q108If5WU)
                                    • 0
                                      Тут мелькало три пластинки:
                                      04.png: ответ 5382194069730 77
                                      06.png: ответ 1778467976305 00
                                      07.png: ответ 0947188315136 66

                                      Делал на джаве, заняло часа 4.

                                      Может собрать все решения и написать пост со сравнением алгоритмов?

                                    • +7
                                      Данное задание скорее на сообразительность и решается «устно», как в школе.
                                      Обрати внимание как нарисована пластинка — дорожки широкие, изменения только яркости и строго поперек самой дорожки.
                                      Остается только написать функцию спирали (синус и косинус из школы думаю все помнят) и взять яркостные value. Звук готов.
                                      Можно конечно извратиться с субпиксельными смещениями и попробовать получить большее разрешение звука.
                                      Распознавание речи — для цифр хватит простого peak match, особенно при небольшом семплрейте.

                                      Жаль, что меня в самсунг не берут и тестов таких не дают.
                                      • 0
                                        Да, посмотрел фото, действительно тут все проще. Мне кинули на почту первую картинку без изображения самой пластинки. Я думал, что речь идет про настоящее изображение дорожек. То есть вроде того, что в изображении поста.
                                    • +5
                                      Делал такое для исследовательского центра в Киеве. Сделал за 3.5 дня (был отпуск + интересно). Отослал, позвали на беседу с ПМ-ом.
                                      В итоге предложили денег сильно меньше чем я получал на тот момент в EPAM (запрашивал у них такую же зп, просто хотел заниматься чем-то интересным). Еще и ПМ сказал что у них постоянно авралы и вообще он ни за кем из соискателей гоняться не будет.
                                      Адекватно объяснить почему запрашиваемую ЗП дать не может тоже не смог (видимо, просто был ограничен в бюджете и искал подешевле людей). Я впоследствии общался с одногруппниками из Самсунга — сказали, что для старта это очень высокая ЗП (был февраль 2012).
                                      Должность была — Lead Engineer (у корейцев это как в простых компаниях Senior). К слову, в EPAM у меня была должность Software Engineer (для оценки зп)
                                      Ну и да, на вопрос «как много людей проходит собеседование + такое тестовое задание» ответил «1 из 10».
                                      • 0
                                        С высокооплачиваимостью у них там туго, есть много корпоративных плюшек в зависимости от позиции, но платят не много, ИМХО это сознательная политика компании… Билет в один конец, в общем.
                                        Их хантеры расчитывают на всяких сотрудников не богатых НИИ, для которых квартира\машина и всё такое очень круто и о будущем они не думают…
                                        • 0
                                          А почему это не думают о будущем-то? Работа в такой компании — это опыт. После 3-х лет можно искать и з/п.
                                      • 0
                                        О! А там откуда вы вызли самое залание, не найдется ли файлов с данными? Был бы очень благодарен
                                        • +1
                                          Вторая ссылка содержит изображение пластинки.
                                          • +1
                                            Я это нашел когда-то на сайта dou.ua, сохранил что бы попробовать реализовать на досуге для самообразования (как предлагают в комментарии ниже). К сожалению, ссылку на оригинальный топик я не сохранил. Сейчас удалось найти лишь еще пару картинок. Но это в общем то и все, больше ничего не было. А эти картинки и есть входные данные.
                                            • +2
                                              Да, как раз хотел побольше картинок. Задачка хорошая на самом деле.
                                          • +2
                                            Это же очень круто! Обязательно надо выполнить для самообразования!
                                            • +1
                                              Как раз хотел написать, что я такое у них делал :)
                                            • –8
                                              Кажется, это сюда:
                                              Скрытый текст
                                              image
                                              • –15
                                                Круто, конечно, но если честно, эти запись имеют хоть какую-то ценность? Стоило оно того?
                                                • +18
                                                  А в чем ценность вашего комментария? Стоил он того?
                                                  • +1
                                                    Первое, что приходит в голову — оценка произношения слов, букв, звуков в те времена.
                                                    • +2
                                                      Скрытый текст
                                                    • +2
                                                      в поисках — правда или нет засунул ссылку на мп3 в гугл, и нашел оригинальный пост:

                                                      mediapreservation.wordpress.com/2012/06/20/extracting-audio-from-pictures/

                                                      там есть еще несколько восстановленных аудиозаписей, например первая известная английская речь восстановленная из журнала, в котором были напечатаны звуковые волны
                                                      • +8
                                                        Теперь будем фотки слушать!
                                                        • 0
                                                          Я тут пару пластинок сфотал, пиходи вечером послушаем ;)
                                                        • +1
                                                          Пластинки давно сканируют и распознают в mp3 — www.phys.huji.ac.il/~springer/DigitalNeedle/

                                                          кстати, все open source — www.cs.huji.ac.il/~springer/app/source.tgz

                                                          вот и статья, правда от 2002 года… websound.ru/issues/81_83.htm
                                                          • +1
                                                            Какая шикарная типографика в журнале…
                                                            • 0
                                                              Эх, вот сделали бы лазерный проигрыватель обычных пластинок. Чтобы считывал дорожку не повреждая её. Красота была бы!
                                                            • 0
                                                              Давно хотел спросить, зачем так сильно сужают спектр, сохраняя все в mp3? Ведь у того же wav битрейт 900 kbps минимум а mp3 — максимум 320.

                                                              P. S. Прежде чем ставить минусы, чем Хабр так любит заниматься — прошу помощи ответить на мой вопрос.

                                                              Заранее благодарен!)

                                                              Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.