Хранение данных: Какое будущее нас ждет



    Совсем недавно мы рассказывали о работе службы тех. поддержки нашего облачного сервиса 1cloud и предложили «пятничный формат», позволяющий познакомиться с устройством сервиса Netflix и оценками ученых относительно перспектив в области ИИ.

    Сегодня мы решили посмотреть на положение дел в сфере хранения данных, а завтра вас ждет традиционный «пятничный формат» с разбором темы «облачной робототехники» и смежных сфер деятельности.


    Уже «на пороге»


    В 2014 году компания Seagate анонсировала свой новый дисковый накопитель Kinetic HDD с интерфейсом Ethernet, производительность которого в несколько раз превысила производительность всех существующих на тот момент продуктов.

    У каждого диска Kinetic HDD есть два гигабитных Ethernet-порта, каждый со своим IP-адресом, а платформа Kinetic Open Storage дает возможность приложениям и хостам связываться друг с другом напрямую через жесткие диски с помощью TCP/IP-инфраструктуры дата-центров, используя открытый API.

    Подобная технология может серьёзно преобразить инфраструктуру дата-центров и ИТ-индустрию в целом. Прямая связь дисков с приложениями позволит отказаться от контроллеров, файловых систем и даже массивов RAID. Это определенно поспособствует распространению распределенных баз данных вроде Cassandra.

    В том же 2014 году компания HGST представила широкой публике новый жёсткий диск Ultrastar He8 SATA Ultra. Главным техническим решением стало заполнение камеры с вращающимися дисками гелием.

    А уже в сентябре 2014 года компания Western Digital представила первый 10 ТБ жесткий диск, выполненный по этой технологии. Поскольку вместо воздуха в дисковой камере находится гелий, то дискам гораздо проще вращаться, из-за этого меньше греются и могут располагаться ближе друг к другу.

    На данный момент такие диски не используются в коммерческих или профессиональных широковещательных видеосерверах, однако новые гелиевые HDD потребляют на 33% меньше электроэнергии. Это позволит увеличить дисковую плотность в центрах обработки данных, а также уменьшить операционные издержки и занимаемое устройствами пространство.

    Что касается технологий записи, то еще одной техникой, способной ворваться на рынок в ближайшем будущем, является запись с перекрытием дорожек (SMR – Shingled Magnetic Recording) – это особая техника хранения, когда при записи информации на диск, дорожки накладываются друг на друга. Это позволяет увеличить количество дорожек на каждой пластине и сократить расстояние между ними, что в свою очередь приводит к повышению емкости диска на 25%.

    Однако здесь есть несколько сложностей. Например, чтобы перезаписать или обновить информацию, нужно обновить не только нужный фрагмент, но и данные на последних дорожках, поскольку записывающая головка таких дисков шире считывающей и захватывает захватывает данные на граничащих дорожках. Все это приводит к низкой производительности записи.

    Развитием технологии SMR занимаются как Seagate, так и HGST. Что касается HGST, то компания выпускала гелиевый диск объемом 10 ТБ, использующий эту технологию. Он предназначался «холодного» хранения данных.

    Перспективные разработки


    В течение около 50 лет производители магнитных накопителей использовали метод, именуемый параллельной магнитной записью (LMR – Longitudinal Magnetic Recording), в которой вектор намагниченности для каждого бита информации расположен параллельно поверхности носителя (пленки или диска).

    В то время как в исторической ретроспективе поверхностная плотность записи удваивалась приблизительно каждый год, в конце концов скорость этого роста замедлилась, и за прошедшие десять лет продольная магнитная запись достигла фундаментального предела плотности записи, который составил около 100-200 гигабит на квадратный дюйм.

    Этот предел получил название «суперпарамагнитного предела», обусловленного температурными колебаниями в момент поляризации гранул (изменения состояний) во время записи на устройство. Эффект парамагнетизма ведет к возникновению полей рассеяния и неправильной ориентации зарядов на плоскости диска – «битовым ошибкам».

    Чтобы расширить возможности HDD, была придумана перпендикулярная магнитная запись (PMR – Perpendicular Magnetic Recording), способная обеспечить запись 1 ТБ данных на дисковую пластину: биты поляризовались «перпендикулярно плоскости», а не «параллельно».

    Изначально технология PMR рассматривалась как временное решение, но она стала использоваться повсеместно. Однако PMR имеет все те же проблемы с устойчивостью чтения и записи, как в случае с LMR.

    Поэтому Western Digital и Seagate работают над дисками, использующими технологию термоассистируемой магнитной записи (HAMR – Heat Assisted Magnetic Recording), с помощью которой можно будет создать диски формата 3,5” с емкостью до 60 ТБ.

    HAMR призвана заменить PMR и использует небольшой лазер для нагрева части диска, на которую планируется осуществить запись. Это позволяет уменьшить размеры магнитной области, хранящей один бит информации, и увеличить стабильность хранения данных.

    Однако все вышеописанные технологии являются предшественниками новой многослойной 3D-записи. Еще в конце 2013 года исследователи из Международного университета Флориды показали, что 3D-запись обладает колоссальным потенциалом и позволяет создавать магнитные носители огромной емкости.

    В ML-3D вместо одного магнитного слоя используются сразу три, между которыми проложен изолятор. Для записи используется специальная магнитная головка. Чтение осуществляется с помощью более слабой магнитной головки, путем вычисления векторной суммы наностолбцов. На рисунке ниже показаны наборы битов, сформированные магнитным полем разной силы и направления и сгруппированные в наноколонки.



    Еще одной интересной и перспективной технологией является память с фазовым переходом (PCM – Phase Change Memory), которая рассматривается как будущая замена технологии флэш-памяти NAND. PCM использует халькогенид, материал, способный при нагреве переходить из кристаллического состояния в аморфное.

    Изменения состояния ячейки могут быть произведены около миллиона раз, что значительно превышает параметры коммерчески успешных NAND-ячеек в SSD-винчестерах корпоративного уровня (около 30 000 циклов перезаписи).

    Проблема PCM-памяти в большой задержке записи, но IBM продемонстрировала, что гибридное устройство с PCM, NAND и DRAM на одном контроллере способно работать в 275 раз быстрее обычного SSD-устройства. По оценкам IBM, первые коммерческие продукты, основанные на гибридной технологии PCM, появятся в продаже уже в 2016 году.

    Несмотря на то, что все большее количество компаний занимается вопросами увеличения емкости жестких дисков, существуют разработки, призванные повысить емкость оптических дисков. Активная работа над голографическими дисками (HVD) ведется уже как минимум десятилетие. В 2011 году GE представила свое голографическое хранилище: диски размером с DVD, которые могут уместить до 500 ГБ данных в крошечных голограммах.

    Для этого используется два лазера: красный и зеленый, объединенные в один луч. Зелёный лазер читает данные, закодированные в виде сетки с голографического слоя, близкого к поверхности диска, в то время как красный лазер используется для чтения вспомогательных сигналов с обычного слоя, расположенного в глубине.

    Однако в последнее время о технологии HVD мало что слышно, а один из главных разработчиков, компания InPhase Technologies, в 2010 году обанкротилась. Однако не хотелось бы, чтобы технология так и осталась «недореализованной», ведь эти диски достаточно надежны и считается, что они могут хранить данные на протяжении 30 лет.

    Далекое будущее


    В мае 2014 года IBM и Fujifilm анонсировали ленточное устройство хранения, которое может хранить 85,9 млрд бит на квадратном дюйме магнитной ленты. Подобная плотность позволяет создавать картриджи с емкостью до 154 ТБ, что в 62 раза превышает возможности картриджей LTO-6.

    Для получения столь высокой плотности эксперты Fujifilm разработали технологию Nanocubic, благодаря которой можно сформировать сверхтонкий магнитный слой. Чем тоньше магнитный слой, тем больше намагниченных доменов размещается на единице площади магнитной ленты. Коммерческие реализации технологии могут появиться в течение ближайших 10 лет.

    Однако самой перспективной и многообещающей технологией будущего являются хранилища на основе ДНК.



    Возможно это одна из самых странных технологий будущего. В 2012 году исследователи из Гарварда смогли закодировать в ДНК книгу из 53 400 слов, одиннадцать JPEG-изображений и одну программу на JavaScript.

    ДНК предлагает невероятную плотность записи – 2,2 петабайта на грамм. Это означает, что ДНК-диск размером с чайную ложку сможет уместить все данные, существующие в мире – каждую песню, каждую книгу, каждое видео. Помимо небольших размеров, еще одним достоинством ДНК-хранилищ является долговечность. По словам Джорджа Черча (George Church) из Гарварда, вы можете оставить ДНК-диск где угодно, хоть в пустыне, но данные останутся на нем даже 400 000 лет спустя.

    Процесс синтеза последовательности ДНК похож на нанизывание жемчуга на нитку. В этом случае информация кодируется в виде традиционных нулей и единиц. Эти значения присваиваются определенным химическим компонентам, мономерам, которые при помощи химических методов сцепляются в одну цепь, образуя полимеры. Чтобы прочитать записанную информацию, достаточно воспользоваться масс-спектрометром – устройством для считывания ДНК-последовательности.

    Для проверки того, как долго данные могут хранится в ДНК, ученые закодировали 83 килобайта данных (по данным New Scientist, стоимость кодирования 83 килобайт составила $1500). Материалом послужили Швейцарский Федеральный устав от 1291 года и палимпсест Архимеда. Выбор этих документов, по мнению ученых, показывает не только потенциальную применимость метода, но и его историческую важность. По оценкам представителей ETH Zurich, эти данные останутся неизменными на протяжении миллиона лет (если ДНК подвергнется заморозке).

    Самым большим препятствием, которое пока еще не позволяет использовать ДНК для хранения информации на практике, является время. Даже с использованием современных технологий расшифровки, чтение молекулы ДНК занимает многие часы – на несколько порядков больше, чем чтение обычного файла на компьютере. Потому этот тип хранилищ не подходит для часто используемых данных. Более того, ученые до сих пор заносят информацию в искусственную ДНК и лишь после этого помещают её в бактерию.

    Как известно, не все технологии начинают использоваться повсеместно и становятся широкодоступны. Но команда исследователей из США недавно осуществила прорыв, в котором показала, что можно хранить данные в так называемых «мягких веществах».

    Согласно новому исследованию, микроскопические частицы в жидкости могут быть использованы, чтобы кодировать те же нули и единицы, прямо как в современных жёстких дисках. В теории кластеры таких частиц однажды смогут хранить до 1 ТБ данных в столовой ложке жидкости.

    Термин «мягкое вещество» может относиться к жидкостям, полимерам и даже биоматериалам. Все эти вещества обладают предсказуемым поведением под воздействием различных температур – меняют форму на молекулярном уровне. Команда, ответственная за исследование, использовала определенный тип коллоидной суспензии со специальными наночастицами, сохраняющими свои свойства.

    Такие частицы при нагреве организуются в группы. В данном конкретном случае наночастицы собирались в группы из четырех и более штук, в то время как одна из них являлась центром. Размеры связок едва превышали 5 микрометров в диаметре, но команда ученых смогла визуально отметить происходящие изменения.

    Кластеры из четырех частиц могут находиться всего в двух состояниях, которые можно закодировать как ноль и единицу. Однако это всего лишь первый шажок в сторону «жидких хранилищ». Сейчас необходимо найти надежный способ формировать кластеры в больших объемах жидкости и быстро считывать записанные данные.

    Но, вероятно, самой передовой технологией будущего могут стать квантовые хранилища. Сегодня ученые изучают способы хранения данных с применением законов квантовой физики – то есть пытаются закодировать информацию с помощью управляемой ориентации спина электрона.

    На данный момент таким способом можно сохранить небольшое количество данных на очень непродолжительное время (менее дня), но если все получится, то, возможно, благодаря квантовой запутанности мы получим возможность мгновенно синхронизировать данные между двумя точками.

    P.S. Мы в 1cloud рассматриваем самые разные темы в нашем блоге на Хабре – пара примеров:


    И рассказываем о собственном облачном сервисе:

    • +7
    • 12,8k
    • 5
    1cloud.ru 166,26
    IaaS, VPS, VDS, Частное и публичное облако, SSL
    Поделиться публикацией
    Комментарии 5
    • 0
      ----платформа Kinetic Open Storage дает возможность приложениям и хостам связываться друг с другом напрямую

      Наконец стали реализовывать то что было на PDP еше при царе Горохе.
      Еше тогда каждый контроллер полноценно мог работать друг с другом без помоши ЦПУ.
      На своей СМ1420 (кстати с 18! процессорами) я просто мог просто переключателями (или через ЦПУ или еше несколькоми способами) сказать 8-му харду скопировать блоки с 5 по 20 на 1,3 и 7-й ленточный накопитель и одновременно вывести эти данные на 3 плоттер и 2-й векторный дисплей.
      • 0
        >Однако самой перспективной и многообещающей технологией будущего являются хранилища на основе ДНК.
        Это не только не самая перспективная технология, она даже разрабатывается не для этого.

        Редактирование ДНК и запись в неё изучаются в первую очередь для развития и проверки технологии редактирования нашего кода, создания полезных микроорганизмов и прочей медицины. Ни о какой технологии, направленной на хранения данных, речи не идёт — цели совсем другие. Для хранения ей разве что спецслужбы и шифропанки пользоваться будут.
        • 0
          каждого диска Kinetic HDD есть два гигабитных Ethernet-порта, каждый со своим IP-адресом, а платформа Kinetic Open Storage дает возможность приложениям и хостам связываться друг с другом напрямую через жесткие диски с помощью TCP/IP-инфраструктуры дата-центров, используя открытый API.

          Подобная технология может серьёзно преобразить инфраструктуру дата-центров и ИТ-индустрию в целом. Прямая связь дисков с приложениями позволит отказаться от контроллеров, файловых систем и даже массивов RAID.
          Я не понял, как смена интерфейса может позволить отказаться от над-интерфейсной технологии RAID?
          • 0
            HAMR — это же хорошо забытая магнитооптика?
            • 0
              Я так скучаю по дискетам!

              Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

              Самое читаемое