Блог компании HP → «Одиссей» стирает границу между серверами x86 и бизнес-критичными системами
22 ноября HP представила проект Odyssey, который расширит свободу выбора аппаратных платформ и операционных систем для развертывания критичных для бизнеса приложений. В ближайшие два года компания дополнит портфель своих бизнес-критичных систем лезвиями на базе процессоров Intel Xeon, поддерживающими Windows и Linux. Для шасси флагманской модели HP Integrity Superdome 2 будет выпущено лезвие DragonHawk, а для стандартных полок HP BladeSystem c7000 и с3000 – лезвие HydraLynx.Железо → MTBF — откуда берется «миллион часов MTBF»

Просто удивительно то, насколько велико непонимание вокруг такого широко распространенного понятия, как MTBF (Mean Time Between Failure — «Время между сбоями» или «наработка на отказ» ), насколько смысла этой величины не понимают, зачастую, даже специалисты в области хранения данных.
Казалось бы — что может быть проще. «Наработка на отказ» это время беспроблемной работы, от первого включения нового диска, до момента отказа, посчитанная в часах.
Почти любой, кто поинтересуется значением, приводимым производителями, в качестве MTBF современных дисков, и с легкостью сделает несложные подсчеты, будет удивлен странной его величиной.
На сегодня величина MTBF приводится в миллион или даже полтора миллиона часов.
В году — примерно 8760 часов, значит, исходя из нашего понимания «физического смысла» этого значения, производитель планирует «наработку на отказ» для любого такого диска более ста лет (114 лет, для миллиона часов MTBF), что является очевидной нелепостью для каждого, у кого подыхали жесткие диски.
Разработка → Про надежность
В статье рассказывается про комплексный подход к обеспечению надежности систем. Основная мысль которую хочется донести — надежность нельзя купить из коробки, надежности нельзя достичь исполняя определенные ритуалы, надежность надо тщательно продумывать.
На эту тему написано много книг и статей, но к сожалению слишком у многих коллег я наблюдал «ритуальный» подход к данной проблеме. Т.е. советы выполнялись механически, без осознания зачем это надо и что в результате получается.
На эту тему написано много книг и статей, но к сожалению слишком у многих коллег я наблюдал «ритуальный» подход к данной проблеме. Т.е. советы выполнялись механически, без осознания зачем это надо и что в результате получается.
Блог компании Parking.ru → Parking.ru — повышаем надежность. Запуск кластера для Hyper-V
В начале марта мы полностью запустили в коммерческую эксплуатацию отказоустойчивый кластер узлов Hyper-V R2 на котором теперь надежно работают все наши виртуальные выделенные сервера. В ходе внедрения мы испытали некоторые проблемы о чем писали некоторые наши клиенты.
Железо → Охлаждение серверов — «больше» не всегда значит «лучше»
Опрос, проведенный одним из ведущих производителей систем охлаждения и кондиционирования для датацентров, компанией Liebert показал, что 66% опрошеных поддерживают в датацентрах температуру не выше 21 градуса C, и ни один выше 24C.

Температура по горизонтали — в американских «фаренгейтах».
CRAH это Computer room air-handler, по нашему — кондиционер.
При этом, рекомендации ASHRAE (American Society of Heating, Refrigerating and Air-Conditioning Engineers), пересмотренные в прошлом году, рекомендуют верхний лимит рабчего диапазона равным 27C на входе в сервер.

Температура по горизонтали — в американских «фаренгейтах».
CRAH это Computer room air-handler, по нашему — кондиционер.
При этом, рекомендации ASHRAE (American Society of Heating, Refrigerating and Air-Conditioning Engineers), пересмотренные в прошлом году, рекомендуют верхний лимит рабчего диапазона равным 27C на входе в сервер.
Железо → Почему RAID-5 — «mustdie»?

В последнее время в мировой компьютерной прессе стало появляться довольно много статей на тему: «Почему RAID-5 это плохо» (пример раз, два, и другие)
Постараюсь, без ныряния в инженерные и терминологические дебри объяснить, почему до сих пор RAID-5 вроде работал, а теперь вдруг перестал.
Системное администрирование → Отказоустойчивые службы при помощи CARP
Краткое введение
Про сам протокол очень хорошо написанно в википедии. Кому интересны подробности и история — туда. В двух словах о нём можно сказать так: это протокол избыточности, который позволяет двум или более компьютерам в одной подсети иметь одновременно один и тот же IP адрес, при этом возможна настройка этой группы компьютеров как взаимозаменяемые (главный компьютер отключился/сломался – вместо него сразу же принимается за работу другой, у которого приоритет выше) и так по кругу, обеспечивая тем самым почти 100% доступность служб. СARP является «родным» для OpenBSD, FreeBSD и NetBSD. На линуксе с ядром выше 2.4 доступен через ucarp.
Немного сумбурно, но в дальнейшем, надеюсь, ситуация прояснится.
Гаджеты. Устройства для гиков → Corsair анонсировала сверхпрочную флешку объемом 64 Гб

Ультра-надежные флешки Flash Survivor от Corsair доказали свою популярность у потребителей благодаря своей необычной прочности и кейсу из авиационного алюминия, который делает устройство практически неуничтожимым. Каждый носитель также защищен рифленой поверхностью амортизирующей при сильном ударе о твердую поверхность. Помимо своей феноменальной прочности корпус снабжен специальной резьбой с EPDM прокладкой, обеспечивающей водонепроницаемость (при погружении на глубину до 200 метров). Если поискать в интернете, то вы найдете массу различных обзоров, в которых флешку кипятили, били, давили, замораживали, грели в микроволновке и даже проезжали по ней внедорожником, флешка все это переносила с достоинством, продолжая работать во что бы то ни стало и хранить важные данные!