Pull to refresh
Veeam Software
Продукты для резервного копирования информации

Как взять под контроль Virtual Machine Sprawl: 7 полезных отчетов в Veeam Availability Suite

Reading time 6 min
Views 3.1K
«Ты суслика видишь? Нет? А он есть!»

Аналогичная ситуация вполне возможна и с бесконтрольным ростом числа виртуальных машин (Virtual Machine Sprawl) — до определенного момента мы не считаем, что такая проблема имеет место быть в нашей инфраструктуре, а на самом деле она есть, просто не показывает себя в натуральную величину.

А в чем, собственно, дело?

Проблема бесконтрольного увеличения поголовья виртуальных машин довольно типична для быстро растущих виртуальных инфраструктур. Начинается всё с вполне резонного стремления того или иного подразделения компании работать со своими специализированными приложениями на выделенных серверах. Разумеется, благодаря виртуализации они получают такую возможность. А теперь, уважаемые читатели, сотрудники IT-отрасли, разработчики и тестировщики, прикиньте хотя бы приблизительно, сколько виртуальных машин вы засетапили, скажем, за последние полгода? А сколько из них было позабыто и позаброшено после успешного релиза?

Получается, что чем больше виртуализация проникает в рабочую среду и помогает решать производственные задачи, тем больше «виртуальных отходов» появляется в этой самой среде (как, впрочем, почти при любом производстве). Это-то и приводит к проблеме бесконтрольного роста количества виртуальных машин (VM sprawl).

Машины — виртуальные, а деньги — реальные

«Ничьи» машины продолжают потреблять ресурсы: даже будучи неактивными, они занимают место в системе хранения, на часть из них отвлекается процессор – а ведь этих ресурсов порой так не хватает для работы важных и нужных приложений! Вполне вероятно, что в итоге компании придётся потратить серьезную сумму на дополнительную СХД. Для случая датацентра в 1000 виртуальных машин возможные финансовые потери от VM Sprawl оцениваются в несколько десятков тысяч долларов в год (см. статью VMware).

Помимо этого, «виртуальный мусор» несет в себе угрозу информационной безопасности, так как забытые «виртуальные машины» могут выпасть из регулярных процессов обслуживания: установки патчей, обновления антивирусных баз, изменения групповых политик и т.д.

Можно ли как-то бороться с VM sprawl?

Ответ — «да». Например, Veeam Availability Suite, в частности, его составляющая Veeam ONE, включает в себя больше 80 отчетов по инфраструктурам VMware и Hyper-V, а также по инфраструктуре резервного копирования Veeam. Среди них есть и те, которые позволяют выявить скрытую угрозу признаки бесконтрольного роста числа виртуальных машин и содержат рекомендации по эффективному планированию и выделению ресурсов. О них и пойдет речь ниже.


«Всё куда-то девалось, ничего не осталось...»

Для оценки текущей обстановки задействуем возможности Veeam Availability Suite, предназначенные для планирования и прогнозирования использования ресурсов СХД, памяти и процессора.

Посмотрим дашборд Capacity Planning, и недостаток места (или памяти, или того и другого) заставит крепко задуматься — подавать срочную заявку на закупку дополнительной СХД надо прямо сейчас или еще можно “дожить до завтра”?


«Спокойствие, только спокойствие!»

Давайте не будем впадать в депрессию посмотрим, как вместо «выбивания» дополнительного финансирования можно, наоборот, помочь компании сэкономить деньги, выполнив 5 несложных шагов по рационализации использования уже имеющихся ресурсов.

Шаг №1 Вычисляем «зомби»

Назовём их так для краткости — они хоть и не “пожирают мозг”, но “выносят его” расходуют место на диске и другие жизненно важные ресурсы инфраструктуры. Это те виртуальные машины, которые совсем или почти совсем не используются, работают непонятно зачем, в отличие от полезных и востребованных.
a) Запускаем отчет Idle VMs и получаем список таких виртуальных машин, и тут уже решаем, что с ними делать: выключить, уменьшить выделенные им ресурсы или отдать их под другие задачи. Перед запуском отчета не забываем указать параметры:
— за какой промежуток времени мы хотим увидеть данные
— какие именно значения будут считаться порогом использования ресурсов (процессор, память, место на диске, сеть)
— сколько времени (в % от выбранного промежутка) машина должна провести в состоянии Idle, чтобы попасть в отчет


b) Для поиска шаблонов виртуальных машин применяем отчет Idle Templates, а в качестве параметра отчета задаем время последнего использования шаблона.

На выходе получаем список «бесхозных» объектов с указанием размера и местонахождения — эти шаблоны можно удалить или мигрировать в более просторное место.


c) С помощью отчета о неэффективно используемом дисковом пространстве Inefficient Datastore Usage исследуем «зомби» (еле живые виртуальные машины) — сразу видим, где расположены такие машины, когда последний раз использовались и сколько места занимают.


Шаг №2. Находим лишние резервные копии

Как быть, если отчет Capacity Planning for Backup Repository показывает, что заканчивается место в репозитории резервных копий?

Рекомендуем проверить, не включены ли какие-либо машины сразу в несколько заданий резервного копирования. Для этого запускаем отчет VMs Backed Up by Multiple Jobs и смотрим, кем и куда сохраняются бэкапы таких машин.


Шаг №3 Убираем «мусор»

Накапливающийся «мусор» — это побочный эффект жизнедеятельности виртуальной инфраструктуры, то есть множества изменений, происходящих в ней каждый день. Временные файлы виртуальных машин и файлы конфигурации могут продолжать существование на СХД и после того, как были удалены родительские объекты — а ведь это дополнительный расход дискового пространства.

Здесь помогает отчет Garbage Files — он определяет, какие объекты более не используются, и где находятся соответствующие файлы-«отходы».


Шаг №4 Применяем категоризацию

Полезной опцией Veeam Availability Suite является также возможность группировать объекты инфраструктуры, используя бизнес-критерии. Что это такое и как оно поможет победить бесконтрольный рост числа машин? Всё очень просто — для виртуальных машин указываем их «организационные данные»: какой отдел использует, на каком проекте, в каком качестве, и т.д., и т.п. При необходимости выбираем соответствующую категорию в представлении и выполняем массовую операцию.

Допустим, отдел R&D задействовал для работы над проектом Ы Temp некоторое количество виртуальных машин — после завершения проекта просматриваем список этих машин и удаляем ненужные.


Шаг №5 Находим ненужные снапшоты

Казалось бы, при чем тут снапшоты, если мы говорим об экономии ресурсов, избыточных виртуальных машинах и тому подобных вещах? На самом деле, чрезмерное количество снапшотов тоже негативно влияет на инфраструктуру, поэтому мы рекомендуем включить и этот шаг в процесс борьбы с проблемой VM sprawl.

Рассмотрим ситуацию, когда снапшот «выпадает» из цепочки снапшотов виртуальной машины — это может произойти при падении хоста, сбое при консолидации снапшотов или при некорректном создании резервной копии. Такой «бесхозный» (orphaned) снапшот, однако, продолжает занимать место на диске.

Кстати, VMware рекомендует следить за длиной цепочки снапшотов виртуальной машины: она должна состоять не более чем из 3 снапшотов, время использования каждого — не более 3 дней.

Попробуем построить наш собственный отчет Custom Infrastructure, указав в качестве типа объектов виртуальную машину и виртуальный диск, а в качестве интересующих нас свойств те, что относятся к снапшоту. Для этого в диалоге Select Columns выбираем Name, VMDK file, Virtual Disk: Label, Snapshot: File name, Snapshot: File size.

Затем установим фильтр значений Custom Filter в виде выражения: VMDK file — Contains – 0000.


На выходе получим список обнаруженных в нашей VMware-инфраструктуре «бесхозных» снапшотов.


За более подробными инструкциями по генерации такого отчета добро пожаловать в Базу знаний Veeam Support: KB1757: Using Veeam ONE Reporter to Detect Orphaned Snapshots in VMware.

Полезно также следить и за возрастом снапшотов, для чего используем отчет Active Snapshots. Он показывает, какие снапшоты самые большие, а какие — самые древние (скорее всего, вряд ли вам понадобится откатывать виртуальную машину на такое старое состояние).


В заключение — полезный совет

Чтобы упростить себе задачу борьбы с VM sprawl, советую создать в Veeam ONE Reporter специальную папку для вышеупомянутых отчетов, назвать ее, скажем, VM Sprawl Control, и поместить в нее всю «великолепную семерку». При первой генерации отчета нужно не забыть указать требуемые параметры и пороговые значения (там, где они есть), а потом уже можно настроить автоматическую генерацию всей папки отчётов по расписанию и доставку почтой (см. первый рисунок в начале этой статьи).

Дополнительные ссылки:

Tags:
Hubs:
+1
Comments 0
Comments Leave a comment

Articles

Information

Website
veeam.com
Registered
Founded
Employees
1,001–5,000 employees
Location
Швейцария