Pull to refresh

ИТ управление — масштабируемый подход

Reading time5 min
Views15K
Долго являлся пассивным читателем Хабра, но вот собрался с духом и решил поделиться своим опытом. Надеюсь, мои идеи придут на пользу в повседневной практике админов.

Пару месяцев назад я проводил на работе анализ ИТ инфраструктуры, в ходе которого нужно было установить наиболее слабые места и дать рекомендации к улучшению. Уверен, ситуация с которой я столкнулся известна многим. За несколько лет, компания существенно изменилась и заметно подросла, однако некоторые элементы в используемой ИТ инфраструктуре так и остались неизменными за прошедшие 10 с небольшим лет. В результате, регулярно придумывались различные заплатки и изощрения дабы собрать все воедино, что, очевидно, не добавляло стабильности и эффективности общей системе. Итогом являлся пересмотр общей инфраструктуры и требований бизнес-процессов с целью выбрать новое единое решение. Другими словами – революция, не эволюция.



Во многих, если не во всех, небольших конторах системное администрирование начинается довольно диким образом, без какого либо плана на будущее. Это, в целом, и не удивительно, т.к. руководство более заботится о финансовом благополучии, а свежепоявившийся админ редко задумывается о своем месте работы через 5-10 лет. Однако, если вам все же “посчастливится” проработать в той же компании столько времени, вы вполне можете оказаться в ситуации где, казалось бы, все работает как задумано, но при этом количество изолированных и несовместимых систем неприлично превосходит трудовые ресурсы ИТ отдела. Именно так произошло в организации где я анализировал ИТ инфраструктуру, которая когда-то начиналась с одного сервера и двух ИТ работников, а сейчас насчитывает сотни пользовательских машин, собственный дата-центр и высокопроизводительный мейнфрейм.

Следущие рекомендации являются краткой выдержкой из общего документа анализа и представляют собой советы к построению ИТ систем с учетом будущего развития и потенциального развертывания новых продуктов.

Управление данными (Data management)



  • Заранее решите как Вы будете хранить все учетные данные (имена пользователей, конфигурации машин, гарантийные записи, финансы и так далее). Избегайте заметок, записей на “бумажке”, копий чеков и тому подобного – это все рано или поздно потеряется, как бы вы не старались.
  • Выберите единую платформу для управления такими данными. При этом лучше не полагаться на конкретный продукт (Microsoft Active Directory, Novell eDirectory, (Open)LDAP, etc.), если это не специализированный пакет для ИТ менеджмента. В конечном итоге, требования могут выйти за рамки функциональности продукта, поэтому очень важно наличие общедоступного и широко используемого интерфейса для доступа (например LDAP).
  • Старайтесь всегда интегрировать новые системы в выбранную платформу. Наличие трех и более изолированнных систем (например, корпоративный сайт + почта, домен Windows и учет Интернет траффика) – явный признак того, что пора задуматься о будущем такой архитектуры.
  • Старайтесь сохранять туда все, включая данные о выполненной работе, конфигурации машин, гарантийном обслуживании и лицензий на ПО. Это даст вам возможность узнать об истории конкретной станции и ее пользователя и поможет доказать что вы не слон ваши действия законны в случае проверок. Кроме того, вам будет что показать начальству на вопрос чем вы были заняты.


Клиентский подход к пользователям


  • Относитесь к вашим пользователям как к клиентам. Конечно, все наслышаны о бухгалтерах и уборщицах неопытнах пользователях, но в конечном итоге это поможет вам же разграничить область вашей ответственности от области трюков с черной магией и плясок вокруг всех электрических приборов.
  • Сохраняйте записи о всех пользовательских обращениях. Вы можете отлично помнить сотрудников в лицо, но когда ИТ отдел вырастет на очередного работника, а компания увеличится в разы, будет невозможно вспомнить и объяснить друг другу кто и что от вас требовал.
  • Дайте пользователям возможность отслеживать историю и статус своих обращений, а так же отправлять запросы удаленно. Это даст вам время для работы вместо разгуливания из офиса в офис или выслушивания проблем по телефону.


ИТ задачи


  • Автоматизируйте все, что можно автоматизировать. Конечно, всегда важно оценивать “стоит ли игра свеч”, но при создании любого кода вы выигрываете вдвойне – ускоряете решение существующей проблемы и создаете себе инструмент, который может пригодиться в будущем.
  • Создайте доску объявлений (в материальном или электронном виде). Самая раздражительная ситуация – это когда падает основное средство связи между сотрудниками (например, чат или e-mail), и в то время, когда вы заняты восстановлением сервиса, вам постоянно звонят, спрашивая “а что случилось?”
  • Если вы не единственный ИТ сотрудник, выделите специального человека (одного или больше) на прием обращений от пользователей. Всегда лучше, когда вы можете сосредоточиться на своей работе и вас не отвлекает телефон или “посетители”.


База знаний (Knowledge Base)


  • Создайте и поддерживайте базу знаний (Knowledge Base). Записывайте туда все нетривиальные решения, которые относятся к разряду “сделал и забыл”. Постарайтесь также интегрировать ее с конфигурацией всех станций. В этом случае вам и вашим коллегам будет легче решать проблемы, которые кем то уже были решены в прошлом. Кроме того, если случится апокалипис и вам придется переустановить один из ключевых серверов, подобная база знаний существенно ускорит процесс.
  • Создайте список наиболее частых проблем и решений к ним. Это могут быть известные баги в системах или частые запросы пользователей.
  • Добавьте возможность автоматического сохранения системных логов от наиболее критических служб и оставляйте эти записи на продолжительное время. Таким образом, вы сможете отследить что происходило с системой последнее время что поможет вам понять в чем причина ошибки.
  • Дайте пользователям частичный доступ к базе, и возможность добавлять свои комментарии и записи. Поверьте, некоторые из них могут разбираться в своей области не хуже вас. Кроме того, это даст возможность другим пользователям попытаться решить проблему самим, прежде чем звать вас на помощь.


Самое важное


Всегда держите аварийную копию всех ваших данных, особенно если вы реализуете что-то из вышесказанного. Такая копия должна быть не на параллельном сервере и не на вашей личной машине, а желательно где-то на другом конце города, или, лучше, другом континенте. В любом момент может произойти ситуация (отключение света, пожар, маски-шоу), когда вы останетесь либо с начисто убитым оборудованием, либо вовсе без него. В этом случае будет весьма обидно потерять вместе с ним ту самую базу, которая и помогла бы все восстановить.

Конечно, во всех перечисленных рекомендациях важно выбрать баланс между располагаемым временем и необходимостью реализации. Многое из этого доступно в готовых продуктах для ИТ менеджмента, о которых не по наслышке знают директора ИТ отделов крупных предприятий. К сожалению, большинство из них проприетарные (Remedy, LANDesk) и стоят немалых денег, то есть, если вы работаете в небольшой компании, вероятность внедрить подобный продукт стремится к нулю. Однако, есть и бесплатные open source решения, чаще довольно простые (SimpleTicket, Liberium, osTicket), но есть и более функциональные, например OTRS. Большинство из них, к сожалению, не предлагают русского перевода. Ваш покорный слуга в данный момент занимается разработкой SAAS версии ИТ менеджемента, но это уже совсем другааая история ;)

Статью написал не я, запостил по просьбе автора. Если есть желание отправить инвайт, адрес letoosh@letoosh.com
Tags:
Hubs:
+29
Comments46

Articles