company_banner
  • CRISP-DM: проверенная методология для Data Scientist-ов

      Постановка задач машинного обучения математически очень проста. Любая задача  классификации, регрессии или кластеризации – это по сути обычная оптимизационная задача с ограничениями. Несмотря на это, существующее многообразие алгоритмов и методов их решения делает профессию аналитика данных одной из наиболее творческих IT-профессий. Чтобы решение задачи не превратилось в бесконечный поиск «золотого» решения, а было прогнозируемым процессом, необходимо придерживаться довольно четкой последовательности действий. Эту последовательность действий описывают такие методологии, как CRISP-DM.

      Методология анализа данных CRISP-DM упоминается во многих постах на Хабре, но я не смог найти ее подробных русскоязычных описаний и решил своей статьей восполнить этот пробел. В основе моего материала – оригинальное описание и адаптированное описание от IBM. Обзорную лекцию о преимуществах использования CRISP-DM можно посмотреть, например, здесь.


      * Crisp (англ.) — хрустящий картофель, чипсы
      Читать дальше →
    • Митап по SQL Server: ждём только вас

        Друзья, с радостью анонсируем наш «Майский митап 'SQL и не только'». Вместе с другими участниками TechGuruDay мы соберемся 18 мая в офисе ЛАНИТ, чтобы обсудить особенности Microsoft SQL Server и другие вопросы.

        TechGuruDay – это творческая реализация нашей попытки создать неформальную группу IT-профессионалов для обмена уникальным опытом и мнениями на самые злободневные темы. Все организационные вопросы мы решаем на площадке Meetup.com, а делимся наболевшим и угощаемся плюшками на офлайн-встречах, как раз таких, как «Майский митап».

        Приглашаем вас присоединиться к нашей компании. Больше деталей о предстоящем митапе и небольшой экскурс в историю наших митапов (со ссылками на презентации и видео выступлений) вы найдете внутри поста.


        Вот чем мы готовы поделиться со всеми, кто найдет в себе силы к нам присоединиться.
        Читать дальше →
      • Броня крепка, и танки наши быстры

          Приветствую всех любителей тяжелой техники. Сегодня в блоге группы компаний ЛАНИТ исторический пост. Он посвящен приближающемуся Дню Победы.

          Пока мировые державы продолжают состязаться в военном оснащении и демонстрируют всё более совершенные образцы бронетехники, я хочу вам рассказать пару историй из советского танкостроения. Тем более что многие современные модели – это не что иное как новейшие модификации машин прославившихся серий.

          В этих историях я принимал либо косвенное, либо непосредственное участие и видел, какие трудности приходилось преодолевать конструкторам и технологам.

          Будет в моем рассказе и про информационные технологии, потому что именно ИТ в свое время помогли исправить серьезные производственные дефекты, над которыми билась целая команда инженеров.



          Рисунок 1. Источник
          Читать дальше →
        • Из будней сисадмина: распаковываем NetApp FAS 9000



            Одна из медиакомпаний, с которой «Онланта» сотрудничает, в том числе в рамках задач проектирования и поддержки частного облака, озаботилась размещением своих HD-видеоматериалов на новой системе хранения данных. В качестве СХД была выбрана модель линейки модульных гибридных флэш-систем от NetApp — FAS 9000.

            Это одна из первых поставленных в Россию систем NetApp FAS 9000, поэтому мы думаем, что вам будет интересен наш фотообзор и краткие комментарии по ходу распаковки системы и установки ее в ЦОД.

            Подчеркну — это именно «фотообзор» новой системы от NetAPP, которую мало кто видел и держал в руках. Перед нами стояла задача — распаковать, установить систему в ЦОД, включить ее и передать заказчику. Тестирование системы не входило в наши планы.
            Читать дальше →
          • Как мы в Бауманке болид собирали: зачем студенческой команде понадобились PLM-технологии

              Всем привет! Я учусь в Московском государственном техническом университете имени Н. Э. Баумана на кафедре Э2 «Поршневые двигатели».  В этой статье я хочу рассказать о том, какие выводы мы сделали, участвуя в Formula SAE – международных инженерных соревнованиях студенческих команд по созданию гоночных автомобилей типа «Формула», и почему решили перейти на цифровое проектирование. Сейчас мы начинаем внедрять в нашей лаборатории, где собирается болид, систему управления жизненным циклом изделия (Product Lifecycle Management, PLM). Первый этап – обучение, и в этом нам помогает компания ЛАНИТ. Наш опыт может быть полезен студентам технических специальностей, которые работают над схожими задачами или хотят собрать свою университетскую команду для участия в Formula SAE, а также небольшим конструкторским бюро, которые уже задумываются о переходе на цифровое проектирование.



              Фото Хабрахабра
              Читать дальше →
            • Huawei USG 6300. Базовая настройка файервола из коробки

                Идея написать эту статью возникла после того, как я попытался найти хоть какую-то информацию по настройке файерволов от Huawei в интернете. В русскоязычном сегменте я не нашел ничего, в англоязычном, в основном, устаревшие данные по предыдущим моделям и отсылки к документации (которая, к слову, есть на сайте производителя в открытом доступе и достаточно подробная).  

                При наличии опыта работы с файерволами других производителей документации должно быть достаточно, чтобы запустить и работать с Huawei USG, но по опыту я знаю, что к мануалам обращаются, когда все варианты уже испробованы. Поэтому одна из целей этой статьи – сэкономить время при первичной пусконаладке этого относительно нового оборудования. Конечно, в одной статье не удастся охватить весь функционал, тем не менее, основные начальные кейсы по настройке тут будут рассмотрены. Инженеры могут использовать статью как шпаргалку по инсталляции сетевого оборудования, так как те базовые настройки, которые будут тут описаны, как правило, придется делать во всех инсталляциях.


                Источник
                Читать дальше →
                • +14
                • 4,8k
                • 4
              • Печать в компании: копейки, которые берегут миллионы

                  Один из клиентов обратился к нам в «Онланту» за услугой сервиса печати, получил прайс и на некоторое время удалился. Чуть позже он вернулся и заявил, что посчитал потенциальные затраты, и у него получилось дешевле. То есть он зашел на Яндекс.Маркет, взял цены на офисные принтеры, выбрал тот, который ему понравился. Потом нашел срок службы принтера — 5 лет, или 60 месяцев. Разделил цену на месяцы — получил затраты на печать в месяц. Затраты, разумеется, его устроили, а наш прайс — не очень. Бывало с вами такое?



                  При этом клиент не учел ни затраты на обслуживание принтера, ни расходы на картриджи, ни даже стоимость бумаги. То есть у клиента максимально поверхностное представление о том, из чего состоит цена печати одной страницы в его компании. Ожидания по цене крайне заниженные. Да и вообще — разве печать может чего-то стоить компании в век победившего электронного документооборота?!

                  Ну, во-первых, не победившего — и вы в этом убедитесь. Во-вторых, может. Еще как может. Давайте посчитаем.
                  Читать дальше →
                • Программно-определяемые СХД: сравниваем 7 решений

                    В этой статье я кратко расскажу о программно-определяемых хранилищах (Software-Defined Storage, SDS) и о возможностях их применения, которые они дают при построении ИТ-инфраструктуры. В конце статьи вас ждет сравнение семи SDS-решений. Я протестировал их, когда мы с коллегами из «Онланты» прорабатывали варианты развития инфраструктуры облака OnCloud.ru. Надеюсь, что сравнительная таблица сэкономит вам кучу времени и сил при выборе продукта.


                    Источник
                    Читать дальше →
                  • Система менеджмента качества: как разобраться в стандартах и запустить процесс их внедрения в компании

                      Положительные моменты использования стандартов ISO и системы менеджмента качества доказаны опытом многих компаний, в том числе и в сфере информационных технологий. Об этом уже много написано, поэтому пропагандировать ISO и систему менеджмента качества я не берусь. Задача моей статьи — показать, что с помощью двух не очень сложных схем можно понять смысл процесса внедрения системы менеджмента качества и получить конкретные, четкие рекомендации, какие документы для этого требуются. Таких схем, которые приведены в статье, вы не найдете ни в одном руководстве. Именно поэтому я решил поделиться ими с читателями Хабра.


                      Источник
                      Читать дальше →
                    • Как с помощью maven работать с библиотеками, которых в maven нет

                      • Tutorial

                      В статье я расскажу, как подключить библиотеку, которой в maven по умолчанию нет, и как подключить другую библиотеку, исходники которой давным-давно потеряны.


                      Также я опишу, как сделать maven проект, который генерирует артефакт, по совместительству являющийся библиотекой, и как подключить эту библиотеку к другому своему же maven проекту.


                      Эта статья для тех, кто только начинает осваивать java.


                      image


                      В моей предыдущей статье было сказано, что maven сам скачает все указанные в pom.xml зависимости. А вот что будет, если он какую-нибудь зависимость не найдёт? В таком случае maven скажет, что зависимость не обнаружена и прервёт процесс сборки с ошибкой. Что делать в этом случае?

                      Читать дальше →
                    Самое читаемое