Pull to refresh
0
New Professions Lab
Обучение в области работы с данными с 2015 г.

«Специалист по большим данным»: учебная программа от Лаборатории новых профессий

Reading time4 min
Views21K
Сегодня я рад презентовать на Хабре образовательную программу «Специалист по большим данным» — интенсивный трехмесячный курс «Лаборатории новых профессий» для разработчиков и экспертов по IT-инфраструктуре, которые хотят войти в быстро в растущую индустрию Big Data.



Самая горячая профессия в IT
Несколько слов о нас: «Лаборатория новых профессий» это образовательный проект Digital October. Мы исследуем рынок труда, находим перспективные быстро развивающиеся ниши в области IT и digital и разрабатываем учебные программы, нацеленные на сложившихся профессионалов, которые хотят сделать быстрый скачок в карьере вместе с растущей индустрией.

Отрасль Big Data дает простор для такого скачка. После всплеска интереса к большим данным и волны первых разочарований, технология начинает находить применение в широком круге реальных проектов. К примеру, в декабре Яндекс объявил о запуске Yandex Data Factory, а на прошлой неделе очередной стартап в области Big Data получил $56 миллионов долларов инвестиций.

Международные источники тоже оптимистичны: IDC называет большие данные одним из важнейших технологических трендов 2015, а авторитетный журнал Inc. включает Big Data в топ 6 важнейших технологических компетенций этого года. Рекрутинговый сервис Glassdoor и вовсе назвал Data Scientist самой горячей IT-профессией 2015 года.

И самое главное: в России несмотря на кризис тоже огромный спрос на специалистов по Big Data — это мы узнали эмпирическим путем. Еще на начальных этапах подготовки программы к нам стали обращаться ведущие технологические компании в поиске сотрудников, специализирующихся на больших данных. Сейчас у нас есть шесть конкретных предложений от компаний (это банки, ритейл и мобильные операторы), готовых взять на борт наших выпускников. В общем, время для входа в отрасль самое благоприятное.


Если рассматривать Big Data на кривой зрелости (hype cycle), о которой не так давно писал Хабр, сейчас технология находится на стадии «склона просвещения»

Обучение через практику
Итак, цель нашей программы — научить разработчиков и технических специалистов на практике решать важнейшие задачи, которыми занимаются специалисты по Big Data. Подобный подход отражается в структуре курса. Курс состоит из трех конкретных кейсов, каждый из которых занимает 1 месяц. Это:
  • Анализ социальных графов
  • Создание мультиклассных классификаторов на основе анализа веб-логов
  • Разработка рекомендательных систем

С нашей точки зрения, это самые важные задачи в области анализа данных, и мы обеспечим студентам полное погружение в каждую тему.

Преподают только представители индустрии
Наши преподаватели — опытные практики, которые своими руками создают приложения на основе больших данных. Вести занятия на курсе в разное время будут Валерий Топинский (экc-Яндекс, ШАД), Константин Круглов (основатель Data-Centric Alliance), Киншук Мишра (Spotify) и другие люди из ведущих российских и международных компаний, использующих в работе Big Data. Индустрия меняется очень стремительно, и мы даем навыки и умения, актуальные прямо сейчас.

Каждый слушатель также получит персонального тьютора, который будет регулярно отслеживать прогресс в выполнении лабораторных работ, смотреть код, помогать с поисками решений и давать обратную связь.


СEO «Лаборатории новых профессий» Дмитрий Репин (справа) и директор образовательных программ Александр Турилин открывают занятие

Kaggle, реальные массивы данных и мастер-классы
Каждый из кейсов в нашей программе преподается в три этапа. Сначала студенты учатся видеть общие закономерности и разбирают хорошо проработанные задачи из Kaggle. Дальше выполняют самостоятельные проекты с реальными данными под руководством тьюторов. К примеру, в рамках второго кейса студенты попробуют оптимизировать алгоритмы показа рекламы в системе Data-Centric Alliance — а тот, кто добьется хороших результатов, не только получит одобрение преподавателей, но и сможет полностью отбить стоимость обучения.

На первых двух этапах студентам даются практические навыки по полному циклу работы с большими данными. Это:
  • Развертывание Hadoop/HDFS/HBase
  • Предобработка и очистка данных
  • Построение модели предсказания
  • Выбор оптимального алгоритма машинного обучения
  • Калибровка модели

Третья часть кейса позволяет познакомиться с готовыми инструментами и лучшими практиками. Спикеры из Яндекса, Сбертеха, Spotify, МТС, IBM, Cloudera будут проводить мастер-классы и рассказывать, как собирают, хранят и используют большие данные в их компаниях. В этом блоке студенты смогут оценить, насколько специфика данных в различных индустриях влияет на выбор инструментов и алгоритмов анализа.

Собеседование после окончания курса
Как было сказано выше, пока мы готовили курс к нам обратилось сразу несколько компаний в надежде найти специалистов по большим данным. Каждый студент, который успешно выполнит итоговые квалификационные задания (к слову, непростые), получит возможность пройти собеседование. Стратегические партнеры программы — Сбербанк-Технологии и Data-Centric Alliance, они готовы принять на работу большое количество квалифицированных людей. Мы будем внимательно следить за успехами и предпочтениями каждого студента, чтобы помочь найти работу, соответствующую его интересам и компетенции.



Онлайн как оффлайн
Еще одна приятная фишка — возможность учиться из любой точки мира, нисколько не теряя в качестве. Занятия проходят в центре Digital October три раза в неделю по вечерами, но в них можно принять участие и удаленно. Студенты, проходящие обучения в онлайне, ощущают себя полноценными участниками занятий благодаря профессиональной многокамерной съемке — в режиме видеоконференции можно задавать вопросы преподавателю и активно принимать участие в дискуссии. Также записи всех занятий доступны студентам в личном кабинете.

Наши требования к студентам
Сейчас в России есть несколько образовательных проектов для тех, кто хочет связать свою жизнь с большими данными — это “Школа анализа данных” Яндекса и магистерская программа “Системы больших данных” в Вышке — правда, они длятся по несколько лет и ориентированы на студентов и недавних выпускников.

Мы же, напротив, ориентируемся на сложившихся профессионалов, которые хотят совмещать учебу с работой. Курс получился сложным и насыщенным, новичкам он не подойдет. Мы мы честно предупреждаем, что на программе «Специалист по большим данным» придется работать очень интенсивно — как в классе, так и за его пределами, и ждем подготовленных слушателей. Минимальные требования такие:
  • Хорошие рабочие знания по основам теории вероятностей и математической статистики
  • Опыт разработки приложений от 2-х лет
  • Также (очень желательно) знать основы теории машинного обучения.

P.S. А еще мы подумали, что стоит дать пяти талантливым молодым разработчикам шанс поступить на программу бесплатно. Так родился конкурс Big Data Young Champion. Условия участия смотрите на нашей странице в Facebook.
Tags:
Hubs:
+7
Comments14

Articles

Change theme settings

Information

Website
newprolab.com
Registered
Founded
Employees
Unknown
Location
Россия
Representative
Артем Пичугин