Компания
18,77
рейтинг
10 марта 2015 в 17:51

Разработка → Курс по Big Data: три месяца на основные знания, и зачем это нужно recovery mode



Студент в Big Data получает 70 тысяч рублей в месяц, а специалист с опытом 3-4 года — 250 тысяч рублей в месяц. Это те, например, кто умеет персонализировать предложения розницы, искать в соцсети человека по анкетным данным заявки на кредит или по списку посещённых сайтов вычислять новую симку старого абонента.

Мы решили сделать профессиональный курс по Big Data без «воды», маркетинга и всяких эджайлов, только хардкор. Позвали практиков из 7 крупных компаний (включая Сбербанк и Oracle) и устроили, фактически, хакатон длиной во весь курс. Недавно у нас прошел день открытых дверей по программе, где мы напрямую спросили практиков, что же есть Big Data в России, и как компании на деле используют большие данные. Ниже ответы.

Сбербанк


Екатерина Фроловичева, начальник отдела технологических исследований Сбербанк России, говорит, что Big Data — это хороший красивый маркетинг, термин, который сформировался из целого ряда дисциплин, которые существовали не вчера, не позавчера, и не два-три года назад. Машинное обучение, data mining — всё это в сочетании просто используется для решения задач.

Где тонкая грань между классической аналитикой и большими данными? Если вы можете уместить свои данные в обычной таблице с измеряемым количеством строк и создавать к ней агрегированные запросы — это классическая аналитика. Но если вы берете разнородные источники информации и исследуете их по разным параметрам, причем в реальном времени — это и есть Big Data.

По клиентам очевидные вещи — массовая персонализация и все то, что может помочь увеличить количество вторичных продаж. Активных держателей карт Сбербанка — 50 млн. Это не те, кто просто имеет карты, а те, кто тратит. Как их попытаться идентифицировать по их вектору интересов, по какому набору параметров, признаков, по какому ID их распознать, что они у нас записаны где-то в какой-то system of record — это первый срез, который надо преодолеть. А как сделать, чтобы в режиме реального времени пользователю пришло предложение, на которое он откликнется, — это ровно те задачи, на которые стоит ориентироваться. Те кейсы, которые описывают работу compliance и проблемных активов, я бы не хотела раскрывать, т.к. это вопросы не публичного знания.

Рынок труда


Павел Лебедев, руководитель направления исследований Superjob, сразу начал с денег и статистики. На момент выступления на дне открытых дверей по Big Data, в их статистике было примерно 200 вакансий прямо по теме и 80 вакансий о Data Science/Data mining. Шесть крупных российских компаний ищут специалистов постоянно, остальные — эпизодически. Больше всего Big Data-профессионалы нужны в телекомы, банки и крупный ритейл. Более того, чтобы попасть на работу в эти места, достаточно просто пройти усиленный специализированный курс на 1-2 месяца при наличии общего IT-бекграунда (немного математики, немного SQL).

Как правило, нужны бизнес-аналитики и инженеры по машинному обучению. Иногда ищут архитектора баз данных. Вообще, каждый работодатель понимает Big Data по-своему, и пока общих критериев как к C++ разработчикам, например, нет.

Что входит в работу такого человека? Как правило, сначала он должен отстроить процесс сбора данных, потом отстроить процесс его анализа. Аналитика, тестирование гипотез и т.п. Затем — внедрение полученных решений в бизнес-процессы непосредственно на предприятии.

Первый диапазон зарплаты — 70-80 тысяч рублей в месяц. Это начальный уровень, без опыта работы и глубокого знания языков программирования. Как правило, это выпускники ВУЗов. Предполагается, что в ВУЗе дали базовые знания SQL-запросов и, опять же, научили удалять выбросы при построении скользящего среднего.

Следующий диапазон до 100-120 тысяч рублей в месяц подразумевает уже больший набор практических знаний, работу с различными статистическими инструментами. Чаще всего SPSS, SAS Data Miner, Tableau и т.д. Нужно уметь визуализировать данные, чтобы доказывать другим людям, почему важно что-то конкретное делать. Проще говоря, надо будет встать на собрании инвесторов и объяснить, что вы там получили, но не на птичьем языке.

Третий диапазон — до примерно 180 тысяч рублей в месяц — появляются требования к программированию. Чаще всего упоминаются скриптовые языки Python и т.д., и уже опыт работы два года, опыт машинного обучения, использования Hadoop и т.д. А вот самые высокие зарплаты — до 250 тысяч рублей в месяц — это люди с очень высокой квалификацией. Определяется по опыту реализации чего-то конкретного на рынке, академическому внедрению и своим разработкам. Выше только эксклюзив, когда зарплата больше, но людей по стране с нужной квалификацией десятки или единицы.

Сбербанк уточняет: норма — за год от 1,5 до 3 миллионов рублей. И да, Сбербанк рассчитывает взять как минимум пару человек с ближайшего курса к себе на работу (но об этом ниже).

МТС


Эксперт — Сагинов Виталий, отвечает за направление Big Data в МТС.

«В начале 1990-х годов два математика пришли к выводу, что использование регрессионных методов анализа позволяет предсказать с достаточной долей вероятностью, как клиент банка будет платить по счетам — будет он оплачивать вовремя или будет допускать просрочку. Они ходили с этим по всему Манхэттену, предлагая City и всем остальным. Им говорили: «Нет, ребята. Вы что? У нас тут профессионалы, которые общаются с клиентом, которые по цвету зрачка могут определить просрочку на 3-й, 9-й или 12-й месяц». В результате, они нашли маленький региональный банк в Вирджинии, который назывался Signet. Качество кредитного портфеля улучшилась в два раза относительно изначально значения — до того, как они начали экспериментировать. Последующие 10 лет розничный бизнес этого банка был выведен в отдельную компанию, которая сейчас называется Capital One, и эта компания, этот банк входит в десятку крупнейших розничных банков США с количеством клиентов, по-моему, около 20 млн., и порядка 17-18 млрд. долларов клиентских денег. Фактически, эта компания поставила данные и их обработку в основу своей бизнес-стратегии и бизнес-модели».

Виталий говорит, что данные — это актив. Но рынка для этого актива нет, как когда-то не было рынка для онлайн-бизнеса до 2000-х годов. То же самое в Европе и США — рынка сейчас просто нет, поэтому большая часть реальных инвестиций идёт в работу с данными внутри компании для оптимизации своих процессов. Обычно сначала опытным путём устанавливается, что именно приносит прибыль, потом под это строится аппаратная и программная архитектура. Только одна компания позволила себе пойти обратным путём — British Telecom — но там Big Data делал бывший IT-директор, который идеально точно представлял, что нужно.

Виталий считает, что Big Data через 15-20 лет породит новый Интернет, а мы сейчас у его истоков. Конкретно сейчас главная проблема развития направления — это отсутствие точных юридических процедур, масса согласований и спорных моментов.

Oracle


Светлана Архипкина, лидер направления продаж Big Data Technology, Oracle, говорит, что первая группа кейсов вокруг больших данных — это то, что связано с клиентами, персонифицированный подход вроде предложения на скидку на подгузники, ещё когда отец не знал, что его 15-летняя дочь беременна.

Вторая группа задач, связанная с большими данными — это оптимизация, то есть все, что связано с моделированием и использованием очень больших объемов данных.

Третья группа — это все задачи, связанные с мошенничеством. Тут в ход идут различные решения по видеораспознаванию образов, по анализу неструктурированной информации. Это очень большой стек задач, особенно для банков и телекомов.

И самые новые задачи — кроссиндустриальные. Там чаще всего встают вопросы работы с уровнем баз данных, не относящихся к традиционным реляционным.

Acronis


Алексей Русляков, директор по разработке продуктов Acronis, рассказал, что две основных проблемы Big Data — как хранить эти данные и что с ними делать.

Где-то 5-6 лет назад мы запустили сервис облачного хранения бэкапов, благодаря которому пользователи могли делать резервные копии своих ноутбуков, рабочих станции, серверов, и хранить их в нашем дата-центре, в облаке. Первыми были дата-центры в США, Бостоне, Франции. Сейчас ДЦ есть и в России. Если бы мы организовали хранение облачных резервных копий на нетапах или девайсах от EMC, стоимость гигабайта хранения была бы очень высокой, и это мероприятие, скорее всего, стало бы коммерчески невыгодным. С появлением таких гигантов, как Google и Amazon, нам было бы сложно выдерживать конкуренцию, так как, благодаря огромным мощностям, стоимость гигабайта данных у них довольно дешева. Поэтому перед нами стала задача разработать эффективную и недорогую систему хранения.

«Речь шла о lazy data — данных, которые единожды пишутся, и потом периодически читаются, либо удаляются. Это не те данные, к которым нужен постоянный доступ, и не те, которые требуют высоких IOPS. Для такой „холодной информации“ мы разработали собственную технологию хранения больших данных. Еще один вопрос, который стал перед нами: как каталогизировать хранимые данные, индексировать их и обеспечить нашим пользователям быстрый поиск по ним. Задача, на самом деле, нетривиальная, учитывая, что данные хранятся распределено и с некоторой избыточностью. Параллельно нужно обеспечить тиеринг данных (data tiering): чтобы информация, к которой часто обращаются, хранилась на дорогих и быстрых носителях, а вся остальная — на медленных и дешевых.

»Одной из самых интересных задач, над которой мы работаем и сейчас, стала дедупликация данных. Когда мы говорим о Big Data, встает вопрос о распределенности узлов, хранящих данные, и как, с учетом этой распределенности, сделать дедупликацию эффективной. Нужно правильно синхроинизровать данные между узлами, и это большая работа.

Луиза Изнаурова, директор по разработке новых медиа CondeNast Russia добавила, что Big Data для журналистики может достаточно сильно поменять сферу.

Курс


Собственно, как видите, рынок Big Data испытывает жёсткий дефицит квалифицированных специалистов. Поэтому именно эти эксперты и ещё несколько представителей крупных компаний сделали ставку на профессиональный курс по Big Data, который позволит частично решить этот вопрос.

Первый набор уже был. 18 апреля будет второй набор на этот трёхмесячный курс. В программе — 3 части. Это три конкретных кейса, каждый из которых занимает один месяц, и они бесконечно практичны. Кейс №1 — это создание DMP-системы за месяц. Кейс №2 — это анализ социального графа на примере «Вконтакте». Это тоже займет целый месяц, и в результате этого нужно будет написать в команде анализатор этого социального графа на больших данных. Кейс №3 — рекомендательные системы. Опять-таки, эта история очень понятна и востребована со стороны бизнеса, многие про это говорили — каким образом можно предугадать, что хочет человек.

На рынке интересна и востребована не теория, а практика, поэтому технический специалист, специалист по обработке, анализу данных должен понимать, какую бизнес-задачу он решает, и стек технологий, который с этим связан, очень сильно зависит от этой бизнес-задачи. Это означает работу с совершенно реальными данными. Не с данными, которые высосаны из Wikipedia, не с данными, которые академически известны уже 25 раз, а с данными из бизнеса, и наши партнеры по бизнесу с нами ими делятся.

Сроки жестоки. За месяц построить DMP-систему с нуля — это тяжело. Мы это понимаем, и это означает, что курс будет очень интенсивным и требующим большой концентрации. Его можно совмещать с работой, но если кроме работы у вас в жизни будет этот курс, то всего остального уже не будет.

— Константин Круглов, основатель D.C.A. Alliance

Устроено так — три раза в неделю: вторник, четверг с 7 до 10 вечера, в субботу с 4 до 7.

Каждую неделю надо будет коммитить что-то конкретное. Один пропуск — и вы не проходите курс. Если вам нужна теория — идите на Курсеру, здесь же будет только практика. Работа будет командной, и команды будут постоянно перемешиваться.

Ещё одна история — конкурс D.C.A., который позволит вам в течение первого месяца вернуть назад деньгами от 25% стоимости вашего обучения, если вы напишете хороший алгоритм. Ачивка подобного плана есть в каждом задании.

Вот ссылка на подробности и программу.

Ожидается, что треть выпускников — аналитики, которые умеют пользоваться разного рода инструментами для анализа больших данных, отлаживать модели, проверять гипотезы и собирать данные (например, для компаний продаж или чтобы выявлять паттерны фрода), остальные две трети выпускников будут разработчиками, которые умеют развернуть инструменты для работы с большими данными и своими руками могут создать работающие системы (то есть, на входе это должны быть люди уровня архитекторов и прикладных программистов продвинутого уровня).
Автор: @sashaturilin
New Professions Lab
рейтинг 18,77

Комментарии (90)

  • +17
    Пока «Big Data остается как подростковый секс», технологии маркетинга хорошо отработаны и успешно применяются («управляй мечтой» === «з/п от 250 тыс. рублей»), не забывая, что производительность труда пропорциональна прибыли и обратно пропорционально времени/трудозатратам для ее получения, организаторы решил просто: «Если вам нужна теория — идите на Курсеру, здесь же будет только практика».

    В итоге похоже на оплаченный самими участниками трудозатратный конкурс с целью достижения маркетинговой морковки («специалист с опытом 3-4 года получает 250 тысяч рублей в месяц»). Хороший безнес-план, надо будет взять на заметку ;)
    • –5
      Сбербанк прямо заявил, что собирается взять людей с курса на работу, остальные компании тоже думают в этом направлении. Так что не «морковка», а нормальная гарантия того, что обучение будет качественным и по делу.
      • +10
        Есть такое правило (конечно не формальное) участвовать в конкурсе тогда, когда интересен процесс или тема конкурса, потому что участие только ради результата часто оборачивается разочарованием (потому что в конкурсе участвуют многие, а победитель только один). Это взгляд на конкурс со стороны участника.

        А со стороны организатора конкурс — лучшее вложение денег. Хочется получить 1000 реализованных (!) идей логотипа собственной компании? Нет ничего лучшего, чем организовать конкурс. Пусть даже призом будет 3-х кратная стоимость этого логотипа. Ведь организатор заплатит фиксированную (и не такую уж большую, хотя и значительную для каждого из участников) цену, а получит 1000-чи вариантов логотипа из которых можно выбрать. Стоимость варианта при достаточно популярном конкурсе для организатора стремится к нулю (гораздо дешевле чем нанять дизайнера и заказать множество макетов).

        Но если где-то прибыло, значит где-то убыло? По той же причине, по которой конкурс интересен для организатора (дешевизна одного варианта), он не интересен для участника, потому что та самая низкая цена за вариант — это его «ожидаемый размер вознаграждения» (тоже очень низкий).

        Поэтому «нагнать толпу народу, которая устроит мозговой штурм, решая важные для бизнеса задачи» (умолчим, что еще и доплачивая за участие), пообещав призрачные перспективы трудоустройства — это и есть «морковка» для «наивных» участников.

        PS: На самом деле не будет необходимости кого-то нанимать вообще, если «мозговой штурм» будет удачным и «качественно» задача будет решена, а «допилить ее до состояния продукта» смогут и штатные программисты — ведь главная ценность — идея, реализация — просто вопрос вложений.
      • +3
        И Сбербанк готов платить зарплату 250+?
        • +2
          Да нет, что вы 70-80, это ж как раз начальный уровень будет…
    • +10
      Больше всего порадовал вот этот момент:
      Каждую неделю надо будет коммитить что-то конкретное. Один пропуск — и вы не проходите курс.


      Действительно, «курсами» тут как-то не пехнет, скорей неоплачиваемая стажировка с туманной перспективой попасть на работу.
      Имхо, от участия в челенджах на kaggle и самостоятельного прочтения современных статей смысла больше.
      • НЛО прилетело и опубликовало эту надпись здесь
  • +6
    А я думал пик заманивания людей красивым словом уже прошёл.
    • –5
      Красивое слово — это секс или DMP?
  • НЛО прилетело и опубликовало эту надпись здесь
    • +1
      P.S. В статье про Big Data не упоминается R – один из самых распространенных инструментов аналитика.

      О вкусах не спорят;-) Кому-то Matlab роднее, или Python + библиотеки…
    • –2
      Только не профи, а достаточно подготовленного для начала работы. И у вас должен быть бэкграунд. Это как хакатон в новой среде разработки.
  • +31
    Подождите, а почему Вы не указали, что курс платный и стоит 180 000 рублей?
    • +11
      Эмм… это за деньги клиентов они еще и выставляют требования аля «хоть раз не сдал задание в срок и ты не сдал курс»? О_о
  • НЛО прилетело и опубликовало эту надпись здесь
    • –8
      Так они заберут лучших. И они и учат сами для себя, а здесь опыт 6 разных компаний и их реальные БД.
    • +1
      Каких-то 180 тысяч за 3 месяца.
  • НЛО прилетело и опубликовало эту надпись здесь
    • +1
      Александр Петров, директор по R&D Data-Centric Alliance;
      Андрей Неволин, Ведущий инженер по разработке ПО, EMC Skolkovo;
      Екатерина Фроловичева, начальник отдела технологических исследований Сбербанк России;
      Киншук Миншра, технический директор Spotify;
      Андрей Свирщевский, Руководитель направлений Аналитики и Гарантирования Доходов компании SAS Россия/СНГ;
      Алексей Филановский, старший консультант Oracle;
      Денис Афанасьев, генеральный директор CleverData.
      • +5
        получается, что представители компаний (ну например сбер, как вы написали выше), которые готовы взять выпускников к себе на работу, обучают людей за их же деньги

        т.е. все это эквивалентно испытательному сроку, но только не вам платят деньги, а вы им — парадокс
        • НЛО прилетело и опубликовало эту надпись здесь
          • +9
            Я угадал слово, куда отправлять СМС?
      • 0
        Простите, но в первую очередь, это руководители, представители вендоров и интеграторов… Если вспомнить день открытых дверей, то руководители скорее всего они могут озвучить свои боли и желания (не всегда удачно, если вспомнить то что говорил представитель МТС, иногда яснее — Екатерина она достаточно ясно сказала, что ей надо). Представители вендоров (EMC, SAS, Oracle) могут предложить, какие-то продукты серии «серебрянная пуля» (опять же не всегда убедительно и по делу, Oracle — день открытых дверей).
        Остались интеграторы… Вопрос, зачем представители двух первых групп, когда курс инженерный?
  • +11
    интересно на кого это рассчитано, кто ЦА; я легко могу представить как компания отправляет своего сотрудника на повышение квалификации, и это вообще норм было бы, но мне реально трудно представить сферического программиста который за свои бабки пойдет на такой курс

    ну реально давайте рассмотрим программиста который владеет требованиями к курсу:
    — умеет программировать на ява, спп, питоне или аналоге
    — знает sql и бд
    — владеет тервером и матстатом

    неужели такому кадру трудно за недельку пару недель хадуп освоить, литературы море, лень читать есть халявные курсы
    Intro to Hadoop and MapReduce
    Real-Time Analytics with Apache Storm
    хочешь корочку, ну ок занеси им 200-400 бачей и будет корочка

    хочешь на русском, то вот первая лекция технопарка, а дальше по ссылкам

    хочешь практики — качни датасет и попрактикуйся

    ну про лекции по машинному обучению я вообще молчу, их море (а в этом курсе их почти нет)

    и тут наверное мне ответят главный аргумент — но ведь у нас реальные случаи из практики и реальные датасеты, в отличие от тех кто выучится быстрее и дешевле, у нас будет реальный опыт

    тут все просто — никто вам все равно не даст реальные задачи так сходу
    • НЛО прилетело и опубликовало эту надпись здесь
    • +6
      Реальные данные для практики бывают на каглях. Вон недавно Microsoft туда выложили огромную базу вирусов(что-то в районе 30Гб), для конкурса на построение классификатора, да и тотже Вконтакте парсить можно хоть до посинения — данные открыты все. Т.ч. попрактиковаться всегда есть на чем.
    • +1
      За ссылочки вам спасибо — как-то мимо меня прошли)
    • 0
      deleted. У меня проблемы с распознаванием текста, как оказывается. :\
  • +4
    Опубликуйте потом списки слушателей. Хочу посмотреть на этих… кхм… странных людей. Если, конечно, найдется хоть один желающий.
    • +1
      Смотрите.
      • +2
        Куда смотреть?
        • +3
          На меня — я слушатель. Кхм… странный человек, говоря вашими словами.
          • +3
            ого, круто, а можно вопрос, вы сами за себя платите или работодатель?
            • +3
              Я ничего не плачу :) Мне повезло занять одно из пяти бесплатных мест, о которых шла речь в одной из статей.
              • +2
                а ну тогда вы молодец =) такие курсы должны быть либо за счет работодателя, либо бесплатно
          • НЛО прилетело и опубликовало эту надпись здесь
            • 0
              Я ушел из CSC.
  • +8
    Парадоксально, что тема может уйти в минуса и тогда в нее перестанут заходить и постить комментарии, а было бы полезно «поддерживать» ее на плаву (на уровне +1), чтобы как можно больше посетителей geektimes почитало и сам текст и комментарии к нему (не у каждого еще были «аналогичные ээээ «кейсы» с курсами на которых предлагаю доплатить»)… Такой парадоксальный интернет — статья, полезная своим негативным опытом, из-за своего негативного опыта уходит в минуса и ее негативный опыт мало кто может использовать, поскольку она выпадает из выдачи…
  • –2
    ---Активных держателей карт Сбербанка — 50 млн.

    И это big дата?, пардон мы френч.

    Даже с учетом всех транзакций клиентов это копейки.
  • +4
    У меня не получилось представить ваших учеников…
    Это люди которые могут посвятить довольно много времени учёбе, т.е. либо бездельники либо безработные, претендующие на начальные 70-80 т.р., при этом под требования к данной категории работников удовлетворит любой троечник технического ВУЗа и потенциальных работников получается намного больше чем требуется сейчас в Big Data.
    Конкурентоспособные же претенденты вряд ли смогут выделить необходимое для обучения время, т.к. без дела они как правило не сидят.

    Вот и вспоминается анекдот о платной лекции «Как заработать миллион», для которой необходим зал на 1000 слушателей…
    • –2
      Зачем вам представлять учеников?)
      • +3
        Ох уж этот пытливый ум инженера, вечно пытается разобраться в различных «штуковинах», к сожалению иногда и «дурнопахнущих»…
        • +1
          Ох ёж… а минусовать-то чего? Вполне логичный же вопрос.
  • +4
    Я до сих пор не понимаю, за что платить такие деньги, когда полно данных по этой теме доступных бесплатно как для теории, так и для практики? И как можно сделать нормальную систему за месяц с разработкой модели и ее реализацией ( если только работать 24x7, да и то сомнительно имхо) а в добавок навярняка и «домашки» делать…
  • +2
    При декларируемом упоре на практику на «дне открытых дверей» удалось выяснить, что 2 из трех занятий предполагается с одним преподавателем на группу в виде лекций.

    При такой стоимости часа занятий хотелось бы сильно больше практики.

    Да, лекции послушать можно на coursera/edx и т.п., но за ценник в 2000 р/час, хочется чего-то сильно большего чем 2 занятия лекций и 1 практики. За такую цену, имхо, было бы уместно проводить «разбор домашних заданий» или «семинарские» занятия в нагрузку к каким-то MOOC курсам.
    В идеале, с оплатой по необходимости за посещение. Например я изучаю Machine Learning и не до конца разобрался с какой-то темой, и хочу пообщаться с преподавателями и студентами которые тоже это изучают.
  • +11
    Мы в организации рассматривали идею отправить несколько сотрудников на эти «курсы». Я сходил на день открытых дверей, и сразу застопорил процесс оплаты. Вот мои впечатления:
    Необходимый навык «Программирование Java/С++/Python или аналоги» превратился в программирование исключительно на Python (прекрасно об этом узнать за неделю до начала занятий). Кстати на сайте всё по-прежнему, кто не приехал на день открытых дверей (который вовсе не был заявлен, как обязательный) сильно удивятся.
    Компьютерного класса нет, приезжайте со своими ноутбуками.
    Про кейсы, на которых будет построено обучение рассказали, но более внятной программы (хотя бы с примерным указанием сколько отводится на ту или иную тему) представить не смогли, и даже примерно рассказать не смогли, не смотря на настойчивые просьбы нескольких людей (просто стали тупо игнорировать). Да что там программа, даже состав преподавателей озвучить не смогли, только одного представили, который будет вести первый кейс.
    Работа предполагается в командах по три-четыре человека. Собирать команды они будут сами, никакого предварительного отсева сейчас нет (как раз из тех, кто посетил сегодняшнюю встречу думаю большинство отсеются, а для остальных сюрприз будет), при этом оцениваться будет команда целиком! Но это полбеды, оказывается каждые две недели будут некие milestones (язык не поворачивается перевести это на русский как вехи), и если команда не сделала в срок хотя бы одно запланированное задание, то сертификата не видать никому из участников команды, вне зависимости от дальнейших успехов!

    Т.е. у меня осталось впечатление, что это именно хантинг лучших, но за их же деньги…
    • –4
      Спасибо за впечатления! Участники бывают разные, у всех своими ожидания, поэтому это вполне нормальная ситуация — для этого мы и делаем дни открытых дверей.

      Два вопроса кажутся важными:
      Хантинг — это не цель программы, а неплохой побочный результат. Но он означает, что, во-первых, идти в Big Data стоит, причем именно сейчас. Компании активно ищут специалистов и это хороший шанс построить карьеру и заниматься интересными, исследовательским задачами — причем на хороших условиях. Во-вторых, важно, что знание передается из индустрии — современные инструменты, реальные кейсы, настоящие данные. Поэтому мы и называемся «лабораторией».
      Что касается компьютерных классов, то на у нас их нет специально. Думаю, побывав на Дне открытых дверей вы увидели, что на техническое оснащение аудитории в Digital October очень хорошее — электронные доски, многокамерная трансляция, титры, вот сейчас делаем пилот, чтобы можно было подключиться на занятие через Oculus Rift. :)
      Наша программа — это не курсы, на которых можно 7 часов в день поспать под убаюкивающий голос преподавателя, а потом получить сертификат! Я уверен, что многие побывали на таких курсах и понимают, что можно потратить время значительно более эффективно. В ответ от участников требуется активная работа на протяжении 3 месяцев — как в аудитории, так и дома. Мы даем возможность попробовать все делать своими руками, поработать над решением реальных задач на больших данных. Уверен, это подходит не для всех, но есть люди, которым такой подход нравится, а работадатели заинтересованы в тех, кто такую программу прошел, это по-моему тоже понятно.
      • НЛО прилетело и опубликовало эту надпись здесь
        • –4
          Хорошие условия — это высокая зарплата и работа в компании с серьезными задачами. В области Big Data сейчас такой момент, когда можно получить такую работу, коллеги из Superjob это подтвердили.
          На мой взгляд цель программы — стать специалистом по Big Data. Есть и другие способы достичь этой цели, многие из них озвучены в этом треде. Есть и преимущества у учебной программы. Тут мне кажется каждый должен решить идти на нее или нет.
          • +6
            И как ваши слова соотносятся с требованием
            Один пропуск — и вы не проходите курс.
            ?
            Это может быть хоть как-то оправдано в том случае, если это стажировка с жестоким отсевом кандидатов. Но в ситуации, когда человек платит свои деньги и совмещает «курсы» с работой, такое требование выгляит по меньшей мере глупо. Учитывая, что всё это дело человек должен совмещать с работой и другими активностями, то подобные требования попахивают школьной проверкой посещаемости… Почему вы не делаете как во всех системах под. образования выдачу сертификатов по итогам сдачи финальной квалификационной работы, а не текущей успеваемости?

            На мой взгляд цель программы — стать специалистом по Big Data.

            Я почитал программу вашего курса, в течении всех 3-х месяцев вы рассматриваете тривиальные алгоритмы. При этом даже тут вы похоже не собираетесь углубляться в описание теоретических основ тех методов, с которыми вы собираетесь учить работать. Т.е. главным навыкам специалиста по Big Data, а и именно осознанному анлизу данных вы не обучаете. И как тогда это можно назвать образовательной программой?
            • –4
              На самом деле, правила получения сертификата стоит описать чуть более подробно:
              — за каждый месяц программы нужно получить PASS
              — чтобы его получить надо набрать выше 70% баллов за месяц
              — баллы можно получить за тесты (на каждом занятии), выполнение кейса и коллоквиум (каждые 2 недели)
              — кейс разбивается по 1 шагу в неделю

              Как вы видите, существует много возможностей догнать свою группу — по умолчанию это нужно сделать к коллоквиуму.

              Все эти условия нужны для получения сертификата, если в какой-то момент человек сошел с дистанции, то он конечно же может ходить и участвовать абсолютно во всех мероприятиях. Никакой проверки посещения нет, более того в курсе можно полноценно участвовать как онлайн, так и приходить в класс — всегда есть возможность вывести видео (с титром), задать вопрос голосом или в чате (выводится на панель в классе). Для онлайн-участников есть специальный человек — онлайн-модератор, который отвечает за взаимодействие с онлайн-участниками.

              Мы понимаем, что это довольно строго, но мы в центр ставим качество. нам бы хотелось, чтобы выпускник программы не просто присутствовал на занятиях, а действительно выполнил весь объем работы, предусмотренный программой.

              Насколько рассматриваемые алгоритмы тривиальны — тут наверное я с вами не соглашусь. Анализ данных — это основное содержание программы. Вопрос состоит в следующем — мы не ставили перед собой задачу разработки собственных алгоритмов. В 3-месячной программе это невозможно. Но научится грамотно использовать существующие алгоритмы и инструменты, настраивать их под имеющийся набор данных — это задача отнюдь не тривиальная. И именно такие люди сейчас нужны в индустрии. Никто не мешает развиваться дальше и глубже в область машинного обучения. Мы учим применять эти методы на практике и на реальных задачах.
              • +3
                На самом деле, правила получения сертификата стоит описать чуть более подробно:

                ну да правила, перед тем как брать 180 рублей, стоит озвучивать полностью, как бы

                Мы понимаем, что это довольно строго, но мы в центр ставим качество.

                а кстати как вы считаете в том что ученик не осилил что то виноват он или учитель? как на счет предварительного экзамена что бы помочь людям понять что не стоит пытаться, а то только потеряете деньги? или ну его такой тест, профит жеж?
                • –3
                  Не хотели никого обидеть, мы запускали программу в первый раз и много вещей можно было сделать лучше! Особенно в плане коммуникации с будущими студентами. Но группа тем не менее успешно набралась и мы не смогли взять всех желающих.
                  На следующей программе такой тест уже разработан.
                  • +4
                    А почему вы сначала не обкатали программу например на базе какого-то ВУЗ'а? По моему, при цене курсов как у вас, слушатель вправе ожидать качественно организованное обучение, а не обкатку программы за свой счет.
              • +6
                Т.е. 3 месяца и 180 т.р. — это плата за то, чтобы научили в стиле code monkey использовать пару готовых инструментов и алгоритмов? Или как можно без понимания того, как устроено, например, сингулярное разложение, использовать его для выделения фич из данных? Или, например, почему для курса был выбран именно алгоритм SVD, а не какойниубдь алгоритм максимума энтропии?
              • 0
                Вопрос, а почему, если уж человек перестал быть студентом не происходит перерасчет стоимости его обучения? Как я понимаю, понятие «слушатель» и «студент» несколько различны и стоят во всех учебных заведениях несколько разные деньги?

                И не вопрос, но лирическое отступление: как не парадоксально, но все замечания, которые адресованы в Ваш адрес говорят только о том, что спрос на то что Вы делаете есть. И, если я правильно понимаю (с Ваших слов), люди готовы даже платить Вам те деньги, которые Вы просите за достаточно туманное, но востребованное предложение. Почему бы тогда не повернуться к ним лицом и не сделать что-то типа такого, smira-webinar.highload.ru/ (не в качестве рекламы, но, как факт того как можно работать)?

                Да, и удачи!

                ПС: Почему бы не ввести понятие «слушатель» и не предоставить доступ к Вашим ресурсам за меньшие деньги (думаю, что желающие будут)?
                • НЛО прилетело и опубликовало эту надпись здесь
                  • –4
                    Вывод сделан из кол-ва комментариев… Если никому это не интересно, что тут обсуждать?
                    • +3
                      Хм… ну лично я в целом заинтересован в индустрии обработки данных(хобби у меня такое), но не в восторге от того, что кто-то на этом деле не слишком честно(по моему мнению) наживается.
                      • –3
                        Простите, но я не совсем понимаю, что значит "… не слишком честно (по моему мнению) наживается..."

                        Вопрос о «нечестном отъеме денег у населения» решается в суде, т.е. если Вы считаете, что данное предприятие суть мошенники, стоит обратиться в соответствующую инстанцию. Пытаться совестить их в комментариях бессмысленно.

                        К сожалению, тематика, которой касается данное предприятие, мне тоже интересна и меня так же отпугивает неясность их целей, неопределенность программы и, соответственно, неясное соотношение цены предлагаемой «услуги» и ее качество. Поэтому, остается только следить за новостями )
                        • +3
                          «Нечестного отъема денег у населения» тут нет, возможно я неправильно сформулировал. Я имел в виду то, что судя по посту, сайту проекта, коментариям автора, качество этого «курса» не соответствует заявленному. По ходу дела оказалось, что будут не готовить специалиста по Big Data, а научат «решать три конкретные задачи», что программа читается первый раз и в ней полно косяков, но при этом она выставляется как уже готовый курс за немалые деньги, что не выполнение каких-то текущих заданий влечет за собой моментальное лишения права получить сертификат без снижения стоимости обучения и еще немало подобных моментов. Ну и разумеется умалчивание большинства аспектов, которые были озвучены только после конкретных вопросов. По моему все это не слишком порядочно.
                          • 0
                            Да, к сожалению, заявленная цель, всеохватность названия, как курса так и в целом лаборатории, и представленная (будем считать, что представленная) программа находятся в неком диссонансе. Ну, это на совести организаторов.

                            Если же отнестись к этому, как к весьма дорогому workshop или циклу из трех, то станет немного легче ) Но "… осадок остается..."

                            Впрочем, если честно, то сам термин Big Data на столько неопределен, что под его соусом можно предлагать почти все. К сожалению.
                • –3
                  Спасибо большое! По-моему это первый позитивный комментарий в этом треде! :)
      • +4
        Во-первых, такие дни открытых дверей в таком случае надо делать обязательными для посещения. Я уверен, что для многих оплативших многое из вышеперечисленного явится неприятным сюрпризом. Кстати интересно посмотреть, как у вас в договоре прописан факт неполучения сертификата…
        Во-вторых, меня категорически не устраивает ситуация, что мне навязывается некая команда напарников, и при этом вообще отсутствует какой-либо отсев по зачислению на курс. А с учётом перспективы из-за одного не выполненного в срок milestone остаться просто слушателем, это всё начинает очень дурно пахнуть. И не надо рассказывать, что на работе мы столкнёмся с тем же, как вы пытались отмазаться на дне открытых дверей. На работе будет уволено слабое звено, а не весь коллектив (ну может в Сбере и т.п. ваших партнерах не так, но это их проблема).
        В-третьих: зачем мне ваш челлендж, если у меня уже есть хорошо оплачиваемая работа, в хорошей организации и хорошем коллективе? Мне нужны знания и опыт, а не трудоустройство в Сбер, куда меня и так звали несколько лет назад.
        Что касается оснащения, то я увидел экран, который был заслонён лекторами, так что надписи с презентаций (например, насколько я помню, у МТС-а они большей частью были внизу) удалось увидеть лишь частично. Неудобные стулья, с откидным столиком, на котором не очень-то удобно держать ноутбук. Ну и т.д. А компьютерный класс необходим как минимум по двум причинам:
        1) Вы нигде не предупреждали, что собственно нужен ноутбук. Вот у моего подчиненного, которого я так же планировал отправить на эти курсы, нету ноута. У него есть планшет, а в ноуте нет необходимости. Ну не бегаем мы в полевых условиях.
        2) Техника может неожиданно выходить из строя. А учитывая ваши критические milestones, должна быть возможность как-то пережить нештатную ситуацию.
        Изначально меня это ваше мероприятие заинтересовало именно упором на практику, но когда я увидел, что эта практика из себя представляет (что у вас за неделю до начала занятий нет ни чёткого плана, ни даже полного списка преподавателей, что условия меняются на лету и особо не афишируются и всё в таком духе), было принято решение, что связываться с вами не стоит.
        • –1
          Я написал выше про подробные правила получения сертификатов. День открытых дверей пригласили всех желающих, и как мне кажется все желающие туда смогли попасть.
          Про технику вашу позицию понял, и мне кажется она обоснованной. Наша логика такова — перенос обучения в компьютерный класс несет больше минусов, чем дает плюсов. Но, может быть вам это кажется некомфортным. Может быть есть какие-то промежуточные решения, уверен из любой ситуации можно найти выход (мы, к слову, обсуждали возможность аренды ноутбуков).

          Мне кажется ничего страшного здесь нет, потому что выбор ведь за вами, идти ли на обучение к нам или найти другое предложение, которое будет больше соответствовать вашим ожиданиям.
          • +6
            А теперь смотрим на ваш сайт: stage.newprolab.com/bigdata/
            и видим, что там по-прежнему «Программирование Java/С++/Python или аналоги», а не «Знание Python»; никаких подробностей про особенности получения сертификата и про независимое от обучаемых формирование групп; отсутствие информации про необходимость наличия ноутбука; отсутствие какого-либо предварительного квалификационного теста перед зачислением на курс; ну и так далее. Оно и понятно, иначе в следующий раз набрать группу не факт что получится…
          • +5
            И, как мне тут верно подсказывают, есть ещё такая штука, как закон о защите прав потребителей. Цитирую:
            Статья 10. Информация о товарах (работах, услугах)
            1. Изготовитель (исполнитель, продавец) обязан своевременно предоставлять потребителю необходимую и достоверную информацию о товарах (работах, услугах), обеспечивающую возможность их правильного выбора.


            Что-то не припоминаю, чтобы меня о чём-то таком проинформировали, перед выставлением счёта. И про день открытых дверей вы не слишком громко трубили (я бы, вероятно, на него и не попал, если бы до этого не позвонил в центр уточнить некоторые другие вопросы), не говоря уж о том, что он был за четыре рабочих дня до начала занятий и у многих уже могла быть произведена оплата, меня спасло лишь то, что я о самих курсах поздно узнал.
            • –1
              Спасибо за замечания, постараемся внести исправления на страницу.
  • +4
    За 180 тыс. вы предлагаете поработать без гарантий трудоустройства? Гениально!
    В лучших традициях «Каши из топора», а так же волка, который ловил рыбу на свой хвост.
    • –2
      Николай, а что вы подразумеваете под «гарантией трудоустройства». Распределение?
      • +2
        Хотя, бы. Для тех кто успешно прошёл курс, сдал необходимые экзамены и показал владение предметом.
      • +3
        Я хотел бы отметить, что на мой взгляд, вкладывая 180 тысяч рублей, я должен получать гарантии востребованности приобретённых знаний. Потому что это далеко не те деньги, которые можно достать из заднего кармана джинс и отдать непонятно за что.
        • –1
          Николай, в таком случае мы можем это гарантировать. Например, один крупный оператор связи хотел пригласить всех, кто выполнил необходимые условия на оплачиваемую стажировку. Просто мы верим в другое, что история про трудоустройство немного более сложная, все-таки речь идет о дорогих специалистах — тут нужно, чтобы срослось, причем с обеих сторон. Мы со своей стороны хотели бы обеспечить правильные ингредиенты для этого процесса: людей, которые прошли сложную техническую программу, и, с другой, компании, которые активно ищут специалистов этого профиля. Пока что количество таких компаний только увеличивается!
          • +5
            совершенно очевидно что это работодатель должен платить за кандидата, а не кандидат за работодателя, это уже как-то на изощренную взятку похоже
            • –2
              Коллеги, смотрите, мы сделали так — вот, что у нас получилось. Если у вас получится сделать по-другому, то нам будет очень интересно об этом узнать!

              К слову, я думаю, что если вы имеете практический опыт работы с инструментами Big Data, разбираетесь в машинном обучении и вообще разбираетесь в small data (как верно заметил Павел), то как минимум платная стажировка вам гарантирована, а скорее всего и на работу вас обязательно возьмут. Мы со своей стороны постарались подтянуть всех заинтересованных игроков рынка, чтобы выпускники нашей программы могли воспользоваться всеми имеющимися на данный момент возможностями. Но, повторяю, мне кажется эти возможности есть у любого человека, который подходит по профилю под то, что ищут компании.
              • +3
                так а почему все заинтересованные игроки рынка не скинулись на то что бы организовать центр обучения? почему вы им такое не предложили? народ то не возмущается программой, программа отличная для того что бы войти в эту область, преподы отличные, только бизнес-модель какая то не такая, какой то русский наебизнес очередной

                все риски сложили на самую незащищенную часть, печально если кто то поведется, возьмет кредит и побежит учиться у вас

                еще раз повторю тезис свой: тот кто заработал столько денег что готов 180 рублей выложить без удара по своему бюджету, тот не пойдет к вам, он достаточно уже умный что бы сам изучить все это
                • –3
                  То, что есть возможность обойтись и без курсов и изучить все самостоятельно, я с этим согласен. То, что люди к нам не пойдут, это опровергается практикой, поскольку мы не смогли вместить всех желающих на данную программу.

                  По поводу игроков рынка и бизнес-модели — мы сделали то, что могли со своей стороны. Мы расчитываем на собственные силы. Это дает нам возможность оставаться независимыми, что в конечно итоге является плюсом для программы, потому что мы тщательно взвешиваем все, что предлагают представители рынка. Думаю никому не было бы интересно прослушать 3 месяца маркетинга.
                  Говорить за других считаю не совсем корректным. У нас получилось так. Более того, кроме платных мест, мы дали семь 100% стипендий по конкурсу, планируем продолжать эту практику и на следующих курсах.
              • НЛО прилетело и опубликовало эту надпись здесь
  • НЛО прилетело и опубликовало эту надпись здесь
    • –2
      Простите, я не знаю, кто такой ольгиней — надо погуглить! :)
      Программа рассчитана на сложившихся разработчиков. У нас есть входные требования: оконченное техническое образование, опыт работы в разработке не менее 2 лет. То есть — мы берем людей уже поработавших, не студентов, и переподготавливаем их в области Big Data. В этом состоит основная идея. Надо сказать, что она активно развивается во всем мире, можете посмотреть различные интесивные буткэмпы.
      Что касается ШАДа, то мы из очень уважаем и дружим с ними, преподаватели оттуда будут и у нас. Но у нас все-таки немного другой фокус — мы не готовим людей, которые могут самостоятельно разработать алгоритм распознавания изображений. Мы учим людей использовать существующие инструменты для решения трех предельно конкретных задач: построение DMP, анализ соцграфа и создание рекомендательной системы.
  • +4
    Хороший специалист по Big Data должен еще очень хорошо работать с Small Data
    • +1
      Вообще появилась профессия Data Engineer, которая в себя включает две выше-описанные
  • НЛО прилетело и опубликовало эту надпись здесь
    • 0
      Видимр почитали, отзывы в данном топике о курсе и тоже все поняли…
  • 0
    Если я правильно понял одну из заявленных целей на дне открытых дверей, то это создание некоего сообщества, клуба по интересам, для почитателей Big/Small Data. Планируете ли Вы какие-то активности для достижения данной цели: встречи открытые или закрытые, открытые или закрытые семинары, workshops и проч.?
    • 0
      Да, у нас в рамках этого курса будут открытые занятия, также как и просто открытые мероприятия. Мы провели несколько мероприятий в прошлом году — с Oracle и Mirantis. Следите за обновлениями на сайте Digital October.
  • 0
    а у вас тут вот написано newprolab.com/educer/
    при поддержке coursera


    а расскажите плз что за поддержку они вам оказывают?

    • НЛО прилетело и опубликовало эту надпись здесь
    • –2
      mephistopheies, напишите нам на npl@digitaloctober.com, я расскажу вам конкретно про программу «Продюсер онлайн-курсов», дам контакты выпускников. В этом треде про Лабораторию новых профессий рассказывает brainick, который кажется знает о нас больше меня!

Только зарегистрированные пользователи могут оставлять комментарии. Войдите, пожалуйста.

Самое читаемое Разработка