27 декабря 2016 в 15:10

«Программист — Аналитическое мышление = 1С программист» и другие результаты GoToHack

image

С 9 по 11 декабря состоялся наш второй хакатон GoToHack для ребят до 20 лет, посвященный применению технологий машинного обучения в сфере образования и HR.

По итогам каждая команда презентовала результаты перед экспертами, лучшие были награждены различными призами: от поступления в университет до гранта размером 100 000 рублей на поездку на международную конференцию.

О проектах и забавных моментах можно прочесть под катом.

К участию мы пригласили 90 отчаянно жаждущих «машинку» школьников и студентов, которые смогли пройти отборочный онлайн-этапа хакатона в виде задания на Kaggle по предсказанию результата прохождения онлайн-курса на основе реальных данных партнёра – платформы Stepik.org. Подробно мы писали об этом здесь.

Как и в первый раз, хакатон начался с обучающего интенсива и мастер-классов:

  • Александр Панин из Яндекса провел серию вводных мастер-классов для начинающих,
  • Камиль Салахиев из Университета Иннополис провел мастер-класс по MapReduce,
  • Муаммар Иль-Шедиват из Яндекса рассказал ребятам о работе с речью.

Потом начались презентации кейсов от гостей хакатона: Александр Кукушкин рассказал об исследовании московских школ, Александр Петров из E-Contenta и Александр Семенов из МТС поведали об исследованиях данных социальных сетей.

image

После ребята объединились в команды и познакомились с кураторами, которыми стали молодые разработчики и выпускники ШАД Яндекса. Команды могли использовать любые открытые данные для реализации своих идей, организаторы же предоставили датасеты от Stepik, QIWI, HH, VK, Skyeng, МТС и GitHub.

Благодаря щедрому партнеру Servers.ru, у каждой команды была возможность отхватить себе по GPU и радоваться жизни.

Второй день начался с мастер-классов по Deep Learning от Александра Панина, работе с текстами от Александра Петрова и с грязными данными от Кирилла Лунева из Яндекса. Также прошла презентация проекта про мониторинг внимания аудитории по видео от студентов ФКН НИУ ВШЭ под руководством YDF.

Презентации части лекций можно здесь, воркшопов – здесь.

Дальше все участники погрузились в непрерывные судороги рождения проектов, периодически страдая от отсутствия конкретной задачи и лидерборда, а также наслаждаясь забавными особенностями площадки и окружения.

Немного о процессе
Хакатон прошел в стенах Точки кипения АСИ, и все 3 дня нас радовали забавные схемы форсайтов и стенды, довольно сильно мотивирующие ребят.

image

Поставки глюкозы юным датасайнтистам происходили круглосуточно.

image

Также как и постоянные внутривенные инъекции знаний и лайфхаков от кураторов.

image

Стоит отдать должное кураторам, многие проявили небывалую стойкость и терпение.

image

Естественно, участники не обходились без здоровой доли агрессии и адреналина.

image


Как и обычно бывает на хакатонах, в конце все закончилось презентациями проектов от команд, доживших до сего торжественного момента.

Стоит отметить, что в этот раз итоговое решение принималось не только на основе выступления, как это и обычно бывает, еще была учтена оценка за техническую реализацию от кураторов. Это добавило антуража процессу, ребята судорожно делали демки, тетрадки и разгребали свой говнокод.

В итоге первое место разделили 2 команды, представившие следующие проекты:

– Сборная звездных школьников из Воткинска, Москвы и Архангельска c чат-ботом ZuckWorkBot для подбора онлайн-курсов на Coursera соответствующих требованиям выбранной вакансии компании Facebook. Ребята порадовали жюри веселой презентацией о том, что все хотят работать в FB, и рассказали как они могут нам всем помочь.

Бота можно потестировать, ищите @ZuckWorkBot в Telegram.

– Одинокий первокурсник с ФКН ВШЭ с проектом Q&A matching, основная идея которого заключается в подборе ответа на вопрос, заданный естественным языком. Вся система обучалась на датасете вопросов от ТheQuestion. Вопросы и ответы разбиваются на слова и векторизуются при помощи Word2Vec, попадают в рекуррентную нейронную сеть, после чего при помощи triplet loss отображаются в векторное пространство высокой размерности. Когда задается новый вопрос, к нему применяется то же преобразование, после чего ищется L2-ближайший ответ. Полученные результаты могут быть использованы для автоматизации поддержки программных продуктов, онлайн-курсов и тд.

Второе место заняли ребята с проектом Personnel по оценке заработной платы по описанию вакансии и навыков, требуемых от кандидата. Система Skill2Vec реализована с помощью преобразования навыков в вектора аналогично Word2Vec и обработки естественного языка рекуррентными нейронными сетями. Один из забавных примеров: «программист»-«аналитическое мышление» =«1С программист», демка здесь.

Третье место – команда, представившая систему StudentClass по отслеживанию прогресса ученика онлайн-платформы обучения английскому языку Skyeng во время голосового общения с учителем. С помощью нейронных сетей по аудиозаписи урока определяется, кто говорит в данный момент времени и на каком языке.

Также были вручены специальные призы в номинациях от QIWI. Компания не только предоставила свои данные и задачи на них, но и наградила 3 команды по итогам: AlexNet, Untitled1 и Amise.

Комментарии о задачах от QIWI:

«В прошлом году были исследования, показавшие, что студенты не находят работу после диплома. Мы посмотрели, что много студентов играет в игры. А где игры — там и QIWI. Посмотрели все данные по платежам, представили, как их можно проанализировать. Задача стояла исследовать данные и найти в платежной истории какой-то набор признаков, говорящих о том, что студент закончил университет и у него появился доход. Например, стал платить за ЖКХ или больше тратить. Задача участникам понравилась, ведь она очень похожа на реальный комплекс задач, которые решают исследовательские компании, сотрудничающие с крупнейшими европейскими банками. Они тоже ищут события по платежной истории — обнаруживают свадьбу, скорое рождение ребенка, покупку машины, — а банк предлагает клиенту соответствующие кредиты и другие продукты.
Вторая задача была про определение социодемографических характеристик пользователя. Команда, получившая первый приз, с высокой точностью научилась определять пол и возраст, и их решение может быть по-настоящему применено в бизнесе.

Конечно, ребята ожидали, что в банках много данных. А на самом деле платежная история банка выглядит довольно скучно: категория транзакции, ее сумма и время. Но из этого скучного списка можно выделить огромное количество признаков. И мы хотели, чтобы ребята попробовали эту работу сделать самостоятельно.

Также хотели бы отметить, что на хакатоне само соревнование часто отходило на второй план.
Хотя команды были соперниками, они много помогали друг другу, делились кусками кода, тестировали. На взрослых хакатонах такого не бывает вообще. У поколения Z — родившихся после 1995 года — вообще повышенные навыки командообразования, назначения ролей. И больше способностей добиться общего результата.»

image

Также свои номинации учредил МТС и Рыбаков Фонд с денежными грантами, Университет Иннополис c грантами на бесплатное обучение в бакалавриате, ФКН НИУ ВШЭ с приглашением на Школу по байесовским методам в глубинном обучении. А компания Профилум, например, пригласила победившие команды на ужин с инвестором Гором Нахапетяном.

По итогам организаторы выбрали 6 школьников, которые отправятся на финал олимпиады НТИ, минуя отборочные этапы. Кстати, на зимней школе GoTo будет отдельная мини-группа для подготовки к олимпиаде по направлению «Большие данные и Машинное обучение.»

Генеральным партнером хакатона стала Российская венчурная компания, техническим партнером – компания Servers.ru.

Комментарии Александра Петрова, одного из членов жюри:

«Я был приятно удивлен уровнем проектов на хакатоне – он соответствовал самому „взрослому“ уровню. Ребята использовали те методы и технологии, которые появились недавно и пока только начинают находить применение в реальном бизнесе, например, технологии обучения глубоких нейросетей. Уверен, что знания и опыт полученный в рамках хакатона пригодятся всем для будущих проектов. Мы со стороны E-contenta обязательно продолжим сотрудничество с GoTo, так как для нас это не просто благотворительность: уже двое ребят из GoTo прошли стажировку у нас, а их код работает в боевом режиме на крупных проектах.»

Фото с закрытия
image
image
image
image

Узнать подробности, а также подать заявки на участие в следующем хакатоне можно здесь.
Автор: @bibilov
Школа GoTo
рейтинг 57,91
Образовательный проект для школьников и студентов

Комментарии (7)

  • +6
    Заголовок желтый насквозь…
    • –1
      Но про жизнь.
      • +1
        Обидный заголовок
  • +1
    Не вводите пользователей в заблуждение. Люди заходят почитать свежие набросы на отечественную IT-компанию, а у вас тут какой-то хакатон, который не имеет к заголовку никакого отношения. То, что для всех сайтов поиска работы программист и «программист 1С» синонимы, и так очевидно без нейронных сетей.

    Кстати, опробовал вашу демку. Она на одни и те же слова выдает разные ответы (и программистов 1С там уже нет — одни директора, страховщики, столяры и преподаватели английского).

    image
    image
    • –1
      Тестер ПО из Вас — так себе.
      image
      • 0
        1) Вы утверждаете, что мои результаты отфотошоплены??? Для начала бы провели тест с данными из статьи, а только потом уходили бы в вариации на тему.
        2) Если лексему «аналитическое мышление» разложить на две: «что-то аналитическое» и «мышление», то без проблем можно выцепить и что-то по 1С, так как главные требования к аналитикам 1С — наличие логического мышления. Но этот ваш тест больше опровергает, чем подтверждает желтушные тезисы статьи, что 1С-м увлекаются программисты без аналитического мышления.

        3) Тестер ПО — это тот, кто вводит заранее ошибочные данные для проверки системы на дуракоустойчивость. Мне это не интересно, я просто повторил за «диктором» и получил совершенно другой результат — не настолько «сенсационный».
  • 0
    Все одно время хотел написать статью про модный фреймверк для создания мощных бухгалтерских систем с уникальным dsl на русском языке, но после прочтения заголовка — передумал :-(

Только зарегистрированные пользователи могут оставлять комментарии. Войдите, пожалуйста.

Самое читаемое Разработка