Начинающие data scientists к вашим услугам

    На Coursera сейчас идёт курс Introduction to Data Science от University of Washington, в ходе которого студентов будут учить работе с большими массивами данных, статистическому анализу, data mining, алгоритмам машинного обучения и прочим таким вещам. Авторы курса приглашают организации (коммерческие, некоммерческие и даже просто отдельных людей), которым будет полезна помощь в работе с данными, принять участие, подкинув студентам для решения задачи из реальной жизни.

    Схема примерно такая: организация формулирует задачу и предоставляет данные (собственные или из открытых источников), студенты её решают и пишут отчёт. Отчёт потом оценивается другими студентами, плюс организация даёт свой отзыв о работе.
    В плюсе все: организация бесплатно получает рабочие руки мозги, а студент — опыт.

    Уже опубликовано около десятка задач: от лингвистического анализа соцсетей до визуализации статистики пожаров. Но желающих их решать намного больше, так что вашему участию будут очень рады.
    На курс записалось порядка 100 русскоязычных студентов (и это только те, кто отметился в группе на форуме), а вообще там более 74 000 человек со всего мира.

    Что смогут делать студенты:
    • Решать задачи прогнозирования (по набору данных разрабатывать метод предсказания, как величины будут изменяться в будущем).
    • Визуализировать данные и отношения между ними (например, вот так).
    • Находить ответы на вопросы относительно данных (напр. «Как повлияли изменения рекламных кампаний в прошлом месяце на размер пожертвований»).


    Курс ограничен по длительности (заканчивается 26 июня), поэтому есть некоторые ограничения на задачи:
    • Проект должен быть относительно коротким.
    • Задача должна быть изолированной и хорошо сформулированной (не требовать глубоких знаний в специфической предметной области).
    • Задача не должна содержать ограничений на используемые для решения технологии.


    Как принять участие
    1. Записаться на курс
    2. Прочесть подробности (см. ссылку ниже или страницу «Optional Real-World Project» на сайте курса)
    3. Опубликовать задачу на форуме курса в разделе Organizations Seeking Assistance


    Оригинал приглашения и подробности: coursolve.org/courses/datascience

    Зачем всё это вашему покорному слуге? Я сам занимаюсь на этом курсе и тоже хочу «почесать зубы» об реальные задачи, а чем больше их будет, тем интереснее. ;)
    Поделиться публикацией
    Похожие публикации
    Реклама помогает поддерживать и развивать наши сервисы

    Подробнее
    Реклама
    Комментарии 12
    • 0
      Похоже интересный курс. Жаль, что начался 3 недели назад.
      • 0
        29 мая стартует другой интересный курс — Computational Methods for Data Analysis.
        А чуть позже, в сентябре — Computing for Data Analysis, расчеты будут проводиться при помощи R — весомая плюшка для всех, кто интересуется данной средой.
        • 0
          А вы проходили второй курс?
          • 0
            Неа — он же в сентябре будет :) Из похожего был на Statistics One — хорошая подача материала, интересный лектор, прикольные (и достаточно сложные) задания. Machine Learning тоже очень заинтересовал, но окончить не смог — и времени не хватило, и материал сложноват. Аналогичная история произошла и с Mathematical Biostatistics Boot Camp — только в этом случае решающую роль сыграла тяжесть курса :(
            Сейчас заканчиваю Statistics: Making Sense of Data — исключительно положительные эмоции, как от самого курса, так и от пиров. Кстати, быть может кому-то пригодится — от Стенфорда в июне стартует курс Statistics in Medicine.
            Выговорился :) Простите за многословность.
      • +1
        На самом деле, курс так себе — я разочарован, очень похоже, что у препода опыта преподавания мало. Но, с другой стороны, идея привлечь компании со стороны выглядит интересной.
        • 0
          Поддерживаю. Ожидал гораздо большего. Профессор очень фиговый оратор.
          Эти постоянные его «okay», «alright» и невнятная дикция очень расстраивают.
          • 0
            Okay. Alright. А как насчет задач из курса? Практическая часть полезная/интересная?
            • 0
              Из задания с sql последняя задачка, в принципе, ничего была.
          • 0
            Согласен. Все задачи (кроме одной) решил, даже не смотря лекции. Трудности вызвало только умножение матриц (SQL и через Map/Reduce). Но мне нравятся сами задачи, я бы никогда и не подумал о некоторых способах анализа, плюс теория очень хорошо ложится на практический опыт.
          • 0
            А на каком языке нужно задачи формулировать? И есть ли ограничение по объему данных для визуализации, например?
            • 0
              Если хотите чтобы поучаствовало побольше народу, лучше на английском. Если нет, можно попробовать на русском. Но отчёт и отзыв всё равно на английском писать.
              Про ограничение по объёму не слышал. Т.к. речь в курсе идёт, частности, о big data, визуализация большого объёма данных будет хорошей задачей.
              • 0
                У меня есть подходящая задача как раз. 1-1,5 Гб числовых данных. Если будет свободное время, то сформулирую задачу.

            Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.