Обзор наиболее интересных материалов по анализу данных и машинному обучению №15 (22 — 28 сентября 2014)


    Представляю вашему вниманию очередной выпуск обзора наиболее интересных материалов, посвященных теме анализа данных и машинного обучения.

    Общее




    Соревнования по машинному обучению


    • EN Python Опыт от участия в «Display Advertising Challenge»
      Интересная статья про опыт, полученный от участия в соревновании по машинному обучению «Display Advertising Challenge» на Kaggle, которое закончилось совсем недавно.
    • EN R Использование R, H2O и Domino на Kaggle
      Интересная статья про использование языка программирования R совместно с Domino и H2O в соревновании по машинному обучению под названием «Africa Soil Property Prediction Challenge» на Kaggle.


    Онлайн-курсы и обучающие материалы


    • EN Онлайн-курс «Statistical Learning»
      В январе 2014 Стэнфордский университет провел онлайн-курс, основанный на новой книге «An Introduction to Statistical Learning with Applications in R» (ISLR). В данном посте будут представлены видеоматериалы и презентации с данного курса.
    • EN Онлайн-курс «The Caltech-JPL Summer School on Big Data Analytics»
      Достаточно необычный онлайн-курс стартовал в середине сентября на Coursera. По сути, это набор видеолекций и материалов с летней школы машинного обучения от California Institute of Technology.
    • EN Онлайн-курс «Learning From Data»
      На днях на edX стартовала новая сессия данного очень популярного курса по машинному обучению от California Institute of Technology и профессора Yaser Abu-Mostafa в качестве основного инструктора.


    Литература


    • EN Обзор книги «Frequent Pattern Mining»
      Обзор книги «Frequent Pattern Mining», вышедшей в 2014 году, от портала KDnuggets.
    • EN Книга «R for Cloud Computing»
      Анонс очень любопытной книги по облачным вычислениям с использованием языка программирования R, которая достаточно скоро появится в продаже.


    Теория и алгоритмы машинного обучения, примеры кода


    • EN Что такое Feature Engineering
      Отличная статья от автора блога MachineLearningMastery о процессе Feature Engineering в машинном обучении.
    • EN Динамическое обучение и Sub-Linear Debugging
      Очередная статья с блога Microsoft Technet Machine Learning. На этот раз в статье будет затронута тема динамического обучения (Online Learning) и Sub-Linear Debugging.
    • EN Теория Введение в метод опорных векторов
      Очень простое и краткое введение в метод опорных веторов (Support Vector Machines).
    • EN Для новичков Python Обработка данных с помощью Python
      Данная статья с блога Analytics Vidhya расскажет об обработке данных с помощью языка программирования Python и библиотеки Pandas.
    • EN R Сравнение и выбор обучающих моделей с помощью R Caret
      Очередная статья от автора блога MachineLearningMastery, посвященная возможностям библиотеки машинного обучения Caret для языка программирования R. В данном случае речь пойдет о сравнении обучающих моделей и выборе наиболее эффективной.
    • EN R Как опубликовать графики ggplot2
      Полезная статья, рассказывающая о том, как опубликовать графики, сделанные с помощью библиотеки ggplot2 для языка программирования R, в виде веб-страницы.
    • EN R Работа с Twitter через REST API и R
      Неплохая статья, описывающая возможность работы с данными Twitter через REST API с помощью библиотеки RTwitterAPI для языка программирования R.
    • EN R Выбор параметров с помощью R Caret
      Автор блога MachineLearningMastery рассказывает о функциональности по выбору признаков (Feature Selection) в популярной библиотеке по машинному обучению Caret для языка программирования R.
    • EN R Факторы не являются объектами первого класса в R
      Достаточно большая статья, описывающая тонкости и возможные проблемы в работе с факторами в языке программирования R.
    • EN R Управление зависимостями в R
      Интересная статья про управления зависимостями между библиотеками в языке программирования R, а также о визуализации этих данных о зависимостях между библиотеками.


    Видеоматериалы




    Data engineering




    Обзоры



    Предыдущий выпуск: Обзор наиболее интересных материалов по анализу данных и машинному обучению №14 (15 — 21 сентября 2014)
    • +23
    • 11k
    • 2
    Поделиться публикацией
    AdBlock похитил этот баннер, но баннеры не зубы — отрастут

    Подробнее
    Реклама
    Комментарии 2
    • +4
      Вот бы эти материалы как-нибудь в ленту RSS — удобнее читать по порядку, проматывать, ну и всё в таком духе. А то не очень удобно смотреть что читал, что ещё нет, что ещё раньше видел.
      • +1

        Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.