Представляю вашему вниманию очередной выпуск обзора наиболее интересных материалов, посвященных теме анализа данных и машинного обучения.
Общее
- Пять наиболее важных событий в мире R по итогам 2014 г.
- Как Deep Learning может в будущем быть использован в различных сферах жизнедеятельности
- Список ресурсов по машинному обучению — отличный список ресурсов по машинному обучению разбитый на несколько тематических категорий (Deep Learning, Online Learning, Ensemble Methods, Kernel Machines, GPU Learning, NLP и др.)
- Анонс Spark Packages — анонс Spark Packages: сборник различных библиотек с открытым исходным кодом для Apache Spark.
- Интерактивная трехмерная визуализация различных наборов данных в браузере с помощью data-projector
- Прогнозы на 2015 год: что случится с Big Data и Data Science? — еще один прогноз на наступающий год от популярного портала KDnuggets.com.
- 7 лучших ресурсов 2014 года по Big Data от SmartData Collective
- 8 предсказаний по теме Big Data на 2015 год от SmartData Collective
- 4 шага к успеху в области Big Data в 2015 году
- 10 лучших статей 2014 года по теме Data Science с блога Analytics Vidhya
Теория и алгоритмы машинного обучения, примеры кода
- Руководство хакера по нейронным сетям. Глава 2: Машинное обучение. Бинарная классификация
- Руководство хакера по нейронным сетям. Глава 2: Машинное обучение. Обучение сети на основе метода опорных векторов (SVM)
- Обзор алгоритмов сжатия графов
- InterSystems iKnow. Загружаем данные из Вконтакте
- Линейная алгебра в машинном обучении — автор блога MachineLearningMastery рассказывает о том, какие аспекты линейной алгебры полезно знать для лучшего понимания алгоритмов машинного обучения.
- Сбор и анализ данных бейсбольной статистики с помощью R
- Деревья принятия решений: наращивание и отсечение ветвей
- Использование метода опорных компонент (Principal Component Analysis) при работе с изображениями
- Распознавание рукописных цифр с помощью R (часть 1)
- Сравнение работы с Dataframe в Python, R и Julia
- Пример создания предсказательных моделей с помощью библиотеки caret — пример использования популярной библиотеки caret для языка программирования R для создания предсказательных моделей.
- Расширенная версия шпаргалки по scikit-learn
- Набор для машинного обучения — большой полезный набор различных ссылок на материалы по машинному обучению (в том числе и на русском языке).
- Визуализация данных с помощью GAE Python, D3.js и Google BigQuery (часть 1)
- Визуализация данных с помощью GAE Python, D3.js и Google BigQuery (часть 2)
- Визуализация данных с помощью GAE Python, D3.js и Google BigQuery (часть 3)
- Пример использования Spark (часть 3): очистка и сортировка номеров Social Security
- Пример кода: применение функции к каждой строке в data.frame
Соревнования по машинному обучению
- Как подходить к решению проблем на Kaggle — набор простых советов от автора блога Analytics Vidhya, которые помогут стать успешным участником соревнований по машинному обучению на Kaggle.
- Интервью с Yann LeCun: сверточные сети и CIFAR-10 — интересное интервью с Yann LeCunn (Director of AI Research, Professor at New York University), посвященное вопросам использования сверточных сетей и обсуждению недавно завершившегося соревнования по машинному обучению CIFAR-10 на Kaggle, которое было посвящено вопросам распознавания изображений.
- Анализ данных Kaggle с помощью R — интересный анализ данных соревнований по машинному обучению на Kaggle, проведенный с помощью языка программирования R.
Онлайн-курсы, обучающие материалы и литература
- Анонс нового онлайн-курса «Statistics and R for the Life Sciences» — интересный курс под названием «Statistics and R for the Life Sciences» от Harvard University анонсирован на edX.
- Материалы курса «Convex Optimization» от Carnegie Mellon University
- Набор лекций с курса «Principles of Distributed Computing» (ETH Zürich)
Видеоматериалы
- Основные ловушки проектов машинного обучения — интересное выступление «Machine Learning Gremlins» Ben Hammer и комментарии от автора блога MachineLearningMastery.
- Машинное обучение с помощью статистических и казуальных методов — ссылка на видео выступления «Statistical and causal approaches to machine learning» от Bernhard Scholkopf и комментарии автора блога MachineLearningMastery к нему.
Data engineering
Обзоры
- Дайджест лучших ресурсов от DataScienceCentral (29 декабря)
- Лучшие материалы за неделю от KDnuggets.com (14 — 20 декабря)
- Еженедельный сборник лучших материалов от R1Soft (26 декабря)
- Лучшие ресурсы за неделю от Data Elixir (№15)
- Наиболее интересные материалы от Freakonometrics №195
- Наиболее интересные материалы от Freakonometrics №196
- Наиболее интересные материалы от Freakonometrics №197
Предыдущий выпуск: Обзор наиболее интересных материалов по анализу данных и машинному обучению №27 (15 — 21 декабря 2014)