Comments / Profile of temakone / Habr

Artsiom Sanakoyeu @temakone

Computer Vision Researcher @ Heidelberg University

Profile Publications 1Comments 8Bookmarks

Как мы используем item2vec для рекомендаций похожих товаров

temakone Mar 19 2020 at 04:16

А с каким лоссом то обучали?

Look

Открытый курс машинного обучения. Тема 9. Анализ временных рядов с помощью Python

temakone Oct 1 2017 at 21:10

cv = xgb.cv(params, dtrain, metrics = ('rmse'), verbose_eval=False, nfold=10, show_stdv=False, num_boost_round=trees)

А почему тут для xgboost вы используете случайное разбиение на фолды? Хотя в начале говорили, что для временных рядов лучше делать CV на скользящем окне.

Look

Kaggle: как наши сеточки считали морских львов на Алеутских островах

temakone Sep 25 2017 at 20:42

Нужно обучать на новом датасете. Всё зависит от данных и масштаба.

Look

Kaggle: как наши сеточки считали морских львов на Алеутских островах

temakone Sep 25 2017 at 19:24

Я брал с весам, обученными на Imagenet. Замораживал несколько первых свёрточных блоков.

Look

Kaggle: как наши сеточки считали морских львов на Алеутских островах

temakone Sep 19 2017 at 00:09

Loss-function — квадрат L2 расстояния между двумя 5-мерными векторами (предикты и ground truth).

Субъективно. Если поменять локацию/угол/высоту съёмки, то все решения из топа сразу станут давать совсем другие ответы (скорее всего неверные). Если их дроны всегда будут летать примерно на той высоте, на которой были сняты снимки для трейна, то топовые решение дают не такую уж и плохую оценку числа особей (RMSE от 10 до 15 на 1 снимок в среднем). Хотя, не понятно, является ли такая ошибка на одном снимке значительной для биологов.

Look

Kaggle: как наши сеточки считали морских львов на Алеутских островах

temakone Sep 18 2017 at 17:51

В этом случае просто повезло, что распределения public/private были очень близки.

Look

Kaggle: как наши сеточки считали морских львов на Алеутских островах

temakone Sep 18 2017 at 17:12

Если вы про умножение ответов на константы, то читерством это не является. Но и для компании, проводящей соревнования, ценности такая подгонка под ответ никакой не несёт. outrunner потом сам признался, что он тупо и методично оверфитился на паблик либерборд.

Look

Kaggle: как наши сеточки считали морских львов на Алеутских островах

temakone Sep 18 2017 at 16:22

Спасибо! Да китайцы, похоже, всей конторой решали с одного аккаунта))

Look