Pull to refresh
28
0
Artsiom Sanakoyeu @temakone

Computer Vision Researcher @ Heidelberg University

Send message
А с каким лоссом то обучали?
cv = xgb.cv(params, dtrain, metrics = ('rmse'), verbose_eval=False, nfold=10, show_stdv=False, num_boost_round=trees)

А почему тут для xgboost вы используете случайное разбиение на фолды? Хотя в начале говорили, что для временных рядов лучше делать CV на скользящем окне.
Нужно обучать на новом датасете. Всё зависит от данных и масштаба.
Я брал с весам, обученными на Imagenet. Замораживал несколько первых свёрточных блоков.
Loss-function — квадрат L2 расстояния между двумя 5-мерными векторами (предикты и ground truth).

Субъективно. Если поменять локацию/угол/высоту съёмки, то все решения из топа сразу станут давать совсем другие ответы (скорее всего неверные). Если их дроны всегда будут летать примерно на той высоте, на которой были сняты снимки для трейна, то топовые решение дают не такую уж и плохую оценку числа особей (RMSE от 10 до 15 на 1 снимок в среднем). Хотя, не понятно, является ли такая ошибка на одном снимке значительной для биологов.
В этом случае просто повезло, что распределения public/private были очень близки.
Если вы про умножение ответов на константы, то читерством это не является. Но и для компании, проводящей соревнования, ценности такая подгонка под ответ никакой не несёт. outrunner потом сам признался, что он тупо и методично оверфитился на паблик либерборд.
Спасибо! Да китайцы, похоже, всей конторой решали с одного аккаунта))

Information

Rating
Does not participate
Location
Heidelberg, Baden-Württemberg, Германия
Works in
Registered
Activity