Pull to refresh

Tchart — самый объективный чарт

Reading time 2 min
Views 903
Посещая торрент-трекер, я однажды поймал себя на мысли, что посещаю его с одной не совсем обычной целью — понять, что и в каком количестве качает народ. Я открывал какую-нибудь категорию и, переходя по страницам, сортировал торренты по сидерам и личерам, запоминая и сравнивая максимумы. Это было ужасно неудобно, и так возникла идея — создать torrent-chart.



Идея заключалась в следующем:
  1. Объединить статистики нескольких крупнейших трекеров в одну аналитическую базу.
  2. Разработать механизм построения выборок по ключевым словам с ранжированием по активности (активность — сумма сидеров и личеров на момент сбора данных).
  3. Группировать одинаковый контент, суммируя статистики.
  4. Выводить результаты, сортируя по количеству сидеров или личеров.


То что получилось теперь называется tchart.ru.

На момент публикации статьи, проект еще находится на стадии пилота, поэтому кое-какие недоработки имеются. Однако полученные результаты уже весьма любопытны и местами неожиданны.

Так, например, самый популярный вид спорта у качающих — формула 1! Еще удивляет рейтинг музыки — в нем практически нет российской попсы (и вообще попсы). То есть, на трекере она есть (я проверял), но в сотне ее нет. Далее особенно комментировать не буду, вы сами можете ознакомиться с рейтингами и сделать выводы.

Еще несколько слов о том, что означают числа в колонках. Сбор статистики по каждому торренту производится ежедневно. За взятый расчетный период (неделя) количество качающих/раздающих суммируется и делится на количество дней. Иными словами, количество качающих/раздающих — это среднее значение за неделю. Далее, торренты группируются, и данные по группам суммируются. В колонке «скачан раз» отображается количество скачиваний самого .torrent-файла за расчетный период.

Если отсортировать рейтинг по качающим, получится рейтинг популярности непосредственно за неделю. Если же отсортировать по раздающим, рейтинг будет отражать более длительный период. Можно утверждать, что все раздающие кроме одного (автора раздачи) когда-то были качающими, поэтому количество раздающих — это как бы популярность за все время. Конечно, некоторые скачавшие сходят с раздачи, но если предположить, что процент сошедших одинаков для всех торрентов (как минимум в одной категории), тогда относительные позиции в рейтинге сохраняются. В конце концов, при построении рейтинга нас интересуют именно относительные значения.

Таким образом, рейтинг Tchart строится автоматически, непосредственно по статистике фактического потребления. Ни один человек не принимает решения при его составлении, а методы расчета, даже если они пока еще в чем-то неверны, со временем будут исправлены. В общем, я имею наглость утверждать, что tchart.ru — это самый объективный чарт, который только можно себе представить.
Tags:
Hubs:
+13
Comments 29
Comments Comments 29

Articles