Pull to refresh

Принцип 20/80 на примере Хабра

Reading time4 min
Views2.5K
Как-то стало интересно действует ли Закон Парето на таком само регулируемом ресурсе как Хабр. Кратко напомню что закон Парето это «Принцип 20/80» в данном случае можно трактовать что 20% пользователей приносят 80% результата. И раз уж на нашем ресурсе есть весьма точный метод оценка результатов пользователей на основе мнения разнородной, независимой, децентрализованной толпы. Почему бы не взять его в расчет. Про метод оценки читаем книгу «Мудрость толпы» Джеймса Шуровьески (мне кажется каждый Хабаровчанин должен о ней знать). Для оценки брались значения кармы (общий результат деятельности за все время по мнению других пользователей) и рейтинга (результат деятельности за последние 50 дней по мнению синтетических алгоритмов хабра).

Для получения данных были взяты данные статистики захабренных и отхабренных пользователей. Этот рейтинг включает в себя список только тех пользователей, которые хоть что-то сделали для хабра, а не просто зарегистрировались, поэтому будем считать его достаточно релевантным. Применив некоторые знания программирования запарсил данные с сайта. Думаю, для данной статьи метод не будет играть особого значения, может если будет интересно потом напишу отдельно. В итоге получил список пользователей с их текущей кармой и рейтингом. Вот он и был обработан.

Картинка для красоты:
image

В расчетах было учтено 24049 юзеров. Из них суммарная положительная карма составила 190371,89 суммарный положительный рейтинг 229145,98. Были взяты только положительные значения потому что они более всего подходят под понятие результат. Из числа всех не нулевых пользователей 20% составляет 4810 и для них сумма кармы и рейтинга составляет 150318,87 и 188463,37 соответственно. Следует отметить, что суммы взяты из списка отсортированного отдельно по убывающей для кармы и рейтинга (топовые хабравчане)

Теперь разделив значения, получаем результат близкий к 80 % с погрешностью ±3% что позволяет говорить о наличии зависимости (формулы кликабельны)

Для кармы image

Для рейтинга image

Ну это нам и так предвещал закон Парето. Но какие же ещё параметры относятся к 20% пользователей?

Итак, суммарный рейтинг и карма всех пользователей (с учетом минусов) составляют соответственно 150403,63 и 186244,84 что невооруженным глазом совпадает с суммарными значениями для 20%. Но все же посчитаем.

Для кармы image

Для рейтинга

Принимаем гипотезу с погрешностью ±3%

Можно немного пафосно заявить, невероятно 20% топовых пользователей суммарно обладают таким же количеством кармы и рейтинга, как и все пользователи, с учетом «отстающих». Т.е. можно говорить, что отстающие компенсируют друг друга и вполне можно предположить, что тоже самое происходит в иных системах. Ну а как же обстоят дела со средним значением.

Были найдены значения средней положительной кармы и среднего положительного рейтинга соответственно для всех пользователей 7,92 и 9,53. Количество пользователей с рейтингом >= среднего значения оказалось соответственно 5449 и 5008. Что по сравнению с общим количеством не нулевых пользователей.

Для кармы image

Для рейтинга image

Итого 20% пользователей обладают рейтингом или кармой выше средней положительной (т.е. продуктивной) с отклонением ± 3%.

Был также де замечен эффект отрицательных значений для кармы и рейтинга. Состоит он в том, что суммарно вся отрицательная карма и отрицательный рейтинг составляют 20% от суммы положительных значений. Суммарно вся отрицательная карма и рейтинг составляют -39968,26 и -42901,14. В то время как положительные значения 190371,89 и 229145,98.

Для кармы image

Для рейтинга image

Что и есть 20% с заданной погрешностью ± 3%.

Ко всему выше написанному прилагаю документ в прогрессивном формате с исходными данными Результаты.xlsx

Очевидно что значения динамически меняются поэтому эти данные могут устареть:) Конечно для полной статистики нужно снимать данные периодически в течении длительного периода времени. Но парсить html для этого не годится. Да и вопрос съема этих данных лучше самого Чипа и Дэйла этого никто не решит. Вероятно смещение соотношений может коррелироваться с некоторым событиями или иметь циклический характер.

Так же результаты ни в коем случае не должны рассматриваться как непреложный закон природы с конкретно заданными числовыми параметрами. Все вычисления являются сугубо эмпирическими. Так же если говорить о том чтобы оставить только 20% полезных пользователей то по закону Парето они со временем разделятся по правилу 20/80.

Из всех расчета можно подтвердить тот факт что: «Большинство удачных событий обусловлено действием небольшого числа высокопроизводительных сил; большинство неприятностей связано с действием небольшого числа высокодеструктивных сил.»

Ещё можно сказать что в среднем из каждых 5 приглашенных на хабр пользователей полезным для хабра будет только 1.

По просьбам в комментариях логарифмический график распределения кармы и рейтинга для сортированных по убыванию списков. Горизонтальная шкала значит место в рейтинге. Для синего графика место в рейтинге по карме(от большего к меньшему). Аналогично для красного.



Прямая на красном графике рейтинга с 10867 по 12631 места означат большое количество пользователей с рейтингом 2.
И частично совпадающая с ней прямая синего графике с 11573 по 12603 места означают хабаровчан с кармой 2. Откуда столько людей с кармой и рейтингом 2 статистика умалчивает. Но может стать поводом для новых исследования)

Для тех кто читает только начало и конец:

Краткие выводы с погрешностью ± 3%:
  1. 20% хабравчан имеют 80% всего положительного рейтинга.
  2. 20% хабравчан имеют 80% всей положительной кармы.
  3. 20% топовых хабравчан имеют столько же кармы сколько сумма всей кармы всех хабравчан.
  4. 20% топовых хабравчан имеют столько же рейтинга сколько сумма рейтинга всех хабравчан.
  5. 20% хабравчан имеют карму выше средней положительной кармы.
  6. 20% хабравчан имеют рейтинг выше среднего положительного рейтинга.
  7. Весь отрицательный рейтинг по объему составляет 20% от положительного.
  8. Вся отрицательная карма по объему составляет 20% от положительной.
Tags:
Hubs:
+61
Comments30

Articles