Краудсорсинг

индекс
149,91

В капусте нашли аиста

Обнаружил мощный статистический потенциал «ВКонтакте» и получил ответ на давно интересующий вопрос. Дело в том, что среди моих друзей примерно половина родилась в декабре и меня это беспокоило.

Disclaimer:
1) на серьезное исследование не претендует;
2) мне есть чем заняться);
3) может не в тему, но не знаю куда, подскажите.



Важно: по данным на ноябрь 2007 — делал давно.

(Если кому лень пересчитывать — столбики расставлены в порядке месяцев рождения. То есть «Апрель» — «Январь», «Май» — «Февраль»)

Анализ
1. Во-первых, распределение неравномерно. И это, пожалуй, самый важный вывод. Разница между максимумом и минимумом — 20% от среднего. При таком объеме данных это никак нельзя объяснить случайностью.
2. Летом — больше, зимой — меньше. Апрель — пик.
Гипотезы:
1) Высказана идея о том, что реально это провал на зимних месяцах, а все остальное равномерно. Выпадает май, потому что «Кто в мае женится, всю жизнь мается». Эту же гипотезу подтверждает максимум в августе.
2) Вторая идея о том, что вообще есть два пика: один размазанный летний, второй — острый весенний. Причем он не в марте, потому что в марте у нас еще в основном холодно.
3. Есть еще подозрение, что апрельский пик — на самом деле артефакт «Контакта». Люди, которым лень выбирать месяц, выберут первый — то есть январь. Ну в общем дальше можете сами отнять нужное количество месяцев.
+7
5 марта 2010, 17:42
8
KPG

комментарии (72)

0
nE0 #
Отличная статистика!
0
KPG #
Спасибо, а кармы не подкинете? Я бы тогда перенес в коллективный блог какой-нибудь…
+1
nE0 #
сегодняшнюю порцию потратил уже, а так бы с удовольствием!
+2
Bambr #
переносите
+2
tossshik #
Все логично, лето — пора отпусков, да и вообще в тепле этим приятнее заниматься :)
+4
DimZ #
мне кажется в прохладу этим заниматься как то лучше, заодно и погреться можно.
+10
catsmile #
— Иван Петрович, скажите, а вот вы тёплую водку любите?
— Нет, не переношу абсолютно.
— А потных женщин?
— Ну что вы, никоим образом.
— Отлично, пойдёте в отпуск в феврале.
+7
Letum #
Выходит он от начальства и рассказывает это Фёдору Викторовичу. Дальше его очередь.
— Фёдор Викторович, скажите, а вот вы тёплую водку любите?
— Конечно!
— А потных женщин?
— Просто обожаю!
— Хорошо, осенью поедете на картошку.
0
Halt #
Да чего тут непонятного… Весна, птички поют, гормоны… Вот и рождаются =)
+2
kurokikaze #
А ечли построить распределение по всем жителям России, например? Я сомневаюсь что оно будет равномерным.
–20
stalkers #
У меня не гипотеза, а целый вывод сразу. Заключается он в следующем — вам заняться больше нечем, кроме как херней маяться.
+29
KPG #
Спасибо, друг. Только что предзащитил кандидатскую. А ты?
+6
x25 #
Не в Британии часом? :)
+7
KPG #
Неа, физфак МГУ
–21
stalkers #
0_o Мы дружим? Спасибо буду знать, раньше был как-то не в курсе…

По делу. Что эта статистика делает на Хабре, окромя того, что она здесь просто есть? Видите ли, по поему разумению, Хабр — не место для подобных вопросов. Выводов никаких нету. Практического толку от данного поста не вижу. Возможно, я не прав. Возможно, это кому-то, кроме вас и вашей кандидатской, нужно.

Осмелюсь немного подсказать. Сделай вы пост о каких-либо маркетинговых выводах или о чем-то ином, основываясь на данной статистике, было бы намного лучше. Здесь же просто факты и мой вопрос «и чё?».
+4
KPG #
Прошу прощения за фамильярность, был не прав.
Это приглашение к дискуссии и судя по тому, что я здесь вижу, дискуссия вызывает некоторый интерес. А то, чему есть место на Хабре, а чему нет — пусть решат кармодаватели. И заметим, мой пост никак не противоречит Правилам.
Ну и потом, я делаю пост в личном блоге.

Ну а кандидатская, конечно же, совсем не про это.
+2
KPG #
Про кандидатскую я сказал потому что только что сделал большой кусок работы и в порядке отдыха по приколу сделал вот эту штуку.
+2
Vadi #
«Хабр — не место для подобных вопросов»
Нафига козе баян постам рейтинговая система? Народ сам оценит нужно или нет.
–1
Kindigo #
народ большиство не всегда право выбирает правильные решения.
+1
taliban #
большинство выберет _свое_ правильное решение, а нравится ли оно вам, или правильно ли оно для вас, это уже ваши проблемы
–1
Kindigo #
предположим: какой-то человек решил вас убить. и он это сделает. нравится ли это вам, или нет — ваши проблемы.
0
taliban #
если меня решит убить несколько миллионов человек (типа большинство) тогда наверно что-то во мне не так
+1
megalol #
Идущие на жертвенник примерно так и рассуждали
0
taliban #
именно, общество решает как изменить судьбу мира, в данном случае общество меняет хабр под себя, так было, так есть и так будет
0
kibitzer #
Поздравляю!

ЗЫЖ но кандидат наук мог бы эти «исследования» лучше оформить, опыт после подготовки работы должен остаться. Очень сумбурно написано и графики малоинформативны. Где средние значения, где отклонения, где прогноз на следующий год? ;) Оценка ошибки… Любое исследование должно быть максимально научным, тем более, если вы уже кандидат.
+2
KPG #
Именно потому, что я только что оформил больше 100 страниц текста как нужно, мне не хотелось здесь над этим заморачиваться. Впрочем, если так уж бросается в глаза, буду впредь внимательней:)
0
Sirob039 #
ПредКандидат!
–2
dennyoi #
«какие у вас гипотезы» — жениться тебе надо, барин (с)
0
Bambr #
Может все дело в ботах, которым лень проставлять дату?
0
Nc_Soft #
Может лучше корень из двух в айфон повписываем?
У кого-то даже целая серия статей была.
0
I_D #
а какие гипотезы — * либо получается, что зачинают больше с декабря по апрель,
возможные объяснения — «на улице холодно, дома скучно, чего б ребенка не сделать»

* либо что рожденные с июня по ноябрь больше любят Вконтакт
тут, честно говоря, затрудняюсь…

* либо что в силу каких-то причин народ неравномерно указывает дату рождения
например, в силу стереотипа (условно), что люди, рожденные в эти месяцы «веселей/красивше» и т.д.
+2
MefBezTufel #
Статистика, на самом деле, довольно-таки приблизительная. Для большей точности стоит еще найти где-нибудь данные по проценту родившихся недоношенными и переношенными. Думаю, учет этих данных должен немного сгладить график.
+2
yagellon #
Ага, прикольная была бы графа в анкете: «Вы недоносок / переносок / пунктуальный», правда, многие не владеют такой информацией о себе. В будущем, скорее всего, она будет фиксироваться в каком-нибудь медицинском профиле, открываемом с рождения.
НЛО прилетело и опубликовало эту надпись здесь
НЛО прилетело и опубликовало эту надпись здесь
+4
standov #
блядь… главное в вопросе зодиаков — уверенность
0
HighOctane #
Тут речь идет о месяце зачатия, а не о месяце рождения. Выключите своего астролога из желтых газет.
+1
melmaxnvk #
Что то я совсем тупой стал — вроде бы вконтакте нету графы «дата зачатия»? Или её теперь можно однозначно узнать по дате рождения? Вроде бы разброс срока беременности от 7 до 10 месяцев никто не отменял.
–1
standov #
«столбики расставлены в порядке месяцев рождения»
+1
melmaxnvk #
Зависимость количества участников «Вконтакте» от месяца зачатия.
Или у вас другая подпись к изображению?
–1
Demlock #
Месяц рождения минус девять месяцев примерно равен месяцу зачатия, как-то так.
+1
melmaxnvk #
Вот именно, что примерно. Рождаются 7-месячные, рождаются 10-месячные. Необходимо было использовать медицинскую статистику про процентному соотношению недоношенных и переношенных, тогда можно было утверждать что график и выводы верные.
–1
Demlock #
Прекратите так серьезно относиться к подобным графикам(исследованиям) :)
+1
melmaxnvk #
Ну вот такой вот я зануда :)
+8
x25 #
Поскольку для исследуемого ресурса доля недоношенных/переношенных существенно превышает норму, замечание коллеги постом выше принципиально важно.
0
Demlock #
Эк вы витиевато выражаетесь. Так и говорите прямо, что большинство пользователей контакта — ущербные. :)
+3
x25 #
У меня неделя толерантности :)
+2
Demlock #
Заходите снова, когда будет двухминутка ненависти :)
+2
KPG #
Важное замечание, спасибо!
Но я с большой степенью вероятности уверен, что срок вынашивания мало зависит от даты зачатия. 9 месяцев — центра Гаусса. Если мы его прибавим к времени зачатия, статистика не должна измениться
+3
standov #
ну вообще это почти аксиома, в свете борьбы с ранними рахитом детей стараются рожать весной — больше света и как следствие витамина D — отсюда апрель пик, зима выпадает, ваш тезис про май верен с учетом того что он не про свадьбу а про рождение — но тут скорее люди просто не признаются про май :)
У меня у самого сын апрельский :) я июньский, жена майская (поговорку подтверждаю :))))
0
Demlock #
«получил ответ на давно интересующий вопрос» — вопрос заключается в том, сколько юзеров вконтакта было зачато в определенный месяц?
А почему, собственно, вас беспокоят вопросы подобного рода?
0
KPG #
Среди моих друзей — около 60% родилось в декабре. В связи с этим и волновало.
–2
kosiakk #
мне кажется, тут дело в «астрологии». Т.е. звёзды, безусловно, не при чём, но есть много наблюдений, которые (теперь) можно проверить статистически, не пытаясь обосновать.

у меня («козерог») большинство друзей родились в апреле («телец?»).

повторюсь, это не имеет ровно никакого отношения к той чепухе что печатают в газетах на каждый день.

у вас есть статистика по друзьям?
плюс на графике было бы неплохо нарисовать доверительный интервал и количество респондентов.
и мне кажется, не нужно вычитать 9 месяцев. форма графика не меняется, а путаницы больше

плюс у меня где-то была статистика по двум IT-компаниям. ох, хочу найти и сравнить.
–1
Nc_Soft #
Август конец отпусков, все приезжают и фоточки выкладывают, что тут непонятного…
+2
karevn #
Уважаемый, а если нормировать график? То есть считать не абсолютные количества пользователей, а приведенные к цифрам рождаемости по месяцам. Есть у меня мыслишка что график станет практически ровным.
0
Imposeren #
А у вас есть такие данные?(=
0
karevn #
Неа, нету.
0
senseyua #
+1 рождаемость в каждые месяцы разная. Данный график, скорее, отображает рождаемость по месяцам в интервале нескольких десятков, чем приверженность людей, родившихся в определенном месяце в проекту «вконтакте»
0
KPG #
Прошу прощения, не совсем понял. Рождаемость по месяцам — это количество человек, рожденных в конкретный месяц на 1000 человек. Если считать, что членство в контакте не зависит от месяца рождения — ровно то и получаем.
+1
Vitvitsky #
контакт предоставляет эти данные?
получается что раз большинство Ваших друзей родилось в декабре, судя по диаграмме, зачаты в марте, значит интересный случай получился, что из самой немногочисленной группы людей, зачатых в марте, попались именно они вам в друзья, как то так.
Возможна гипотеза, что есть слабая, малокоррелируемая зависимость с тем фактом, что родившиеся в декабре, как то более вам приятны по характеру или по темпераменту, остальные просто не очень подходят.
–1
megalol #
Это к вопросу о том, что отдельный человек всегда живет в субъективном мире. Вероятность попасть в выборку, которая кажется, что идет против статистике очень велика. Поэтому все примеры в споре типа «а у моей тетки вот так» ужасны по своей природе, а астрологию или гомеопатию для отдельного человека хрен опровергнешь.
0
KPG #
При поиске по людям выводится информация о количестве человек, удовлетворяющих данным критериям поиска. Парсить приходится в ручную, но недолго.
0
Imposeren #
Надо же притворится астрологом! Сразу бы пересчитали в знаки зодиака(=
0
megalol #
Эволюционно виды настроены рожать в теплое время года. Для видов, у кого срок короткий (например, для котов) выгодно любить весной. У человека срок длинный, пик гормонов приходится на сентябрь.
Человек не животное, поэтому его предсказанный с точки зрения выживания осенний пик размазан по всему лету из-за социальных факторов и прочего (видно по резкому переходу май-июнь).
Весна же считается порой любви, потому что, например, с удлинением светового дня у человека уменьшается количество транспорта серотонина, мозгу непривычно.
0
apakin #
«Апрель — пик»
И пик в мае — хопа!
0
savostin #
Ну, давайте исследуем зависимость собственной даты рождения и % соотношение дат друзей.
Может тут собака порылась? ;-)
0
KPG #
Неа, я в июле)
0
savostin #
сам-то я в декабре родился — давай дружить?
+1
ikorolev #
Надо было исключить тех, кто 1 января родился.
0
plusadin #
надо бы усреднить к статистике рожденных в целом по стране. если и там будут перекосы, то это уже интересно.
0
tonyawer #
Несколько слов по данной теме. Во-первых, все-такие график и само исследование достаточно поверхностное, чтобы делать выводы на основе него. Ведт есть разные регионы, разные возрастные группы родителей, опять же социальные различия. А тут все усредненное. Ну да ладно.
Вы не замечали, что в поколении 30-40-летних очень много рожденных к конце августа — начале октября. Долго с друзьями-девами спорили и шутили на эту тему. И вот во время одной из бесед нашелся гениальный ответ, почему такой всплеск рождаемости в этот период. Вспомните советское время. Работа была не изнурительная, но и без разгульности. Так вот всеми любимый праздник Новый год. Народ 2, иногда 3 (когда с выходными совпадало) дня пил, гулял, отдыхал. Во всеми вытекающими. )) А через 9 месяцев ± пара-тройка недель появлялись «новогодние подарки». ))
И второе забавное наблюдение. Опять же на эту возрастную категорию и рожденных в январе-апреле. Опять же в советское время, когда жилищные условия и нормы морали не позволяли молодой паре предаваться утехам плоти в хрущевке с родителями за полукирпичной стеной, народ ездил на дачи / природу. Если весна ранняя, то на следующий год всплекс рождаемости козерогов. Если затяжная весна — то овенов.
Конечно, все это больше наблюдения без статистики. А вот если человек профессионально занимается изучением вопроса, то было бы интересно почитать его исследование. Ведь надо и призыв в ряды ВС учитывать, и демобилизацию, и кучу дополнительных факторов. Есть такое исследование?
0
WasD #
В феврале меньше всего дней, поэтому минимальный результат логичен. С апрелем гипотеза на мой взгляд подтвердится.

Только зарегистрированные пользователи могут оставлять комментарии. Войдите, пожалуйста.