Pull to refresh

Comments 23

Типичный комментарий (имеет 16 «обсуждальщиков») = типичный пост?
да, конечно
исправил
Инструментарий который вы разработали можно применить для анализа сообществ?

Специфика будет в том, что там разные авторы постов — то есть нужен будет еще один срез: кто из авторов собирает больше комментов, например. Сами сообщества после последней модификации ЖЖ стали выглядеть очень похоже на обычных юзеров.
Применить — нет, адаптировать — да. Принципиально ничего не меняется если говорить о вышеприведенных параметрах. Конечно надо подправить парсер и сам алгоритм обработки, но суть та же.

Другое дело что сообщества интереснее рассматривать не как ряды для статанализа, как граф для выявления рисунка связей внутри сообщества. Я потихоньку работаю над проблемой выявления неявных сообществ внутри ЖЖ на основе графа взаимной дружбы и анализа локальных сообществ, например, регионального типа. Буду писать об этом, но позже.
Данные интересные, жду гипотез и вообще аналитики по этим данным.
В качестве оффтопика — почитайте Славу Сэ (pesen_net), очень редкий сейчас случай доброго и талантливого человека. У него, кстати, книга есть, продается в магазинах.

… Гитарист был алкоголиком. Басист курил запрещённые растения. Я увлекался грустными женщинами, а это хуже, чем пить и курить. Самой непорочной была вокалистка, единственная в мире латышка-негр Моника. Дочь олимпийского негодяя из Кении. Единственным, невольным её грехом был зад-искуситель. Сильно оттопыренный, в форме сердца, невероятной красоты. Он ломал судьбы и калечил психику. Мало что чёрный, он танцевал отдельно от хозяйки. Из-за него басист не спал ночей, раз в месяц предлагал Монике создать семью, хотя бы на вечер. Моника фыркала, уходила сама и всю красоту уносила с собой...
Да! А вот и спам в комментариях ;) Куда же без него на ЖЖ.
Сюда бы еще долю ботов среди всех комментаторов:)
Я пока не нашел структурного или статистического алгоритма выявления ботов. Мысли есть, но я еще их не проверял.
Познание структуры мироздания :)))
Хобби у меня такое.
> Познание структуры мироздания

Я сэкономлю вам время. Ответ: 42.
Смахивает на вычисление средней температуры по больнице.
Чтобы это не было средней температурой по больнице анализировать надо не ЖЖ в целом, а отдельные сообщества (как явные так и неявные). До этого я еще не дошел — отрабатываю инструментарий и подходы.
Неплохо бы такую же аналитику хабра провести
Подобная аналитика не очень выгодна самим сервисам на мой взгляд. Получается что всю движу организует весьма небольшое количество активных участников. Это не плохо, это просто особенность социальных систем и ее надо понимать, а иначе можно сделать ошибочные выводы (специально или по незнанию). Этим часто грешат СМИ и политически ангажированные персоны в блогах.
Интересен рейтинг комментаторов — кто из пользователей больше всего комментариев в чужих журналах оставляет, и как это кореллирует с его рейтингом.
Рейтинг комментаторов я выкинул чтобы не перегружать первую часть публикации. Подумаю куда включить эти данные.

А что вы понимаете под «коррелирует с его рейтингом» — если выстроить рейтинг по количеству оставленных комментаторов то с чем считать корреляцию? С его позицией в топе ЖЖ по френдам?
Ну френдов можно взять, чтобы не заморачиваться, только это не самый точный показатель. Гораздо важнее количество трастовых комментариев в собственном блоге комментатора.
Я не понимаю о чем вы. Можно на примере?
Чтобы пост оказался для меня полезным, я должен выделить для себя единицу смысла. Скажите пожалуйста, а зачем всё это? К чему вы хотите нас привести?
Это лишь часть целого. Смыслы выделять буду чуть позже.

Хотя для меня понимание законов распределения активности участников социальных сетей подтвержденное экспериментом — это тоже смысл.
Sign up to leave a comment.

Articles