Компания
83,22
рейтинг
18 июля 2013 в 11:34

Разное → Активные пользователи ВКонтакте и Twitter: рейтинг российских регионов

Как и обещали, публикуем данные по региональной активности пользователей Twitter и Вконтакте. В отличие от опросов общественного мнения, данное исследование позволяет проследить не декларативное поведение пользователей социальных сетей, а выделить ядро активных пользователей, формирующих информационный поток в сети. Больше всего пользователей, публикующих записи в социальных сетях ВКонтакте и Twitter, в Санкт-Петербурге и Москве.

Аудитория ВКонтакте


Наибольшее число активных пользователей социальной сети ВКонтакте за май-июнь 2013 года (в абсолютных числах) в Москве (2 000 615), Санкт-Петербурге (1 152 063) и Свердловской области (441 109).

При подсчете охвата активной аудитории пользователей относительно численности населения региона первую тройку составляют Санкт-Петербург (22,9% жителей города), Москва (16,7% жителей города) Калининградская и Мурманская области (13,9% жителей региона).
В целом аудитория активных пользователей в сети ВКонтакте сократилась в июне 2013 по сравнению с маем 2013, что является стандартной картиной в летний отпускной период.

Аудитория Twitter


В отличие от аудитории ВКонтакте активная аудитория Twitter увеличилась в июне по сравнению с маем 2013.
Регионы-лидеры по абсолютному охвату аудитории совпадают с данными по социальной сети ВКонтакте: Москва (451 039 активных пользователей), Санкт-Петербург (189 328 активных пользователей) и Свердловская область (52 575 активных пользователей).
Относительно численности населения в регионе на первом месте по активности пользователей Twitter Москва и Санкт-Петербург (по 3,8% жителей городов), на втором – Магаданская область (2% жителей региона), на третьем – Ярославская область (1,8% жителей региона).

Мониторинг социальных сетей ВКонтакте и Twitter проведен в июле 2013 года. Под активными пользователями социальной сети понимаются те пользователи, кто написал хотя бы одно публичное сообщение за исследуемый период.

Ознакомиться с интерактивной картой распределения активных пользователей социальных сетей по регионам России и статистическими данными по всем регионам, вы можете на страницах: Активные пользователи ВКонтакте и Активные пользователи Twitter

Способ учета пользователей

Учитываются только те пользователи, кто написал хотя бы одно публичное сообщение (пост, комментарий, твит, републикацию и др). В рамках выбранного нами подхода, мы изучаем социальные сети как средство публичной коммуникации между людьми, как инструмент влияния на формирование общественного мнения. В свете такого подхода для нас важны активные («говорящие») пользователи — те, кто очевидным образом проявляет свою позицию по исследуемым темам и выражает свое мнение, путем размещения открытого контента (публичных сообщений) в социальных медиа.
Таким образом наш подход не копирует схему работы учетных систем (типа интернет-счетчиков или собственный анализ записей посещений интернет-сервиосв), предназначенных, в первую очередь, для учета показа рекламных материалов.

Формат представления данных

В виду того, что сбор данных ведется непрерывно (ежесекундно), встает вопрос, за какие отчетные интервалы времени предоставлять информацию, то есть, каким образом мы определяем для себя само понятие аудитории социальных сетей. Возможности системы позволяют сделать сколь угодно подробные выгрузки, но для широкой презентации мы остановились на месячном интервале. Месячный интервал, с одной стороны, позволяет нам отследить динамику, так как аудитория не является постоянной, а с другой стороны — является допустимым обобщением чтобы учесть тех пользователей, которые пользуются сетями не ежедневно, но не реже одного раза в месяц.

Сравнение с данными социологических опросных служб

В отличие от данных соццентров, мы, во-первых, делаем свои оценки не на основе ответов респондентов, которые часто носят декларативный характер, а на основе учета их фактического поведения, то есть фиксируем конкретный поведенческий акт, который определили для себя как написанное публичное сообщение (пост, комментарий, твит и др). Так, например, по данным ВЦИОМ в пересчете на абсолютные значения около 27% опрошенных отметили, что они пользуются сетью ВКонтакте wciom.ru/index.php?id=459&uid=112476. По данным наших замеров аудитория активных пользователей ВКонтакте составила в России в целом 6,3% за май, в июне сократилась до 5,6%, а общее количество уникальных активных пользователей за два месяца составило 7,8%. Таким образом, проанализировав годовой цикл, мы сможем точно рассчитать аудиторию активных пользователей сети за год, основываясь на их фактическом поведении в сетях.

Представленные сети

Для презентации мы взяли за пример две соцсети: первая – ВКонтакте (сеть с большой пользовательской аудиторией), а вторая Твиттер (наиболее динамично развивающаяся сеть). В ближайших планах (до конца года) стоит поэтапное подключение остальных популярных соцсетей.

Пример исследования: Любовь и ненависть на карте России

Мы собираем и анализируем не только количество сообщений и их авторов, но и сами сообщения, благодаря чему можем проводить множество социологических исследований методом бесконтактных опросов. Одно из самых интересных исследований «Индекс любви», показывает в каких регионах России пользователи соцмедиа больше говорят о любви, а в каких о ненависти.
Исследование проводилось с 1 по 7 июня 2013 г. в социальных сетях — ВКонтакте, Facebook, Twitter, LiveJournal и др. Анализировались русскоязычные упоминания любви и ненависти от первого лица – позитивные (например, «я люблю», «обожаю») и негативные («я ненавижу», «меня раздражает» и пр.). Всего проанализировано более 65 млн. сообщений от 10 млн. авторов.

За исследуемый период эмоции, которые можно охарактеризовать как «любовь» или «ненависть», суммарно упоминались в потоке сообщений более 800 тыс.раз. В большинстве сообщений (70%) преобладали позитивные эмоции (« я люблю», «мне нравится» и т.д.), негативный настрой («я ненавижу», «меня раздражает» и т.д.) присутствовал в меньшем объеме сообщений (30%). Причем в сообщениях, содержащих эмоции ненависти, нередко присутствует негатив в отношении сиюминутных раздражителей – «ненавижу, когда будят утром».
Наиболее позитивным регионом оказалась республика Алтай (индекс 4,1 пункта: количество сообщений с позитивными эмоциями – 80,4%, с негативными – 19,6. В топ-5 также попали Псковская область (индекс 3,9), республика Карелия (3,7), Костромская область (3,7).

Вы можете ознакомиться с «Индексом любви» по всем регионам России на интерактивной карте.
Автор: @CvetKomm
PalitrumLab
рейтинг 83,22

Комментарии (30)

  • 0
    Есть twirating.com
    • 0
      Но у них цифры как минимум на порядок ниже
  • 0
    В twirating всего 88 городов присутствует же)
  • +1
    У вас на карте я могу различить три оттенка, а в легенде их четыре. Сколько не вглядываюсь так и не могу понять где четвертый. Та маленькая точка, да?
    • 0
      Питер, полагаю.

    • 0
      Если речь о самом темном оттенке (наибольшее кол-во пользователей), то да — две маленькие точки — это Москва и Питер. Если я не угадала, какой оттенок вы не можете найти, расшифруйте, пожалуйста ;)
      • 0
        Да самый темный. А в каком из этих двух городов 20.6%?
        • 0
          ВКонтакте за май+июнь в Санкт-Петербурге. Авторы за май и июнь так же подсчитываются только уникальные. Если пользователи написал одно сообщение в мае и одно в июне, то он считается как один автор.
  • 0
    Просветите, как осуществлялась «привязка» пользователей к региону? Особенно интересует Twitter. А то в способе учета только про активность.
    • 0
      Географическое положение авторов определяется автоматически. Как именно это происходит мы не можем раскрывать, по вполне понятным причинам.
      • 0
        Честно говоря, причины мне абсолютно непонятны. Я же не спрашиваю пошаговый алгоритм. Меня просто интересует, какие поля user-object используются? Определяемый самим пользователем location (указанный далеко не у всех), time_zone (выдающий иногда «космические» результаты), может быть вообще из твитов гео-термины извлекаются (было бы круто)?
        • 0
          Могу только сказать, что это не «определяемый самим пользователем location» и не time_zone :)
          У нас используется собственный алгоритм геолокации, основанный на сложном много-параметрическом анализе как профиля автора, так и его сообщений и окружения
          • 0
            Список доступных для сбора/анализа полей профиля пользователя доступен по ссылке в предыдущем моем комментарии. Если это не time_zone и не location, то даже боюсь предположить, что именно вы используете. Name? Profile_image_url? Followers_count? Просто названия полей. Без тонкостей. По поводу анализа сообщений — известно же, что напрямую геотегированы порядка 1% всех сообщений. Остальные опять оценены «собственным алгоритмом геолокации»?
            Тогда дайте accuracy&precision оценки вашего алгоритма. Пока самый лучший из известных мне алгоритмов способен «предсказать» локацию пользователя в 79% случаев с точностью в 100 миль. Это для мира. Если сосредоточиться только на России, оценки неизбежно ухудшатся.
            Но даже с такими оценками говорить о превосходстве над данными социологических служб надо аккуратнее.
            • 0
              Мы не говорим о превосходстве над классической социологией)) Мы говорим о разности подходов и методов. В частности, классические опросы, например, не позволяют проводить исследования на столь широкой выборке. Это означает, очень упрощенно конечно, примерно следующее: опросили 1000 москвичей, из них 500 пользуются ВКонтактом, вывод — 50% москвичей пользуются ВКонтактом. Мы же фиксируем только тех, кто действительно пользуется. То есть наши данные — это голые факты, они не нуждаются в тиражировании и т.п.
              Поэтому мы и говорим, что наши данные носят не декларативный характер.
              Второй момент — счетчики заходов и т.п. — нам не интересны посетители, которые заходят послушать музыку и посмотреть кино. Такие данные актуальны, например, для рекламодателей, и они считаются многими, в том числе и с гео. Нам же интересны активные пользователи — авторы публичных сообщений, так как именно они формируют общественное мнение, создают мемы и так далее. Поэтому мы собираем, считаем и геолоцируем, и анализируем именно их — активных авторов и их публичные сообщения.
              Как мы это делаем — это наши технологии, разработанные нами алгоритмы, которые просто нельзя разглашать.
              • 0
                Думаю, что большинство читателей хабра осознают разницу между соцопросами, счетчиками и вашим подходом по оценке аудитории. Все они имеют свои плюсы и минусы, каждый показывает что-то свое, но глобально вроде бы все «об одном».
                Прелесть вашего подхода — в объемах данных, основной недостаток — необходимость оценивания параметров (в данном случае — живости и геолокации).
                Я хочу понимать степень достоверности ваших оценок. Фальсифицируемость — основной критерий научности. Соответственно, информация о доле «нетегируемых» вами пользователей только улучшила бы мнение о вас и вашем подходе. Вы же по какой-то неведомой причине в ответ на просьбу указать точность пишите о «разработанных алгоритмах, которые нельзя разглашать».
                То же самое с ботами. Популярность проблемы отсева ботов сложно переоценить. И опять все упирается к оценкам: насколько хорош ваш алгоритм в сравнении с другими? Не могут быть секретными такие оценки.
                • 0
                  Как я писала выше, мы анализируем не только данные профиля автора, но и его посты, твиты, комментарии и т.п. То есть, мы учитываем гео-данные из профиля автора, обновляем их при поступлении каждого нового сообщения. Учитываем гео-метки к сообщениям автора. Учитываем гео-информацию внутри сообщений. Делаем связку профиля автора с его профилями в других соцсетях, и учитываем гео-данные там. Прогоняем это все через наши гео-словари, чтобы привести данные из разных форматов указания гео к единому виду и сделать связку город-регион-страна. В итоге нам удалось поднять процент гео-определения автора с точностью до региона России: для Твиттера — до 45%, для ВК до 75%. Данные о количестве авторов в регионах России нормированы на коэффициент, рассчитанный для каждого региона индивидуально.
                  • 0
                    Спасибо! Как раз то, что и было интересно. К сожалению, не могу проголосовать.
                    Если еще не надоел со своими вопросами (на самом деле, интересно): почему используете свои словари, а не доступные свободно GeoNames или еще что-то? В свободных все так плохо?
                    • 0
                      Не за что) Свои словари — потому что в их точности мы уверены на 100%, про другие не могу ничего сказать по поводу точности, к сожалению
                      • 0
                        Позволю себе дополнить ответы CvetKomm: естественно за основу изначально были взяты открытые геобазы. Но пришлось их очень сильно перерабатывать и дополнять вариантами написаний городов, стран, регионов и т.п.

                        Поскольку множественные случаи одинаковых названий городов (Москва в России и Москва в США), то реализованы не только простые весовые параметры, но и лингвистические параметры — например, язык сообщений. Есть еще множество нюансов, но, в целом, думаю понятно :-)
                        • 0
                          Ага. Спасибо еще раз! В основном — понятно, нюансы — должны остаться в секрете.: о)
      • 0
        И еще один вопрос возник. Я правильно понимаю, что вот этот твиттер-пользователь вошел в число 451 039 активных пользователей-москвичей? В июне он твитил. Причем много. А сколько еще таких активных в Москве и других регионах?
        Disclaimer: аккаунт для примера выбран совершенно случайным образом по спам-тегу #RT.
        • 0
          Спамеры исключаются из анализа, «пересчет ботов» лишен смысла)
  • 0
    По вашей карте я делаю вывод, что 15-20% населения Земли Франца-Иосифа регулярно сидит вконтакте. Примерно ты же ситуация на Ляховских островах в Восточно-Сибирском море.
    • 0
      в принципе, если там живет, допустим 100 человек, из которых 20 пишут что-нибудь в твиттер, то получатся те же 20%. Я так понимаю, если бы провели соответствующее исследование по странам мира, оказалось бы, что и в Гренландии все население очень любит твиттер
  • 0
    Земли Франца-Иосифа и Ляховские острова относятся к Архангельской области. Процент активности в ней — 10,4% за май+июнь ВКонтакте. То есть мы в данном случае говорим не о городах и районах, а о субъектах федерации, и геолоцируем авторов именно на этом уровне.
    При чем, важно так же то, что мы определяем не тех, кто «сидит», а тех, кто проявляет публичную активность)
    • 0
      те, кто проявляют публичную активность, в указанной стране все чаще именно сидят )
    • 0
      Круто Вы с Архангельской областью — если бы не продали, Вы бы и Аляску к ней приписали? :))) А если серьезно — это ненаселенные области, там некому сидеть вконтакте, кроме чаек. В данном случае, ваша картограмма вводит читателя в заблуждение.
      • 0
        Это не мы, это официальные данные по составу субъектов РФ )))
        • 0
          Официальные данные по субъектам относят Ляховские острова Новосибирского архипелага к Якутии.
          • 0
            упс, не туда посмотрела. Вы правы, конечно, по поводу Ляховских островов. На карте и в таблице все так, ошиблась в предыдущем ответе, прошу прощения за дезинформацию )

Только зарегистрированные пользователи могут оставлять комментарии. Войдите, пожалуйста.

Самое читаемое Разное