Кто и как зарабатывает на открытых государственных финансовых данных?

    image

    Кадр из к/ф «Приключения Буратино». «Беларусьфильм», Творческое объединение «Телефильм».

    Открытые данные и коммерческие проекты


    Открытые данные обсуждаются уже давно. Я лично занимаюсь продвижением этой темы уже более 7 лет, а многие энтузиасты по всему миру продвигают идеологию открытости чуть ли не всю свою сознательную жизнь.

    Да, открытые данные приносят много явной и неявной пользы для общественных инициатив. Данные по движению транспорта в реальном времени помогают гражданам лучше планировать логистику своих передвижений. Данные деклараций чиновников помогают создавать общественные проекты по прозрачности госслужбы и при этом не тратить огромные ресурсы на оцифровку и распознавание деклараций, заполненных от руки. Можно привести ещё много примеров того, как открытые данные помогают гражданам и государству.

    При этом многие в последнее время говорят и про заработок на открытых данных. Но каждый раз, когда я слышу об этом от выступающих аналитиков, хочется их спросить: почему же вы рассказываете о том, как могут заработать другие, но не делаете этого сами? Где же все те, кто непосредственно зарабатывает на открытых данных? Почему они так непубличны? Почему владельцы и создатели проектов так редко бывают представлены широкой публике?

    Причин множество, и я приведу лишь некоторые из них:

    • предприниматели не хотят привлекать внимание конкурентов и чиновников. Когда представители реальных проектов начинают рассказывать о том, как они зарабатывают, то они привлекают внимание и конкурентов, и тех, кто предоставляет им данные (чиновники). Есть веские опасения, что чиновники начнут не открывать данные, а, наоборот, будут искать способы их делать не совсем открытыми, чтобы снимать ренту с тех, кто хочет эти данные получить,
    • СМИ не любят писать о коммерческих проектах на данных. Российские СМИ очень редко пишут про стартапы, основанные исключительно на информационном бизнесе. Переупаковка информации в сервисы и последующая их продажа требует понимания того, откуда данные берутся и что с ними делать. В России технологической журналистики мало, а журналистов, готовых писать о стартапах, основанных на открытых данных, ещё меньше,
    • бизнес ничего не знает про открытые данные. Как ни странно, но создатели многих проектов, зарабатывающих на данных, не знают, что это именно “открытые данные”. Некоторые из них используют базы данных, собираемые с госсайтов ещё с начала 2000-х годов, и за этой время их бизнес-модель поменялась несильно. Вместо выгрузки баз используется скрейпинг и переупаковка информации из веб-страниц в базы данных.

    В мире случаи открытых данных активно рассматриваются. Есть два знаковых проекта — OpenData500 и Open Data’s Impact. Они собирают примеры того, как открытые данные приносят выгоду и меняют мир. Оба проекта — это результат исследований небольшого экспертного центра The GovLab.

    В России никто и никогда таких исследований не проводил. Как бы странно это ни казалось, но за всё время существования Открытого правительства (да и просто Правительства РФ) времени и ресурсов на финансирование такой работы у них не находилось.

    Но мы в Инфокультуре так или иначе занимаемся этой темой и работаем над собственным докладом об открытости финансовых данных в России. Что же туда войдёт?

    Кто и как зарабатывает на открытых государственных финансовых данных?


    Не секрет, что в России публикуется очень и очень много финансовых данных. Причём большая часть этих данных публикуется органами власти. К ним можно отнести Минфин России, Федеральное Казначейство, Федеральную налоговую службу и, отчасти, Центральный банк, который формально не орган власти, но орган с сильным влиянием государства на него.

    Какие данные публикуются?

    • Госзакупки, госконтракты, планы закупок, тендерные документы и многие другие базы по этой теме;
    • Бюджеты, проекты бюджетов, данные об организациях — участниках бюджетного процесса;
    • Налоговая, бюджетная и финансовая статистика;
    • Данные по государственному долгу, суверенных обязательствах, фондах и т.д.

    Этих данных очень и очень много. Но как найти тех, кто их использует? Как понять, сколько они на этом зарабатывают?

    В ряде тем это практически невозможно. Например, Минфин ведёт и предоставляет в открытом доступе официальный реестр аудиторских организаций.

    Как узнать какую прибыль приносит этот реестр Яндексу, у которого есть раздел “Аудиторские организации в Яндекс.Справочнике” или проекту “Audit-it”, который ведёт реестр аудиторских организаций? С высокой степенью вероятности ответить на этот вопрос невозможно, поскольку эти данные дополняются другими и смешиваются для создания новых продуктов или для интеграции в существующие.

    Поэтому в качестве первого приближения мы решили рассмотреть проекты на открытых финансовых данных в области госзакупок.
    Мы проанализировали 48 интернет-проектов, использующих открытые данные закупок и контрактов. Из них 16 мы отбросили по причине какого-либо отсутствия выходных данных и детально рассмотрели 32 коммерческих и некоммерческих продукта, по которым доступны контакты и реквизиты организаций, создавших и продающих данные продукты.

    Вот бизнес-модели, которые мы обнаружили:

    • услуги поиска и подписки на анонсы закупок для поставщиков;
    • услуги бизнес-разведки и проверки контрагентов;
    • сервисы по мониторингу средних цен для заказчиков и поставщиков;
    • сервисы для госзаказчиков по расчету начальной максимальной цены;
    • услуги маркетинговых исследований;
    • выполнение работ по госконтрактам, требующих базы госзакупок и госконтрактов;

    В итоге все проанализированные проекты были классифицированы нами по следующим категориям:
    Категория Число проектов
    Сервисы поиска тендеров и организации подписки поставщиков на анонсы закупок 19
    Проверка информации о контрагентах 5
    Анализ средних цен и установление начальной максимальной цены 5
    Общественный контроль 3

    Были выявлены два вида компаний, использующих открытые данные о государственных и муниципальных расходах.

    К первому виду компаний можно отнести предприятия, бизнес-модель и выручка которых основаны только на открытых данных — использование этих данных составляет неотъемлемую часть их бизнеса. Пример, такие проекты как Закупки360 и TenderLand, предоставляющие сервисы подписки на тендеры.

    Ко второму виду компаний относятся предприятия, использующие открытые данные как существенное дополнение к уже существующим коммерческим продуктам, однако при их отсутствии они всё ещё могут продолжить развивать собственные продукты.

    По результатам исследования были выявлены следующие показатели:

    • около 500 миллионов рублей – экспертная оценка выручки всех компаний, зарабатывающих только на открытых данных госзакупок и госконтрактов,
    • от 200 до 500 миллионов рублей – экспертная оценка выручки компаний по проверке контрагентов, использующих данные о торгах.

    Общая экспертная оценка выручки компаний, использующих открытые данные о государственных и муниципальных расходах, составляет около 1 миллиарда рублей.

    Речь идет, например, о таких продуктах, как ФИРА, Спарк.Интерфакс и Контур.Фокус, позволяющих проверять контрагентов, включая информацию об их закупках и контрактах.

    Полный список компаний и их бизнес-моделей мы опубликуем к тому времени, когда завершим наш доклад. Пока же вопрос в том, какие ещё проекты есть в мире и что делать в России?

    Зарубежные проекты


    Если в России коммерчески успешные проекты и продукты на открытых финансовых данных сосредоточены в области госзаказа, то в других странах большее разнообразие. Такие проекты как ClearGov и OpenGov сфокусированы на SaaS решениях по визуализации бюджетных данных для муниципалитетов в США. Это небольшие стартапы, ориентированные именно на качественную визуализацию бюджетных данных. Или же такие компании как Avalara, предоставляющие программные продукты для автоматизации заполнения налоговых деклараций.

    Многочисленные проекты используют данные SEC.gov (Комиссии по ценным бумагам) для отслеживания информации о публичных компаниях. Такие проекты, как Google Finance и Yahoo Finance, основаны именно на этих данных.

    Конкурс BudgetApps


    В России сложность не только с тем, чтобы использовать данные (они есть, но не всегда доступны в удобном виде). Но и в поиске стартовой точки для создания своего проекта.

    Чтобы помочь в решении именно этой проблемы мы в “Инфокультуре” уже второй год помогаем Минфину России в проведении конкурса BudgetApps специально для тех, кому нравится считать чужие деньги, чтобы приумножать свои собственные. В этом году есть номинации для программистов, журналистов и дизайнеров и есть возможность не только выиграть приз, но и привлечь внимание к своему проекту.

    Почему нам это интересно? На протяжении последних нескольких лет мы делаем проект Госзатраты, в котором не только собираем данные по госконтрактам, но и даём удобный интерфейс для работы с ними, и публикуем данные в виде API и наборов данных. Для тех, кто хочет создавать новые проекты, ориентированные не только на деньги, но и на общественный контроль за госрасходами, наши данные могут быть очень кстати.

    Впрочем, не отвлекаясь от стартапов и бизнеса: какие идеи в России могут быть востребованы и какие могут быть монетизированы?

    Идеи, которые можно монетизировать


    1. Аналоги ClearGov.com и OpenGov.com. У нас в стране более 24 тысяч муниципалитетов и им, как ни странно, можно продавать сервисы визуализации их бюджетов. Также их можно продавать кандидатам в губернаторы, мэры и не только. Это инструменты политики и общественного блага. Не без выгоды для создателей, конечно.
    2. Крутая инфографика может быть успешно коммерциализирована. И такие продукты как Death & Taxes (Timeplots) — один из очень успешных примеров монетизации данных в виде объектов реального мира.
    3. Ещё-один-сервис-подписки на тендеры. Да, их много. Но кто знает, может именно ваш сервис станет новым стандартом удобства и открытости государственных финансовых данных.

    Экспериментируйте, тестируйте, мы готовы помочь с консультацией, подсказать, где какие данные брать и как с ними работать. Можете начать с участия в одном из наших бесплатных хакатонов этим летом, которые будут специально организованы, чтобы помочь участникам конкурса BudgetApps определиться с темой и подготовить достойную заявку.
    Метки:
    «Информационная культура» 64,64
    Открытое государство и открытые данные
    Поделиться публикацией
    Комментарии 20
    • +5
      У друзей украли машину, они естественно сообщили об угоне в полицию и т.к. кража произошла недавно, устраивают перехват. Через некоторое время раздается звонок и неизвестный сообщает что это он угонщик и за 100т. рублей сообщит где стоит машина. Хорошо что знакомые не поддались панике и не поторопились перевести незнакомцу денег а попросили показать фотографию автомобиля под предлогом что с машиной все в порядке. Преступник начал сразу же явно увиливать, мол вы что не знаете как выглядит ваша машина. А после гугления ситуации стало понятно, преступники мониторят сообщения об угонах, выясняют персональные данные, и звонят жертвам с предложением оплатить воздух.
      • –3
        СРОЧНО ЗАПРЕТИТЬ!
        • +3
          Идея монетизации — агрегатор сообщений об угонах, с крутой визуализацией и дальнейшей продажей подписки таким нерадивым вымогателям.
          • +3
            Не самая этичная монетизация, често скажем
          • +3
            Даже это не повод для запрета публикации подобной информации. Это повод для повышения эффективности работы полиции
            • +1
              Но проблема не в открытых данных, а в мошенниках, разве нет?
              С тем же успехом можно звонить людям: ваш сын/дочь сбили человека или попали в полицию с наркотиками, срочно переведите деньги и мы их отпустим.
              В каком-то российском фильме целую ферму таких обзвонщиков показывали, и маму владельца такой фермы «развели» то ли его собственные сотрудники, то ли «коллеги».
              • 0
                Банально просто, они мониторят радиоэфир. К коррупции это никакого отношения не имеет.
              • +2
                Если убрать все что связано с госзакупками, то не так уж и много на все остальное приходится.
                • +1
                  На самом деле совсем не так, есть много примеров других областей. Стартап Metaweb работавший на открытых данных Википедии и др. был куплен Гуглом, по моему, где-то в 2007 году.

                  Есть большой отчёт МакКинзи за 2013 год где как раз подробно приведены примеры из десятка областей http://www.mckinsey.com/business-functions/business-technology/our-insights/open-data-unlocking-innovation-and-performance-with-liquid-information
                  • +1
                    думаю, что вопрошающий имеет в виду российскую статистику
                    • 0
                      В чистом виде на открытых данных наверняка нет продуктов. А так чтобы их использовали с коммерческими целями — такого очень много. Но измерить это сложно
                      • 0
                        Что если вы предоставите таким предпринимателям возможность кратенько рассказать о себе на добровольной основе, м.б. анонимно, но с возможностью перепроверки. Наверно это помогло бы всем сторонам.
                        • +1
                          По формату это исследование с анонимизированными опросами. Они гораздо более трудоёмкие чем внешний анализ сервисов/продуктов или же рассылка форм опросов. Безусловно делать это нужно, но это как раз та работа которая очень непроста без финансирования.
                • 0
                  В компании, опирающейся на открытые гос данные лично меня бы смущало отсутсвие гарантий, что мои исходные данные будут своевременно обновляться и не поменяют формат. Специфичная для России проблема еще в том, что министерства очень ловко переименовываются и переформировываются, а новые структуры могут обязательства по публикации данных и не унаследовать.
                  • +1
                    Недавний пример.

                    Если вкратце, человек проанализировал открытые данные Нью-Йоркского департамента полиции о штрафах за неправильную парковку и нашел много неправильно выписанных штрафов. После изменения правил несколько лет назад некоторые места, ранее запрещенные для парковки, стали разрешенными. Но штрафы полицейские продолжали выписывать. В датасете указано местоположение, он нашел места, где больше всего штарфов, на Google Street View и убедился, что парковка там законна.

                    Он написал обо всем в полицию. Через пару недель пришел ответ, в котором его благодарили за находку, объясняли, почему так получилось (не всех обучили новым правилам) и обещали провести дополнительное обучение для сотрудников.

                    Я когда прочитал это, долго не мог поверить в искренность ответа полиции. Да и до сих пор гложут сомнения, если честно.
                    • 0
                      обещали провести дополнительное обучение для сотрудников

                      это все конечно хорошо… а штрафы вернуть? :D
                      • 0
                        В Нью Йорке есть живая политика и сменяемость мера/главы полиции + очень активные СМИ. Скорее всего искренне ответили, но точно также искренне закрывали на это глаза до.
                        • 0
                          Скорее всего искренне ответили и скорее всего ничего не изменится.
                      • 0
                        В статье явно не хватает информации о победителях последнего конкурса BudgetApps — описания продута-победителя, а так же родственных продуктов то го же разработчика.

                        Именно на открытых данных ФК по бюджетам реализовано первое и по моей информации единственное в России приложение для визуализации и мониторинга финансовой информации E-budget. Оно на мой взгляд заслуживает отдельной статьи на Хабре.
                        • +1
                          Может я не прав, но, имхо, идея строить бизнес на том, на чем ты в принципе не имеешь контроля и полагаться на материал одного монополиста неизвестного качества — чертовски плохая идея.

                          Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                          Самое читаемое