Pull to refresh

Трансфер открытых данных

Reading time 10 min
Views 4.9K
Реальным и важнейшим мотивом публикации данных в свободном режиме является необходимость поиска новых решений, новых методов, моделей и технологий – новых знаний в обозначенной предметной области.



Свободное и открытое распространение данных (открытая публикация) – это частный случай системы транзакционного целевого обмена информацией между двумя субъектами при которой первый передает информацию второму в соответствии с договорённостью (контрактом).

Рассмотрев мотивацию открытых данных попробуем разобраться в сути самого процесса передачи данных неограниченному или условно-ограниченному кругу лиц и выделим его отличительные особенности в сравнении с закрытой схемой.

В современной «информатизированной» экономике без обмена информацией, а в частности цифровыми данными, поддерживать менеджмент на высоком уровне уже практически невозможно.

Причем роль интенсивного обмена данными постоянно возрастает за счет ряда факторов:

  1. Цифровизация экономики: данные охватывают всё больше аспектов хозяйственной и социальной деятельности человека.
  2. Большие данные: количество и плотность данных растет постоянно и неуклонно.
  3. Всё подключается к глобальной сети связи: в единой информационной сети множество генераторов и потребителей разнообразных цифровых структурированных данных.
  4. Мобильность информации: информация (и цифровые данные в частности) быстро создаются и распространяются как копированием, так и ссылками и становятся доступными в любой географической точки, где есть доступ в Интернет.
  5. Гибкие сообщества: работа с данными организуется разными способами и уровнями в рамках активно формирующихся и трансформирующихся в сети формальных и неформальных сообществ, а те в свою очередь создают и перераспределяют новые первичные и вторичные данные и распространяют их.
  6. Открытое взаимодействие: нацеленность на вовлеченность как отдельных граждан, так и профессиональных сообществ или бизнесов в формирование эффективной социально-справедливой и гарантирующей безопасность системы регулирования и контроля совместной деятельности граждан и их социальных групп.


Учитывая активное давление приведенных факторов, экономические субъекты, в рамках собственных потребностей в данных, вынуждены решать для себя несколько важных вопросов:

— где взять данные? – выбор источников данных;
— какие данные нужны? – оценка и фильтрация состава (содержимого) данных;
— как управлять данными? – применение техники и инструментов;
— что делать с данными? – выбор и использование методологий и технологий;
— в чем преимущество данных? – поиска лучшего решения на основе данных;
— какие риски связаны с данными? – оптимизации работы с данными по издержкам и результативности (последствиям).

И конечно же, отвечая на подобные вопросы неизбежно встает технологическая проблема обмена данными с выбранным кругом контрагентов, государственных организаций, потребителей, поставщиков, конкурентов, экспертов, сообществ. Решением такой проблемы являются механизмы передачи данных между двумя и более субъектами, которые реализуются в рамках разнообразных платформ, систем, протоколов и т.п.

Договоримся обозначать термином «трансфер данных» передачу данных от одного субъекта другому с помощью таких механизмов в соответствии с заданным контрактом.

Трансфер данных (data transfer) – передача данных одним субъектом (поставщиком) другому субъекту (получателю) в соответствии с оговоренными условиями (контрактом) для совместной или параллельной реализации экономических, маркетинговых и управленческих целей (задач).

Несколько элементарных примеров трансфера данных
Бизнес регулярно передает данные в государственные налоговые органы для исчисления и проверки налоговых платежей в соответствии с законодательством – это трансфер данных от хозяйствующего субъекта государству.
Потребитель передает свои паспортные данные для оформления кредитного договора с банком по нормам закона о коммерческих банках и по правилам самого кредитного учреждения – это трансфер данных от гражданина банку.
Служба государственной статистики публикует данные по безработице на собственном сайте в Интернете – это трансфер данных от государства бизнесу и гражданам, находящимся в поиске нового места работы.

Прямое влияние на развитие и повышение эффективности инструментов, технологий, качества и объемов трансфера данных оказывают три ключевые задачи, стоящие перед информационным менеджментом:

  1. Задача увеличения объема используемых данных в менеджменте.
  2. Задача развития и усложнения целей, решаемых на основе данных.
  3. Задача повышения эффективности управления данными.

Но каждая из указанных задач по-своему решается исходя из типа и назначения используемых данных с учетом исполняемых субъектом ролей в процессе трансфера.

При рассмотрении схемы трансфера данных или даже немного выходя за её рамки, стоит различать девять ролей субъектов-участников:

  1. генератор (автор) данных – субъект, который непосредственно создает данные;
  2. владелец данных – субъект, который обладает признаваемым правом собственности на данные;
  3. поставщик (издатель) данных – субъект, который отдает данные;
  4. получатель данных – субъект, который принимает данные;
  5. потребитель данных – субъект, который заинтересован в получении данных;
  6. переработчик данных – субъект, который принимает и обрабатывает данные;
  7. контролер данных – субъект, который проверяет данные при передаче;
  8. регулятор передачи данных – субъект, который определяет правила и процедуры передачи данных;
  9. координатор передачи данных – субъект, которые помогает передавать данные и/или частично управляет процедурами передачи данных.

В простом случае первые три роли (1-3) реализуются одним субъектом, а следующие три роли (4-6) реализуются другим субъектом.

Если получатель данных проходит идентификацию, аутентификацию, последующую авторизацию по операции получения конкретного набора данных и ограничен в использовании набора данных, то речь идет о закрытой или защищенной (protected) схеме трансфера данных.

Это означает, что поставщик непосредственно передает получателю из ограниченного, идентифицированного и доверенного круга лиц конечный и известный набор данных в соответствии с двусторонним соглашением (контрактом) о количестве, качестве данных и способе их отправки-получения.

Если получатель данных не проходит идентификацию или проходит формальную идентификацию и не проходит авторизацию при операции получения конкретного набора данных и не ограничен в последующем использовании набора данных, то речь идет о публичной (public) схеме трансфера данных.

Это означает, что поставщик непосредственно или опосредовано передает получателю из неограниченного или формально ограниченного, не идентифицируемого или формально идентифицируемого круга лиц заданный набор данных в соответствии с публичным соглашением (контрактом) о количестве, качестве и способе их передачи, к которому получатель присоединяется.

Несколько ключевых моментов для сравнения двух схем трансфера данных:

Protected-схема


  1. Получатель идентифицируется и проходит аутентификацию
  2. Доступ к данным осуществляется после авторизации получателя данных
  3. Формат и содержимое данных подготавливаются особым образом
  4. Условия передачи данных согласованы сторонами в закрытом виде (документе)
  5. Применяется специальная защита данных и каналов их передачи



Public-схема


  1. Получатель анонимен или идентифицирован формально
  2. Доступ к данным не требует авторизации или требует формальную авторизацию
  3. Формат и содержимое данных подготавливаются стандартным образом
  4. Условия передачи декларируются поставщиком данных
  5. Защита данных и каналов передачи не применяется или минимальна



Защищенная схема трансфера данных применяется, например:

  • для обмен данными с экономическими партнерами (потребителями, дилерами, дистрибьюторами, поставщиками, аутсорсинговыми компаниями);
  • для передачи учетных данных в государственные регулирующие и контролирующие органы;
  • для отраслевого коммерчески значимого информационного партнерства (саморегулируемые организации, ассоциации, партнерства, консорциумы);
  • как внутрисубъектная (корпоративная) передача коммерческих данных: междивизиональная, трансграничная и т.п.

При этом, protected-схема имеет следующие особенности:

  1. Закрытые схемы и протоколы обмена.
  2. Усиленные процедуры безопасности.
  3. Высокие требования к достоверности информации.
  4. Неизменяемый формат и состав данных.
  5. Согласованные или нормативные условия обмена данными (двусторонний контракт).
  6. Единая или совместимая на высоком уровне информационная система поставщика и получателя данных.
  7. Высокие риски при «утечке» данных в процессе обмена.
  8. Особая коммерческая (экономическая) ценность данных.

В противоположность защищенной, публичная схема трансфера данных применяется в том числе:

  • для обмена данными с вторичными (конъюнктурными) экономическими субъектами;
  • для передачи данных на общественное ознакомление и контроль;
  • для открытого информационного взаимодействия с отраслевыми и непрофильными ассоциациями и экспертами (проведение специальных мероприятий);
  • как корпоративная открытая социальная сеть (напр., обмен данными с коллегами и активными клиентами).

Такое применение объясняет особенности public-схемы:

  1. Открытые процедуры и протоколы обмена.
  2. Простые процедуры безопасности.
  3. Доверительная достоверность информации.
  4. Постоянный контроль формата и состава данных получателем.
  5. Декларируемые условия обмена данными (контракт присоединения).
  6. Гипотетическая несовместимость информационных систем поставщика и получателя данных.
  7. Снижение рисков при «утечке» данных за счет их предварительной фильтрации и агрегирования.
  8. Данные обладают слабой или неопределенной коммерческой ценностью.

Каждый из вариантов схемы передачи данных является полезным для той или иной задачи и конкретный выбор зависит от поставленной цели.

Главным же критерием выбора между защищенной и публичной схемами конечно же является ценность самих данных. Если это данные, которые определяют конкурентное преимущество бизнеса (организации) или вообще являются его коммерческой тайной, то public-схема не может рассматриваться как приемлемая, даже если распространение данных предполагается среди широкого круга лиц (партнеров).

Следует учитывать и понимать, что данные передаваемые публично – это:

  • данные, при публикации которых неизвестно или до конца непонятно, как и для каких целей будет их использовать получатель;
  • данные, которые подлежат распространению не среди конкретных лиц, а среди условно-ограниченного или не ограниченного вовсе множества пользователей;
  • данные, в отношении которых не предполагается контроль количества сделанных копий;
  • машиночитаемые валидные данные;
  • пригодные для обработки (анализа) и дальнейшего использования данные (т.е. представляющие некоторый осмысленный набор информации по конкретному предмету);
  • данные, которые явно или неявно сопровождаются метаданными, определяющими: схему или модель данных, оценку качества данных, целевое назначение;
  • данные ссылающиеся на контекст (или дающие такую отсылку);
  • человеку-понятные при чтении данные (иногда).

Данные в открытом доступе для большого числа потребителей должны обладать определенной степенью «независимости» и «самостоятельности».

Это связано с тем, что поставщик данных не будет иметь возможности разъяснять каждому пользователю их назначение, состав, качественную характеристику и т.п. Кстати, здесь встает вопрос сопровождения публичных данных такими же публичными метаданными.

И, ещё раз…

Публичная схема трансфера данных – это плохая схема для передачи данных составляющих коммерческую или государственную тайну, а также специальных данных, распространение которых ограничено действующим законодательством.

Public-схема трансфера данных – это и есть способ публичного «открытия» данных для большого числа не идентифицируемых пользователей.


Оставим в стороне тему защищенного обмена данными, тем более, что большая и важная их часть сводится к инструментам и технологиям защиты каналов связи, алгоритмам надежного шифрования при передаче, защите целостности и т.п.

Открыто публикуемые данные не обязательно должны совершенно не иметь ограничений по использованию.

Даже скорее наоборот. Публичные данные обязательно имеют ряд ограничений, в том числе юридических оговорок. Самое простое из них обычно доступно прямо или по ссылке внизу страницы для скачивания открытого набора цифровых данных и звучит оно примерно так: «пользователь данных должен указывать ссылку на источник открытых данных». Это лишь один из обязательных юридических аспектов относящийся к публикуемым открыто данным. Что-то регулируется на законодательном уровне, а что-то на уровне корпоративных регламентов.

Но в отношении свободно распространяемых данных правовое регулирование скорее играет разрешительно-разъяснительную роль. Строгое лицензирование и жесткое авторское право не имеет особого смысла применять к цифровым данным, публикуемым для широкого круга потребителей. Какой вообще тогда смысл передавать данные открыто, если вы все равно не сможете полноценно контролировать исполнение условий выдаваемых лицензий или авторских соглашений.

Данные на свободный трансфер должны быть всегда действительно свободными для распространения.

В любом случае поставщик никогда не сможете стопроцентно проконтролировать количество сделанных потребителем копий.

А надо ли как-то для открыто публикуемых данных ссылаться на свободные лицензии типа Creative Commons Attribution?
Вопрос не однозначный. Каждый издатель сам вправе ответить на него исходя из собственной правовой позиции. Но, опять же, не забываем о главной мотивации безвозмездного раскрытия данных. Поставщик данных публикует их свободно не для того, чтобы затем когда-нибудь и как-нибудь преследовать пользователей. Если данные открываются, значит с ними разрешается делать почти всё что угодно. И никакие уговоры в виде сложных юридических изысканных документов не помешают получателю данных как-то «по-своему» их обработать, проанализировать и передать третьему лицу. Издателю же проще всего в понятной форме изложить то, как он видит использование опубликованных им данных и что он ожидает от добросовестных пользователей.

Потенциальная возможность как-то ограничить использование данных передаваемых публично существует – это декларирование ограничений. Причем можно объявить ограничения как на доступ к данным, так и на использование данных.

Ограничение доступа к данным (варианты):

  1. «избранные» – доступ получают только некоторые лица, которые входят в целевые (отраслевые) экспертные сообщества, ассоциации, организации и т.п. (но при этом они не ограничиваются во вторичной передаче данных по public-схеме);
  2. «правильные» – доступ получают только лица, которые соглашаются выполнять заданные поставщиком условия и/или соответствуют квалификационным требованиям поставщика;
  3. «все» – доступ имеют любые заинтересованные в данных пользователи, фактически отсутствие какого-либо ограничения.

Ограничение использования данных (варианты):

  1. «как условлено» – данные могут быть использованы только на установленных поставщиков условиях в отдельном документе;
  2. «как свободные» – данные могут быть использованы свободно, а за копию данных не должна взиматься плата;
  3. «как угодно» – данные могут быть использованы без каких-либо ограничений, в том числе даже их копии могут передаваться за плату.

Но все эти ограничения являются условными и только лишь декларируются – формализуются и заявляются – поставщиком данных. Ряд технологических инструментов, конечно же, позволяет установить контроль исполнения заданных ограничений, но только в каких-то реальных пределах. Значительные ограничения просто переведут данные из разряда публично доступных в защищенные.

Кстати, цель обязательной ссылки на источник открыто опубликованных данных, которую вынуждены требовать поставщики – установить прямую связь между публичными данными и созданным на их основе решением (знанием, продуктом, сервисом и т.п.). Ссылка на источник цифровых данных позволяет получить важную обратную реакцию аналитиков и пользователей. Она является простейшим способом контролировать варианты использования бесплатно-распространяемых данных.

Если вернуться к определениям открытых данных, которые были приведены в предыдущей публикации, то в них отсутствует указание на субъект, который их раскрывает. Предполагается, что свободно распространять данные может кто угодно. Скорее всего для социального, культурного или политического значения действительно нет разницы, кто опубликовал данные: государство, бизнес или гражданин. Но с точки зрения экономических взаимоотношений и конкурирующих рынков – это представляется важным.

P.S. Настоящая публикация продолжает тематическую серию по открытым данным, начатую в статье Почему данные могут быть открытыми и бесплатными и является исключительно авторской точкой зрения не претендующей на истину в последней инстанции.
Tags:
Hubs:
+7
Comments 2
Comments Comments 2

Articles