Шрифт:
Получив интересующие вас данные, вы можете изучать их, сортировать, визуализировать, сравнивать и выполнять любые другие аналитические действия с вашей копией данных. Вы можете опубликовать ваш анализ, который может содержать любые данные. Популярное выражение «факты бесплатны» (как и выражение «свобода слова») имеет глубокий смысл, однако, возможно, оно является просто популярным выражением для тех, кто слишком много думает о правовой стороне баз данных или даже об управлении данных.
Что, если, являясь или стремясь быть хорошим журналистом, работающим в сфере данных, вы намереваетесь опубликовать не только ваш анализ, включающий некоторые факты или отдельные данные, но и наборы/базы данных, использованные вами в подготовке анализа и добавленные к нему? Или, может быть, вы являетесь просто смотрителем данных и никак не анализировали их — в конце концов, смотрители данных тоже нужны. Если вы используете данные, собранные каким–то другим лицом, то можете столкнуться с определенными проблемами. (Если база данных собрана полностью вами, все равно прочитайте следующий абзац для мотивации описываемого далее распространения данных.)
Вы, должно быть, знаете, как авторское право защищает творческий труд: если владелец авторского права не давал разрешения на использование работы (или если работа является общественным достоянием, или ваше использование попадает под исключения или ограничения, например, положения о добросовестном использовании), а вы ее все равно используете — распространяете, исполняете и т. д., владелец авторского права может заставить вас прекратить делать это. И, несмотря на то, что факты сами по себе бесплатны, коллекции фактов могут охраняться таким же образом, хотя соответствующие законы являются более разнообразными, чем законы об авторском праве на творческие работы. Кратко говоря, база данных может быть объектом авторского права, как творческая работа. Во многих юрисдикциях применяется принцип «труда автора», по которому сам факт создания базы данных, даже без приложения творческих усилий, делает эту базу данных объектом авторского права. В Соединенных Штатах, однако, имеется тенденция установления более высокого уровня минимальной творческой составляющей, необходимой для применения авторского права (классическим примером является дело «Feist против Rural» — спор о признании авторского права на телефонную книгу). Однако в некоторых юрисдикциях существуют права на базы данных, защищающие эти базы, при этом эти права не являются авторскими правами (хотя зачастую области, на которые эти права распространяются, пересекаются друг с другом, особенно в тех случаях, когда необходимый для признания авторского права минимальный уровень творчества практически отсутствует). Самым распространенным примером является применяемые в Европейском Союзе права на базы данных «sui generis». Так что, особенно если вы находитесь в Европе, вам может понадобиться разрешение на публикацию базы данных, полученной от другого лица.
Несомненно, эти ограничения не способствуют развитию экосистемы журналистики в сфере данных (не приносят они пользу и обществу в целом — социологи и другие исследователи уже говорили ЕС об этом еще до того, как появились права на базы данных «sui generis», и проводящиеся с тех пор исследования подтверждают их правоту). К счастью, вы, публикуя базу данных, можете снять эти ограничения (при условии, что база данных не содержит элементов, на публикацию которых вы не вправе предоставлять разрешения), в частности, предоставляя разрешения заблаговременно. Вы можете сделать это, издав вашу базу данных по общедоступной лицензии или объявив ее всеобщим достоянием — наподобие того, как это делают многие программисты, выпуская свободное программное обеспечение с общедоступными (открытыми) исходными кодами, с тем чтобы все желающие могли использовать их код (т. к. журналисты, работающие с данными, часто работают и с кодами, вам следует снять ограничения и с вашего кода, чтобы вашу коллекцию данных и аналитику можно было переопубликовывать). Можно назвать много причин, по которым вам следует открывать свои данные. Например, ваша аудитория может создать новую визуализацию или приложения, на которые вы можете затем ссылаться, как, например, делает Guardian, располагая сообществом визуализации на ресурсе Flickr. Ваши наборы данных могут быть объединены с другими наборами данных, что позволит вам и вашим читателям более широко взглянуть на изучаемую проблему. То, что сделают другие пользователи с вашими данными, может привести вас к новой статье или дать вам идеи для новой статьи либо нового проекта в сфере данных. И, конечно, все это принесет вам всеобщее уважение.
Рис 65. Open Data badges (Open Knowledge Foundation)
Когда автор понимает, что издание работ с общедоступными лицензиями является необходимостью, возникает вопрос: какую лицензию применить? Ответ на этот непростой вопрос зачастую будет зависеть от проекта или сообщества, на работу которого вы опираетесь, либо которому вы планируете предоставить вашу работу — используйте ту лицензию, которую использует это сообщество. Если вам нужно копать глубже, начните с открытых и свободных лицензий — означающих предоставление разрешения на использование всем желающим (может требоваться указание автора и распространение на таких же условиях). То значение, которое имеют для программного обеспечения такие понятия, как «Определение свободного программного обеспечения» и «Определение Open Source» (Открытого программного обеспечения), имеет Определение открытой информацииработы и устанавливает права, предоставляемые пользователям открытыми лицензиями.
На веб–сайте Open Knowledge (Открытая информация) вы можете найти список таких лицензий. В целом эти открытые лицензии делятся на три класса:
Объявление всеобщим достоянием, что является лицензией, предоставляющей максимальный объем разрешений; использование работы не ограничивается никакими условиями.
Разрешающие лицензии или лицензии, требующие указания авторства; единственным основным условием является указание автора работы.
Копилефт, перекрестные лицензии или лицензии, предусматривающие дальнейшее распространение на тех же условиях.
Если вы используете набор данных, опубликованный другим лицом на условиях открытой лицензии, то можете считать предыдущий абзац очень кратким руководством по выполнению условий этой открытой лицензии. Чаще всего вам придется сталкиваться с лицензиями, созданными организациями Creative Commons и Open Data Commons, а также различными правительствами, во всех этих лицензиях обычно имеется раздел, в котором находятся все основные условия лицензии. Обычно лицензия указывается на странице, с которой можно скачать (или «выскрести», т. к., несомненно, веб–страницы могут содержать наборы данных) базу данных, либо на видном месте в самой базе данных, в зависимости от формата. Эти обозначения должны нанести и вы, открывая свои наборы данных.
Возвращаясь к началу, зададим вопрос: что, если нужной вам базы данных нет в Интернете или доступ к ней каким–то образом контролируется? Подумайте о том, чтобы не просто попросить доступ для себя, но и попросить открыть эти данные всему миру для их использования. Вы можете рассказать владельцам данных о том, какие замечательные вещи могут произойти с их данными, если они сделают это.
Вместе с тем, открытие данных всему миру может привести к тому, что к ним станут применимы положения о неприкосновенности личной жизни и другие норма. Действительно, тот факт, что открытие данных снимает многие технические барьеры и ограничения, связанные с авторскими правами, не означает, что вы не должны соблюдать иные применимые законы. Однако так было всегда, кроме того, существуют замечательные инструменты и меры защиты журналистов, если ваш здравый смысл подскажет вам, что эти данные необходимо исследовать.
Удачи вам! Хотя, вероятнее всего, удача больше понадобится вам для выполнения других аспектов вашего проекта, а не для регулирования (низких) правовых рисков.
— Майк Линксвайер, Creative Commons
Трактование данных
Получив данные, что вы будете с ними делать? На что нужно обращать внимание? Какие инструменты использовать? В данной главе мы познакомим вас с некоторыми идеями о том, как можно повысить грамотность в сфере данных, подскажем, как работать с цифрами и статистикой, и расскажем, о чем следует помнить, работая со спутанными, некачественными и зачастую недокументированными наборами данных. Мы научимся писать статьи на основе извлекаемой из данных информации, изучим основные инструменты журналистов, работающих с данными, и рассмотрим, как использовать визуализацию данных для проникновения в суть рассматриваемой проблемы