Русская Википедия:Открытые данные

Материал из Онлайн справочника
Перейти к навигацииПерейти к поиску

Файл:Linking-Open-Data-diagram 2007-09.png
Проект Linking Open Data в сентябре 2007
Файл:Open Data stickers.jpg
Чёткое указание лицензионных условий — ключевой компонент открытых данных и иконки вроде тех, которые показаны здесь, используются для этой цели.

Открытые данные (Шаблон:Lang-en) — концепция, отражающая идею о том, что определённые данные должны быть свободно доступны для машиночитаемого использования и дальнейшей републикации без ограничений авторского права, патентов и других механизмов контроля.

Освободить данные от ограничений авторского права можно с помощью свободных лицензий, таких как лицензий Creative Commons. Если какой-либо набор данных не является общественным достоянием, либо не связан лицензией, дающей права на свободное повторное использование, то такой набор данных не считаетсяШаблон:Кем открытым, даже если он выложен в машиночитаемом виде в Интернет.

Обзор

Цели движения открытых данных похожи на другие «открытые» движения, такие как открытое программное обеспечение (open source), открытый контент (open content) и открытый доступ (open access). Рост популярности идеи об открытых данных во второй половине 2000-х годов связан, прежде всего, с запуском правительственных инициатив, таких как Data.gov.

Открытые данные часто ассоциируются с нетекстовыми материалами такими как карты, геномы, химические компоненты, математические и научные формулы, медицинские данные, данные о биологическом разнообразии. Проблемы чаще всего возникают по той причине что эти данные могут быть коммерчески ценными или могут быть собраны в некие ценные продукты.

Доступ к данным, как и последующее их использование, контролируется организациями — государственными и частными. Контроль может быть через ограничения, лицензии, копирайт, патенты и требования оплаты для доступа или повторного использования. Сторонники идеи «открытых данных» считают, что подобные ограничения идут против общественного блага и данные должны быть доступны без ограничений или оплаты. Также важно что данные должны быть доступны без последующих запросов на разрешение, хотя и способы повторного использования, такие как создание продуктов на базе данных, могут контролироваться лицензией.

Источники

Открытые данные могут поступать из различных источников. Однако наибольшие массивы данных публикуются (или готовятся к публикации) государственными органами и научным сообществом.

Открытые данные государств

Концепция открытого доступа к государственным данным является одним из ключевых интересов общества, многочисленные некоммерческие организации и отдельные активисты, которые добиваются открытости государственной информации в машиночитаемой форме. Многие правительства в рамках стратегий «открытого государства» создали веб-сайты для распространения части данных, обрабатываемых в секторе государственного управления. Некоторые известные сайты в стратегии открытых данных: data.gov (портал открытых данных США), Шаблон:Нп5, Шаблон:Нп5, Шаблон:Нп5.

В октябре 2015 года Партнерство «Открытое правительство» (OGP) приняло Международную хартию открытых данных — набор принципов и передовых методов публикации открытых государственных данных, во время Международного саммита OGP в Мексике[1].

Открытые данные в науке

Шаблон:Основная статьяКонцепция открытого доступа к научным данным была сформирована и институциально оформлена в 1957—1958 гг., когда был сформирован Международный центр данных[2].

В настоящее время Международный совет по науке (ранее Международный совет научных сообществ) курирует несколько мировых центров открытых данных, в целях уменьшения риска потери данных и увеличения их доступности[3].

Тем не менее только с началом работы интернета с доступностью быстрых, повсеместных сетей публикация/получение открытых данных стала значительно менее дорогой и стала занимать меньше времени[4].

Проект «Геном человека» был главной инициативой, которая продемонстрировала силу открытых данных. Он был основан на так называемых Бермудских принципах, которые гласят: «Вся информация о геномной последовательности человека (…) должна быть в свободном доступе и находиться в открытом доступе, чтобы стимулировать исследования и разработки и максимизировать их пользу для общества»[5]. Более поздние инициативы, такие как Консорциум структурной геномики, показали, что подход с открытыми данными может также продуктивно использоваться в контексте промышленных исследований и разработок[6].

В 2004 году министры науки всех стран Организации экономического сотрудничества и развития (ОЭСР), в которую входят наиболее развитые страны мира, подписали декларацию, в которой в основном говорится, что все архивные данные, финансируемые государством, должны быть общедоступными[7]. В ответ на запрос и интенсивное обсуждение с учреждениями, производящими данные в государствах-членах, ОЭСР опубликовала в 2007 году Принципы и руководящие указания ОЭСР по доступу к данным исследований из государственного финансирования в качестве рекомендации мягкого права[8].

Примеры открытых данных в науке:

  • Проект Dataverse Network — программное обеспечение архивного хранилища, способствующее обмену данными, постоянному цитированию данных и воспроизводимым исследованиям
  • Проект Figshare — поддерживает институциональный репозиторий с функцией бесплатной публикации неограниченного объёма открытых данных.
  • data.uni-muenster.de — Открытые данные о научных фактах Университета Мюнстера, Германия. Запущен в 2011 году.
  • connectedscience.org/data — Открытые научные наборы данных в виде связанных данных. Запущен в 2011 году.

Смежные направления

Цели открытия данных аналогичны целям других «открытых» движений.

  • Открытый доступ (англ. Open access) — связан с доступностью научных публикации в Интернете. В некоторых случаях эти статьи также включают открытые наборы данных.
  • Открытый контент (англ. Open content) — связан с предоставлением свободного доступа к ресурсам, предназначенным для людей (например, к прозе, фотографиям или видео).
  • Открытое знание (англ. Open knowledge) — Open Knowledge International выступает за открытость в целом ряде вопросов, включая, в частности, вопросы открытых данных. Он охватывает (а) научную, историческую, географическую или иную информацию (б) контент, такой как музыка, фильмы, книги (в) государственную и другую административную информацию. Открытые данные включены в объем определения открытых знаний, которое упоминается в протоколе Science Commons для реализации данных открытого доступа[9].
  • Наука об «открытых тетрадях» (англ. Open notebook science) — связана с применением концепции открытых данных на всех этапах научного цикла, включая данные о неудачных экспериментах а также необработанные экспериментальны данные.
  • Программное обеспечение с открытым исходным кодом (англ. Open-source software) — связано с лицензиям, по которым могут распространяться компьютерные программы с открытым исходным кодом. Обычно не касается данных.
  • Открытые образовательные ресурсы (англ. Open educational resources) — это свободно доступные, открытые по лицензии документы и средства массовой информации, которые полезны для преподавания, обучения и оценки, а также для исследовательских целей.
  • Открытые исследования / открытая наука / открытые научные данные — означает подход к открытию и взаимосвязи научных активов, таких как: данные, методы и инструменты — для обеспечения прозрачных, воспроизводимых и междисциплинарных исследований.

См. также

Примечания

Шаблон:Примечания

Ссылки

Шаблон:Rq Шаблон:Открытые методологии Шаблон:Массовое открытое онлайновое образование

  1. Шаблон:Cite web
  2. Шаблон:Книга
  3. Шаблон:Cite web
  4. Шаблон:Статья
  5. Human Genome Project, 1996. Summary of Principles Agreed Upon at the First International Strategy Meeting on Human Genome Sequencing (Bermuda, 25-28 February 1996)
  6. Perkmann, Markus and Schildt, Henri, Open Data Partnerships between Firms and Universities: The Role of Boundary Organizations, Research Policy Шаблон:Wayback 44 (2015) 1133—1143
  7. OECD Declaration on Open Access to publicly funded data Шаблон:Webarchive
  8. Шаблон:Cite web
  9. Шаблон:Cite web