Русская Википедия:FAIR-данные

Материал из Онлайн справочника
Перейти к навигацииПерейти к поиску

Файл:FREYA-The-power-of-PIDs-V05-1.webm
Введение в FAIR-данные и постоянные идентификаторы
Файл:FAIR data principles.jpg
Findability, Accessibility, Interoperability, Reusability

FAIR-данные — это данные, соответствующие принципам Findability, Accessibility, Interoperability, Reusability — находимости, доступности, совместимости и переиспользования[1], акроним FAIR можно также перевести как «честные», «справедливые». Данные принципы были представлены в мартовской статье 2016 года в журнале Scientific Data консорциумом из нескольких ученых и организаций.[1]

Принципы FAIR фокусируются на возможностях автоматической обработки — то есть способность вычислительных систем находить, получать доступ, взаимодействовать и повторно использовать данные без вмешательства человека, или с минимальным его участием — это необходимо в связи с постоянным ростом объёма, сложности и скорости возникновения информации.[2]

Аббревиатура FAIR/O подразумевает добавление к описанным выше принципам явного указания открытой лицензии (Open license) на данные.

Принципы FAIR, опубликованные GO FAIR

Оригинал на https://www.go-fair.org/fair-principles/

Findable — находимость

Шаблон:Начало цитаты Первый шаг в (пере)использовании данных — это их поиск. Метаданные и данные должны быть легко обнаружимы как для людей, так и для компьютеров. Машиночитаемые метаданные необходимы для автоматического обнаружения наборов данных и сервисов, это важный компонент процесса FAIRфикации.

F1. (Мета)данным присваивается глобальный уникальный и постоянный идентификатор
F2. Данные описываются с помощью расширенных метаданных (определяются ниже в пункте R1).
F3. Метаданные чётко и явно включают идентификатор данных, которые они описывают
F4. (Мета)данные регистрируются или индексируются в системе с поисковыми возможностями

Шаблон:Oq Шаблон:Конец цитаты

Accessible — доступность

Шаблон:Начало цитаты Как только пользователь находит необходимые данные, ему становится нужно понять, как получить к ним доступ, возможно, с учётом аутентификации и авторизации.

A1. (Мета)данные могут быть получены по их идентификатору с использованием стандартизированного протокола связи
A1.1 Протокол является открытым, бесплатным и универсально реализуемым
A1.2 Протокол допускает процедуру аутентификации и авторизации, где это необходимо
A2. Метаданные остаются доступны, даже если сами данные больше недоступны

Шаблон:Oq Шаблон:Конец цитаты

Interoperable — совместимость

Шаблон:Начало цитаты Данные обычно должны соединяться с другими данными. Кроме того, данные должны взаимодействовать с приложениями или рабочими процессами для анализа, хранения и обработки.

I1. (Мета)данные используют формальный, доступный, общий и широко применяемый язык для представления знаний.
I2. (Мета)данные используют словари, которые следуют FAIR-принципам
I3. (Мета)данные включают квалифицированные ссылки на другие (мета)данные

Шаблон:Oq Шаблон:Конец цитаты

Reusable — переиспользование

Шаблон:Начало цитаты Конечная цель FAIR — оптимизировать повторное использование данных. Для достижения этой цели метаданные и данные должны быть хорошо описаны, чтобы их можно было копировать и/или комбинировать в различных условиях.

R1. Мета(данные) подробно описаны с множеством точных и уместных свойств
R1.1. (Мета)данные публикуются с чёткой разрешающей использование лицензией
R1.2. (Мета)данные связаны с подробным описанием происхождения
R1.3. (Мета)данные соответствуют стандартам сообщества, относящимся к данной предметной области

Шаблон:Oq Шаблон:Конец цитаты

Шаблон:Начало цитаты Принципы относятся к трём типам объектов: данным (или любому цифровому объекту), метаданным (информация об этом цифровом объекте) и инфраструктуре. Например, принцип F4 определяет, что и метаданные, и данные регистрируются или индексируются в системе с поисковыми возможностями (часть инфраструктуры). Шаблон:Oq Шаблон:Конец цитаты

Принятие и внедрение принципов FAIR-данных

Одна из первых статей, в которой обсуждались аналогичные идеи, была опубликована ещё в 2007 году.[3]

На саммите G20 в Ханчжоу в 2016 году лидеры Большой двадцатки выступили с заявлением, в котором одобрили применение FAIR-принципов в исследованиях.[4][5]

В 2016 году группа австралийских организаций разработала Заявление о FAIR-доступе к Результатам исследований Австралии (Australia's Research Outputs), которое расширяло использование принципов на результаты исследований.[6]

В 2017 году Германия, Нидерланды и Франция договорились о создании[7] международного офиса поддержки FAIR-инициативы – GO FAIR International Support and Coordination Office.

Другие международные организации, действующие в экосистеме исследовательских данных, такие как CODATA или Альянс исследовательских данных (RDA), также поддерживают внедрение FAIR своими членами. Оценка реализации FAIR-принципов проводится Рабочей группой по модели зрелости FAIR-данных в составе RDA[8]. Стратегическая десятилетняя программа CODATA «Данные для планеты: использование данных для решения междоменных задач»[9] упоминает принципы FAIR-данных как фундаментальное свойство основанных на данных наук.

Файл:Implementing FAIR Data Principles - The Role of Libraries.pdf
Руководство «Внедрение принципов FAIR-данных — роль библиотек»

Ассоциация Европейских исследовательских библиотек рекомендует использовать FAIR-принципы.[10]

В документе 2017 года, подготовленном сторонниками FAIR-данных, сообщалось о росте осведомленности о FAIR-концепции среди различных исследователей и институтов, но также отмечалось, что принцимы размываются, многие имеют своё особое видение.[11]

В руководствах по внедрению FAIR-методов обработки данных говорится, что стоимость плана управления данными в соответствии с FAIR-практиками должна составлять 5% от общего бюджета исследований.[12]

В 2019 году Глобальный альянс данных коренных народов (Global Indigenous Data Alliance — GIDA) опубликовал дополнение в виде CARE-принципов.[13] Принципы CARE («заботы») расширяют принципы FAIR, добавляя к ним Collective benefit (общую выгоду), Authority to control (полномочия по контролю), Responsibility (ответственность), Ethics (этику), чтобы обеспечить учёт исторического контекста и различий в возможностях.

Отмечается, что отсутствие информации о практическом применении руководящих принципов, привело к их непоследовательному толкованию.[14]

В январе 2020 года представители девяти групп университетов по всему миру подготовили Сорбоннскую декларацию о правах на исследовательские данные[15], которая включила обязательство предоставлять FAIR-данные и призвала правительства оказать поддержку для её реализации.[16]

См. также

Примечания

Шаблон:Примечания

Ссылки

  1. 1,0 1,1 Шаблон:Cite journal
  2. Шаблон:Cite web Файл:CC-BY icon.svg Material was copied from this source, which is available under a Creative Commons Attribution 4.0 International License.
  3. Sandra Collins; Françoise Genova; Natalie Harrower; Simon Hodson; Sarah Jones; Leif Laaksonen; Daniel Mietchen; Rūta Petrauskaité; Peter Wittenburg (7 June 2018), «Turning FAIR data into reality: interim report from the European Commission Expert Group on FAIR data», Zenodo, doi:10.5281/ZENODO.1285272
  4. Шаблон:Cite web
  5. Шаблон:Cite web
  6. Шаблон:Cite web
  7. Шаблон:Cite web
  8. Шаблон:Cite web
  9. Шаблон:Cite web
  10. Шаблон:Cite web
  11. Шаблон:Cite journal
  12. Шаблон:Cite web
  13. Шаблон:Cite web
  14. Шаблон:Cite journal
  15. Sorbonne Declaration on Research Data Rights Шаблон:Wayback, Jan 27 2020
  16. Open data ‘tougher’ than open access and needs ‘mindset change’ Шаблон:Wayback, Times Higher Education, January 31 2020