Русская Википедия:FAIR-данные
FAIR-данные — это данные, соответствующие принципам Findability, Accessibility, Interoperability, Reusability — находимости, доступности, совместимости и переиспользования[1], акроним FAIR можно также перевести как «честные», «справедливые». Данные принципы были представлены в мартовской статье 2016 года в журнале Scientific Data консорциумом из нескольких ученых и организаций.[1]
Принципы FAIR фокусируются на возможностях автоматической обработки — то есть способность вычислительных систем находить, получать доступ, взаимодействовать и повторно использовать данные без вмешательства человека, или с минимальным его участием — это необходимо в связи с постоянным ростом объёма, сложности и скорости возникновения информации.[2]
Аббревиатура FAIR/O подразумевает добавление к описанным выше принципам явного указания открытой лицензии (Open license) на данные.
Принципы FAIR, опубликованные GO FAIR
Оригинал на https://www.go-fair.org/fair-principles/
Findable — находимость
Шаблон:Начало цитаты Первый шаг в (пере)использовании данных — это их поиск. Метаданные и данные должны быть легко обнаружимы как для людей, так и для компьютеров. Машиночитаемые метаданные необходимы для автоматического обнаружения наборов данных и сервисов, это важный компонент процесса FAIRфикации.
- F1. (Мета)данным присваивается глобальный уникальный и постоянный идентификатор
- F2. Данные описываются с помощью расширенных метаданных (определяются ниже в пункте R1).
- F3. Метаданные чётко и явно включают идентификатор данных, которые они описывают
- F4. (Мета)данные регистрируются или индексируются в системе с поисковыми возможностями
Accessible — доступность
Шаблон:Начало цитаты Как только пользователь находит необходимые данные, ему становится нужно понять, как получить к ним доступ, возможно, с учётом аутентификации и авторизации.
- A1. (Мета)данные могут быть получены по их идентификатору с использованием стандартизированного протокола связи
- A1.1 Протокол является открытым, бесплатным и универсально реализуемым
- A1.2 Протокол допускает процедуру аутентификации и авторизации, где это необходимо
- A2. Метаданные остаются доступны, даже если сами данные больше недоступны
Interoperable — совместимость
Шаблон:Начало цитаты Данные обычно должны соединяться с другими данными. Кроме того, данные должны взаимодействовать с приложениями или рабочими процессами для анализа, хранения и обработки.
- I1. (Мета)данные используют формальный, доступный, общий и широко применяемый язык для представления знаний.
- I2. (Мета)данные используют словари, которые следуют FAIR-принципам
- I3. (Мета)данные включают квалифицированные ссылки на другие (мета)данные
Reusable — переиспользование
Шаблон:Начало цитаты Конечная цель FAIR — оптимизировать повторное использование данных. Для достижения этой цели метаданные и данные должны быть хорошо описаны, чтобы их можно было копировать и/или комбинировать в различных условиях.
- R1. Мета(данные) подробно описаны с множеством точных и уместных свойств
- R1.1. (Мета)данные публикуются с чёткой разрешающей использование лицензией
- R1.2. (Мета)данные связаны с подробным описанием происхождения
- R1.3. (Мета)данные соответствуют стандартам сообщества, относящимся к данной предметной области
Шаблон:Начало цитаты Принципы относятся к трём типам объектов: данным (или любому цифровому объекту), метаданным (информация об этом цифровом объекте) и инфраструктуре. Например, принцип F4 определяет, что и метаданные, и данные регистрируются или индексируются в системе с поисковыми возможностями (часть инфраструктуры). Шаблон:Oq Шаблон:Конец цитаты
Принятие и внедрение принципов FAIR-данных
Одна из первых статей, в которой обсуждались аналогичные идеи, была опубликована ещё в 2007 году.[3]
На саммите G20 в Ханчжоу в 2016 году лидеры Большой двадцатки выступили с заявлением, в котором одобрили применение FAIR-принципов в исследованиях.[4][5]
В 2016 году группа австралийских организаций разработала Заявление о FAIR-доступе к Результатам исследований Австралии (Australia's Research Outputs), которое расширяло использование принципов на результаты исследований.[6]
В 2017 году Германия, Нидерланды и Франция договорились о создании[7] международного офиса поддержки FAIR-инициативы – GO FAIR International Support and Coordination Office.
Другие международные организации, действующие в экосистеме исследовательских данных, такие как CODATA или Альянс исследовательских данных (RDA), также поддерживают внедрение FAIR своими членами. Оценка реализации FAIR-принципов проводится Рабочей группой по модели зрелости FAIR-данных в составе RDA[8]. Стратегическая десятилетняя программа CODATA «Данные для планеты: использование данных для решения междоменных задач»[9] упоминает принципы FAIR-данных как фундаментальное свойство основанных на данных наук.
Ассоциация Европейских исследовательских библиотек рекомендует использовать FAIR-принципы.[10]
В документе 2017 года, подготовленном сторонниками FAIR-данных, сообщалось о росте осведомленности о FAIR-концепции среди различных исследователей и институтов, но также отмечалось, что принцимы размываются, многие имеют своё особое видение.[11]
В руководствах по внедрению FAIR-методов обработки данных говорится, что стоимость плана управления данными в соответствии с FAIR-практиками должна составлять 5% от общего бюджета исследований.[12]
В 2019 году Глобальный альянс данных коренных народов (Global Indigenous Data Alliance — GIDA) опубликовал дополнение в виде CARE-принципов.[13] Принципы CARE («заботы») расширяют принципы FAIR, добавляя к ним Collective benefit (общую выгоду), Authority to control (полномочия по контролю), Responsibility (ответственность), Ethics (этику), чтобы обеспечить учёт исторического контекста и различий в возможностях.
Отмечается, что отсутствие информации о практическом применении руководящих принципов, привело к их непоследовательному толкованию.[14]
В январе 2020 года представители девяти групп университетов по всему миру подготовили Сорбоннскую декларацию о правах на исследовательские данные[15], которая включила обязательство предоставлять FAIR-данные и призвала правительства оказать поддержку для её реализации.[16]
См. также
- Управление данными
- Культура ремиксов
- Открытый доступ
- Открытые данные — наборы данных и базы данных, имеющие явную открытую лицензию
- Открытая наука
Примечания
Ссылки
- FAIR Data and Semantic Publishing, заявление из лаборатории первого автора оригинальной статьи
- Guide to FAIR Data Голландского Техцентра наук о жизни
- Веб-сайт инициативы GO FAIR
- FAIR Principles с подробным описанием каждого из руководящих принципов инициативы GO FAIR
- FAIR-сказка, объясняющая принципы FAIR
- ↑ 1,0 1,1 Шаблон:Cite journal
- ↑ Шаблон:Cite web Файл:CC-BY icon.svg Material was copied from this source, which is available under a Creative Commons Attribution 4.0 International License.
- ↑ Sandra Collins; Françoise Genova; Natalie Harrower; Simon Hodson; Sarah Jones; Leif Laaksonen; Daniel Mietchen; Rūta Petrauskaité; Peter Wittenburg (7 June 2018), «Turning FAIR data into reality: interim report from the European Commission Expert Group on FAIR data», Zenodo, doi:10.5281/ZENODO.1285272
- ↑ Шаблон:Cite web
- ↑ Шаблон:Cite web
- ↑ Шаблон:Cite web
- ↑ Шаблон:Cite web
- ↑ Шаблон:Cite web
- ↑ Шаблон:Cite web
- ↑ Шаблон:Cite web
- ↑ Шаблон:Cite journal
- ↑ Шаблон:Cite web
- ↑ Шаблон:Cite web
- ↑ Шаблон:Cite journal
- ↑ Sorbonne Declaration on Research Data Rights Шаблон:Wayback, Jan 27 2020
- ↑ Open data ‘tougher’ than open access and needs ‘mindset change’ Шаблон:Wayback, Times Higher Education, January 31 2020