Русская Википедия:Семантическая вики
Семанти́ческая ви́ки — веб-приложение, использующее машинообрабатываемые данные со строго определённой семантикой для того, чтобы расширить функциональность вики-системы.[1][2]
Обычные вики заполняются структурированным текстом и нетипизированными гиперссылками (такими, как в этой статье). Семантические вики позволяют указывать тип ссылок между статьями, тип данных внутри статей, а также информацию о страницах (метаданные).
Недостатки традиционных вики
Причиной появления потребности в движках семантических вики стал ряд недостатков, присущих традиционным вики-системам. Эти проблемы особенно ярко проявляются с ростом количества статей. Обычно указываются следующие недостатки:[3][4]
Согласованность содержимого. Из-за частого дублирования данных в вики, одна и та же информация может содержаться на нескольких разных страницах. При изменении этой информации на одной вики-странице, пользователи должны следить за тем, чтобы данные были обновлены также и на всех остальных страницах. Эта проблема хорошо иллюстрируется на следующем примере:[5] пусть имелась вики-статья под названием Плутон. На ней Плутон был обозначен как планета. В 2006 году, когда Международный астрономический союз принял решение о лишении Плутона статуса планеты, один из участников поправил страницу со статьёй о Плутоне. Однако ранее Плутон фигурировал в статусе планеты в ряде других статей: Планета, Планеты солнечной системы, Список планет по размеру. Очевидно, что задача согласованности всех этих данных лежит на вики-сообществе.
Доступ к знаниям, имеющимся в вики. Большие вики-сайты содержат тысячи страниц. Выполнение сложных поисковых запросов и сравнение информации, полученной с разных страниц — это задача, которая на традиционных вики-системах является достаточно трудоёмкой. Пример: в вики может быть информация обо всех крупных горах планеты. Однако для того, чтобы сформировать список гор, упорядоченный по высоте, участник сообщества должен проделать много рутинной работы, рискуя при этом ошибиться или пропустить некоторые горы.
Повторное использование знаний вики. Сегодня некоторые настольные приложения используют информацию из Википедии, например, плеер Amarok отображает статьи об исполнителе во время воспроизведения музыкальной композиции. Однако такое использование носит ограниченный характер. Программа способна только показать текст статьи Википедии в некотором контексте, и не может проделать дополнительных шагов (например: найти все альбомы исполнителя). Семантические вики позволяют в полной мере воспользоваться информацией, хранящейся в вики-системе.
Использование категорий, тэгов и пространств имён. Традиционные вики используют плоские системы классификации (тэги), либо классификаторы, организованные в таксономию. Невозможность использования типизированных свойств порождает огромное количество тэгов или категорий. Это хорошо видно на примере Википедии: к примеру, категорию «Родившиеся 20 апреля» разумно заменить атрибутом «Дата рождения».
Отличительные особенности семантических вики
Семантические вики делятся на две больших категории:
- вики, хранящие структурированные данные прямо в тексте страниц (например, Semantic MediaWiki);
- вики, хранящие данные отдельно (например, Ontowiki[6], KiWi).
Для первого типа характерна расширенная вики-разметка, в то время как вики-системы второго типа имеют формовый интерфейс ввода данных, отдельный по отношению к содержимому статей. Однако для обоих этих типов принято выделять следующие отличительные особенности[7]:
- семантические аннотации;
- контекстное представление данных;
- семантическая навигация;
- семантический поиск;
- поддержка логического вывода;
- поддержка стандартов семантической паутины.
Семантические аннотации
Ссылки между статьями в семантических вики служат не только для навигации, а несут в себе информацию о типе связи. Например, в Semantic MediaWiki статья о Лондоне может содержать следующую разметку:
[[capital of::England]]. Это утверждение означает, что Лондон является столицей Англии. В данном случае типом ссылки будет «столица» (capital of), а значением ссылки «Англия» (England).
Для вики, в которых ввод основан на формах, часто существует подобная функциональность. К примеру вики-система KiWi позволяет связывать структурированные данные с помощью средств RDF, а затем соотносить RDF-термины с текстом в статье.[8]
Иногда семантические аннотации не вставляются на вики-страницы явным образом, а добавляются автоматически. Для этого в таких вики, как ACEWiki, существует поддержка контролируемого естественного языка (обычно английского).
Контекстное представление данных
Многие семантические вики позволяют изменять способы представления содержимого страниц с помощью семантических аннотаций. Контекстное представление включает в себя отображение статей, близких данной, отображение информации, которая может быть выведена из базы знаний (например, изображение иерархии классов, к которым относится объект, описываемый в вики-статье).
Семантическая навигация
В то время как в традиционных вики-системах все, что возможно сделать со ссылкой — это перейти по ней, многие семантические вики позволяют также возможность получить информацию о связи, которая представляется ссылкой. Данная возможность позволяет реализовывать в семантических вики новые способы навигации: к примеру, увидев в статье Лондон ссылку «является столицей::Англия» пользователь может посмотреть на другие страницы в вики, связанные ссылкой «является столицей».
Семантический поиск
Семантические вики поддерживают возможность построения многокритериальных запросов на формальном языке. Иногда в качестве языка запросов выбирается SPARQL, входящий в стандарты Semantic Web. Используя семантический поиск, можно автоматически строить списки страниц по ряду условий. Страницы всегда будут актуальными, так как строятся автоматически. Кроме этого, использование семантических аннотаций позволяет создавать т. н. фасетный поиск, уточняющий поиск[9]. При этом поиск состоит из двух этапов:
- ввод поискового запроса;
- фильтрация результатов.
Например, при поиске слова «Клинтон» пользователь сначала вводит запрос в поисковую строку, а затем с помощью поисковых фасетов фильтрует результаты поиска: выбирает категорию «Политики» и «время жизни» «XX—XXI века».
Поддержка логического вывода
Под логическим выводом понимается извлечение скрытых, неявных знаний из введенных в систему фактов. Логический вывод строится на определенных заранее правилах вывода и может быть основан как на структурных алгоритмах, так и на математически обоснованных алгоритмах вывода на основе логических формализмов.
Поддержка стандартов семантической паутины
Многие семантические вики хранят данные в форматах Semantic Web или предоставляют возможность импорта/экспорта в тексты на языках RDF и OWL. Языком запросов к вики часто служит SPARQL, что позволяет обращаться с вики как со SPARQL-endpoint’ом.
История
Ранние семантические вики-движки
Впервые термин «семантическая вики» был употреблен Энди Динглеем (Andy Dingley) в телеконференции Usenet «comp.infosystems.www.authoring.site-design»[10]. В научно-технической литературе первое известное упоминание термина связано со статьёй австрийского учёного Лео Зауэрмана (Leo Sauermann) «Gnowsis — Использование технологий семантической паутины для создания семантического рабочего стола»[11]. К этому моменту уже существовали структурированные вики, такие как «TWiki».
Первым движком семантической вики был «Platypus Wiki»[12]. В ранних семантических вики (таких как «Platypus Wiki» и «Rhizome Wiki»[13]) акцент был смещен на предоставление средств для редактирования RDF-содержимого в вики-подобной среде[4] . RDF-данные представлялись в этих ранних вики-системах как свободно редактируемый текст, никак не связанный с неструктурированным содержимым в вики-разметке. Поэтому, в «Platypus» и «Rhizome» был возможен импорт RDF-данных, однако продвинутые возможности вроде проверки непротиворечивости и классификации были недоступны.
Современные семантические вики
Чуть позже появились новые движки семантических вики. Часть из них пошла по пути четкого разделения структурированной и неструктурированной информации, например «Ikewiki»[14][15] и «OntoWiki»[16], но стал применяться и другой подход — включение семантических аннотаций в вики-разметку, например в «WikiSAR»[17] и «Semantic MediaWiki»[18][19].
Один из наиболее развитых на сегодня движков семантических вики «Semantic MediaWiki» изначально предназначался для использования в Википедии. Проект семантической Википедии («Semantic Wikipedia») был призван обеспечить машинную обработку Википедии с минимальными усилиями со стороны пользователей. В одноименной статье[18] описывается разработка расширения для движка «Mediawiki», позволяющего вводить и обрабатывать в вики структурированную информацию. Проект не был включен в программу развития Википедии, но выжил и преобразовался в расширение «Semantic MediaWiki». Новая инициатива Фонда Викимедиа «Wikidata» является прямым наследником этого проекта.
Список активных проектов семантических вики
Название | Веб-сайт | Описание | Язык | Разработчик | Лицензия |
---|---|---|---|---|---|
Semantic MediaWiki | http://semantic-mediawiki.org | реализована в виде плагина к вики-движку MediaWiki. Добавляет новые элементы вики-разметки, позволяющие размечать страницы типизированными свойствами и осуществлять запросы к этим данным с помощью структурированных запросов | PHP | Institute AIFB at Karlsruhe institute of technology (KIT) | GNU GPL v.2 |
Data Wiki (в прошлом Enterprise Semantic MediaWiki Plus) | http://diqa-pm.com/de/DataWiki | корпоративная система, основанная на Semantic MediaWiki и наследующая её возможности. Имеет дополнительную функциональность для работы с онтологиями, интеграции с Microsoft Office и разграничения доступа. | PHP | Ontoprise GmbH, затем DIQA-PM | GPL/ коммерческая |
OntoWiki | http://ontowiki.net | коллаборативный RDF-редактор с формовым вводом данных. Используется как инструмент для поддержки жизненного цикла связанных данных. Имеется мобильная версия, предназначенная для сбора данных в отсутствие интернета с последующей синхронизацией с сервером. | PHP | GPL | |
AceWiki | http://attempto.ifi.uzh.ch/acewiki/ | Использует подмножество английского языка (контролируемый английский) для того, чтобы представлять в вики структурированную информацию | Java | GNU LGPL | |
KnowWE | https://web.archive.org/web/20111129111848/http://www.is.informatik.uni-wuerzburg.de/forschung/anwendungen/knowwe/ | Java | GNU LGPL | ||
TikiWiki CMS/Groupware | https://web.archive.org/web/20191117101007/https://info.tiki.org/ | PHP | GNU LGPL | ||
Information Workbench | http://www.fluidops.com/information-workbench/ Шаблон:Wayback | Java | fluid Operations | GNU LGPL /коммерческая | |
ArtificialMemory[20] | http://www.artificialmemory.net/ Шаблон:Wayback | С# | Lars Ludwig | ||
TWiki | http://twiki.org/ | Шаблон:Недоступная ссылка использует формы для добавления структурированных данных, позволяет делать запросы к данным и фильтровать поисковую выдачу | Perl | GNU GPL | |
Knoodl | http://knoodl.com | ||||
Callimachus | http://callimachusproject.org | Платформа для построения Linked Data приложений, ориентированная на повторное использование данных | Java | 3 Round Stones, Talis, Cleveland Clinic | Apache 2.0 |
WikiDSmart для Confluence | https://wikidsmart.zagile.orgШаблон:Недоступная ссылка | Аддон для корпоративной вики Confluence. Использует SPARQL как язык запросов и ориентирован на тесную интеграцию с Jira | Java | zAgile | |
WikiNEXT | http://wikinext.gexsoft.com | Российская разработка. | Javascript | Павел Арапов |
Ссылки
- Сравнение семантических вики на semanticweb.org
- Сообщество семантических вики
Примечания
Ссылки
- SemWiki.orgШаблон:Ref-en — сообщество «Семантические вики»
- Semantic wiki projects Шаблон:Ref-en — список проектов движков семантических вики
Шаблон:Вики Шаблон:Семантическая паутина
- ↑ Ошибка цитирования Неверный тег
<ref>
; для сносокKroetzsch2007
не указан текст - ↑ Ошибка цитирования Неверный тег
<ref>
; для сносокSemWeborg
не указан текст - ↑ 4,0 4,1 Ошибка цитирования Неверный тег
<ref>
; для сносокSMW_markus
не указан текст - ↑ Ошибка цитирования Неверный тег
<ref>
; для сносокSW_for_working_ontologist
не указан текст - ↑ Ошибка цитирования Неверный тег
<ref>
; для сносокAuerRW2011
не указан текст - ↑ Ошибка цитирования Неверный тег
<ref>
; для сносокSchaffert2006
не указан текст - ↑ Ошибка цитирования Неверный тег
<ref>
; для сносокschaffert2009kiwi
не указан текст - ↑ Ошибка цитирования Неверный тег
<ref>
; для сносокenglish2002
не указан текст - ↑ Ошибка цитирования Неверный тег
<ref>
; для сносокwikiwikiduscuss2001
не указан текст - ↑ Ошибка цитирования Неверный тег
<ref>
; для сносокsauermann2003
не указан текст - ↑ Ошибка цитирования Неверный тег
<ref>
; для сносокcastagna2004
не указан текст - ↑ Ошибка цитирования Неверный тег
<ref>
; для сносокSouzis2004
не указан текст - ↑ Ошибка цитирования Неверный тег
<ref>
; для сносокschaffert2007
не указан текст - ↑ Ошибка цитирования Неверный тег
<ref>
; для сносокschaffert2005
не указан текст - ↑ Ошибка цитирования Неверный тег
<ref>
; для сносокauer2006
не указан текст - ↑ Ошибка цитирования Неверный тег
<ref>
; для сносокaumueller2005
не указан текст - ↑ 18,0 18,1 Ошибка цитирования Неверный тег
<ref>
; для сносокVolkel2006
не указан текст - ↑ Ошибка цитирования Неверный тег
<ref>
; для сносокkrotzschsmw2006
не указан текст - ↑ Шаблон:Статья