Русская Википедия:Автоматическое реферирование

Материал из Онлайн справочника
Перейти к навигацииПерейти к поиску

Шаблон:Не путать

Автомати́ческое рефери́рование, анноти́рование или суммариза́ция — создание краткой версии (реферата, аннотации) текстового документа с помощью компьютерной программы.

История

Первая работа по автоматическому реферированию была сделана американским учёным d (Q86300) в 1958 г. на материале английского языка.[1][2][3] Принципы экстрактивного реферирования были сформулированы d (Q92880) в конце 50-х — начале 60-х годов.[2][4]

В СССР первооткрывателями в области автоматического реферирования стали В. Е. Берзон, И. П. Cевбо, d (Q16716616), Д. Г. Лахути, Р. Г. Пиотровский и др.[5][2]

Подходы

Выделяется два основных подхода к автоматическому реферированию: извлекающий (экстрагирующий, поверхностный) и генерирующий (абстрагирующий, глубинный).[6][1][5][2]

Извлекающий (экстракция)

Из исходного текста выбираются наиболее важные фразы, предложения или абзацы, совокупность которых образует некоторый экстракт, квазиреферат.[5] При этом данные фрагменты не обрабатывают, а извлекают в том порядке и виде, в каком они приведены в исходном тексте.[6]

Достоинства подхода: независимость от предметной области, сравнительная простота разработки.[1] Недостатки: бессвязность результата.[1]

Генерирующий (абстракция)

Генерирующие методы основаны на лингвистических правилах обработки естественного языка или методах искусственного интеллекта.[6] Они содержательно обобщают исходный документ, создавая текст, явно в нём не представленный.[6]

Достоинства подхода: лучшее качество результата.[1] Недостатки: сложность практической реализации, необходимость сбора большого количества лингвистических знаний.[1]

Примечания

Шаблон:Примечания

Шаблон:Ling-stub

Шаблон:Обработка естественного языка