Русская Википедия:Топологический анализ данных

Материал из Онлайн справочника
Перейти к навигацииПерейти к поиску

Топологический анализ данных — новая область теоретических исследований для задач анализа данных (Data mining) и компьютерного зрения.

Основные вопросы:

  1. Как из низкоразмерных представлений получать структуры высоких размерностей;
  2. Как дискретные единицы складываются в глобальные структуры.

Человеческий мозг легко строит представление об общей структуре по частным данным низких размерностей. Ему, например, не составляет труда получить трехмерную форму объекта по плоским изображениям в каждом глазу. Создание общей структуры также производится при объединении дискретных во времени фрагментов в непрерывный образ. Так, например, телевизионное изображение технически является массивом отдельных точек, который, однако, воспринимается как единая сцена.

Основной метод топологического анализа данных:

  1. Замена набора элементов данных некоторым семейством симплициальных комплексов в соответствии с параметром близости.
  2. Анализ этих топологических комплексов с помощью алгебраической топологии, а конкретно новой теорией персистентных гомологий.
  3. Перекодировка устойчивой гомологии набора данных в параметризованную версию чисел Бетти, называемую баркодом.

Облако точек

Шаблон:Основная статья Данные часто представлены множеством точек в Евклидовом пространстве En, форма которого отражает описываемый данными феномен.

Реальные трёхмерные объекты могут представляться в виде облака точек. Например, лазером отмечаются отдельные точки, и их неструктурированный набор служит представлением объекта в компьютере. Облаком точек считается любой (возможно, зашумленный) набор точек в En или проекций точек в более низкой размерности.

В компьютерной графике и статистике существуют различные методы построения прообразов по проекциям. Топологический анализ данных предназначен для пространств высоких размерностей или слишком искривленных, чтобы можно было создавать по ним плоские проекции.

Для преобразования облака точек в метрическом пространстве в целостный объект точки используются в качестве вершин графа, рёбрам которого приписаны расстояния, затем граф превращается в симплициальный комплекс и изучается средствами алгебраической топологии.

См. также

Ссылки

Шаблон:Перевести