Русская Википедия:Многомерное шкалирование
Многомерное шкалирование — метод анализа и визуализации данных с помощью расположения точек, соответствующих изучаемым (шкалируемым) объектам, в пространстве меньшей размерности, чем пространство признаков объектов. Точки размещаются так, чтобы попарные расстояния между ними в новом пространстве как можно меньше отличались от эмпирически измеренных расстояний в пространстве признаков изучаемых объектов. Если элементы матрицы расстояний получены по интервальным шкалам, метод многомерного шкалирования называется метрическим. Когда шкалы являются порядковыми, метод многомерного шкалирования называется неметрическим. Мера различий расстояний в исходном и новом пространстве называется функцией стресса.
Мера качества отображения. Мерой, наиболее часто используемой для оценки качества подгонки модели (отображения), измеряемого по степени воспроизведения исходной матрицы сходств, является стресс.
Области применения
- Поиск скрытых переменных, объясняющих полученную из опыта структуру попарных расстояний между изучаемыми явлениями.
- Проверка гипотез о расположении изучаемых явлений в пространстве скрытых переменных.
- Сжатие полученное опытным путём массива данных путём использования небольшого числа скрытых переменных.
- Наглядное представление данных.
Функция расстояния
Функцией расстояния называется функция от двух аргументов, которая ставит в соответствие двум шкалируемым объектам расстояние <math>d(a_i, a_j)</math> между ними так, что выполняются следующие аксиомы: <math>d(a_i, a_j)=0</math> в том и только том случае, когда объекты <math>a_i</math> и <math>a_j</math> совпадают (рефлексивность расстояния), <math>d(a_i, a_j)=d(a_j, a_i)</math> (симметричность расстояния), <math>d(a_i, a_j)+d(a_j, a_k) \geqslant d(a_i, a_k)</math> (правило треугольника)Шаблон:Sfn.
Функция близости
Функция близости менее формализована, так как она является опытной величиной, например, получаемой в ходе социологического опроса. Это функция <math>s(a_i, a_j)</math> от двух аргументов, которая двум шкалируемым объектам ставит в соответствие расстояние <math>s(a_i, a_j)</math> между ними так, что выполняются следующие аксиомы: <math>s(a_i, a_j) \geqslant s(a_i, a_i)</math> (объект ближе к самому себе, чем к любому другому объекту), <math>s(a_i, a_j)=s(a_j, a_i)</math> (симметричность близости), для больших значений <math>s(a_i, a_j)</math> и <math>s(a_j, a_k)</math> величина <math>s(a_i, a_k)</math> имеет, по крайней мере, тот же порядок (ослабленное правило треугольника).
Примечания
Литература