Русская Википедия:Метод нечёткой кластеризации C-средних

Материал из Онлайн справочника
Перейти к навигацииПерейти к поиску

Метод нечёткой кластеризации C-средних (Шаблон:Lang-en) позволяет разбить имеющееся множество элементов мощностью <math>N</math> на заданное число нечётких множеств <math>k</math>. Метод нечеткой кластеризации C-средних можно рассматривать как усовершенствованный метод k-средних, при котором для каждого элемента из рассматриваемого множества рассчитывается степень его принадлежности (Шаблон:Lang-en) каждому из кластеров.

Алгоритм был разработан J.C. Dunn в 1973[1] и улучшен J.C. Bezdek в 1981[2].

Алгоритм:

  1. Задать случайным образом <math>k</math> центров кластеров <math>c_j\ ,\ j=1..k</math>;
  2. Рассчитать матрицу принадлежности элементов к кластерам <math>r</math>. В случае нормального распределения: <math>r_{ij} = \frac

{\mathcal{N}(d(x_i,c_j) | \mu=0, \sigma)} {\displaystyle\sum_j^k\mathcal{N}(d(x_i,c_j) | \mu=0, \sigma)}</math>, где <math>x_i</math>— <math>i</math>-й элемент множества, <math>c_j</math>— центр кластера <math>j</math>, <math>d(x_i,c_j)</math> — расстояние между точками <math>x_i</math> и <math>c_j</math>, <math>\mathcal{N}</math>— плотность вероятности нормального распределения в точке <math>d(x_i,c_j)</math>.

  1. Переместить центры кластеров <math>c_j \leftarrow \frac{\displaystyle\sum_i r_{ij}x_i}{\displaystyle\sum_i r_{ij}}</math>;
  2. Рассчитать функцию потерь (например, исходя из принципа максимального правдоподобия). В случае нормального распределения функция потерь будет равна: <math>J=\displaystyle\sum_j^k\sum_i^Nd(x_i,c_j)^2r_{ij}</math>;
  3. Если значение функции потерь уменьшается, то повторить цикл с п.2.

Метод нечеткой кластеризации C-средних имеет ограниченное применение из-за существенного недостатка — невозможность корректного разбиения на кластеры, в случае когда кластеры имеют различную дисперсию по различным размерностям (осям) элементов (например, кластер имеет форму эллипса). Данный недостаток устранен в алгоритмах Mixture models и GMM (Gaussian mixture models).

Ссылки

Шаблон:Примечания Шаблон:Машинное обучение