Русская Википедия:Радиально-базисная функция

Материал из Онлайн справочника
Версия от 00:25, 10 сентября 2023; EducationBot (обсуждение | вклад) (Новая страница: «{{Русская Википедия/Панель перехода}} '''Радиальная базисная функция''' (''РБФ'') — функция из набора однотипных радиальных функций, используемых как функция активации в одном слое искусственной нейронной сети или как-ли...»)
(разн.) ← Предыдущая версия | Текущая версия (разн.) | Следующая версия → (разн.)
Перейти к навигацииПерейти к поиску

Радиальная базисная функция (РБФ) — функция из набора однотипных радиальных функций, используемых как функция активации в одном слое искусственной нейронной сети или как-либо ещё, в зависимости от контекста. Шаблон:Iw — это любая вещественная функция, значение которой зависит только от расстояния до начала координат <math>\phi\left(\mathbf{x}\right) = \phi\left(\left\|\mathbf{x}\right\|\right)</math> или от расстояния между некоторой другой точкой <math>\mathbf{c}</math>, называемой центром: <math>\phi\left(\mathbf{x}, \mathbf{c}\right) = \phi\left(\left\|\mathbf{x}-\mathbf{c}\right\|\right)</math>. В качестве нормы обычно выступает евклидово расстояние, хотя можно использовать и другие метрики.

Линейные комбинации радиальных базисных функций также можно использовать для аппроксимации заданной функции. Аппроксимация может быть интерпретирована как простейшая разновидность нейронной сети; именно в этом контексте радиальные базисные функции были впервые определены в работе Дэвида Брумхэда и Дэвид Лоу в 1988 году[1][2], основанной на фундаментальной работе Майкла Пауэлла 1977 года[3][4][5].

Радиальные базисные функции также используются в качестве ядра в методе опорных векторов.[6]

Виды

Часто используемые радиально-базисные функций включают в себя (<math>r = \left\|\mathbf{x} - \mathbf{x}_i\right\|</math>):

  • Функция Гаусса:
    <math>\phi\left(r\right) = e^{-\left(\varepsilon r\right)^2}</math>
  • Мультиквадратичная:
    <math>\phi\left(r\right) = \sqrt{1 + \left(\varepsilon r\right)^2} </math>
  • Обратная квадратичная:
    <math>{\displaystyle \phi \left(r\right)={\dfrac {1}{1+\left(\varepsilon r\right)^{2}}}}
</math>

\phi\left(r\right) &= r^k,& k&=1,3,5,\dotsc \\ \phi\left(r\right) &= r^k \ln\left(r\right),& k&=2,4,6,\dotsc \end{aligned}</math>

Приближение

Файл:Unnormalized radial basis functions.svg
Две ненормализованных гауссовых радиальных базисных функций одной переменной, c центрами в точках <math>x_1 = 0{,}75</math> и <math>x_2 = 3{,}25</math> соответственно.

Для аппроксимации функций с помощью радиальных базисных функций обычно берётся их линейная комбинация вида:

<math>y\left(\mathbf{x}\right) = \sum_{i=1}^{N} w_{i} \, \phi\left(\left\|\mathbf{x} - \mathbf{x}_i\right\|\right)</math>,

где в качестве аппроксимирующей функции <math>y\left(\mathbf{x}\right)</math> берётся сумма <math>N</math> радиальных базисных функций с центрами в точках <math>\mathbf{x}_{i}</math> и коэффициентами <math>w_{i}</math>. Коэффициенты можно вычислить с помощью метода наименьших квадратов, поскольку аппроксимирующая функция является линейной по отношению к коэффициентам <math>w_{i}</math>.

Аппроксимационные схемы такого рода особенно полезныШаблон:Нет АИ в прогнозировании временных рядов, управлении нелинейных систем, демонстрирующих достаточно простое хаотическое поведение, и 3D-моделировании в компьютерной графике.

Нейронные сети на основе РБФ

Шаблон:Основная статья Линейная комбинация:

<math>y\left(\mathbf{x}\right) = \sum_{i=1}^{N} w_{i} \, \phi\left(\left\|\mathbf{x} - \mathbf{x}_i\right\|\right)</math>

также может быть интерпретирована как простейшая искусственная нейронная сеть с одним слоем, называемая сетью радиально-базисных функций, в которой радиальная базисная функция исполняет роль функции активации. Можно показать, что любая непрерывная функция на компактном интервале в принципе может быть интерполирована с произвольной точностью при достаточно большом <math>N</math>.

Аппроксимации <math>y\left(\mathbf{x}\right)</math> является дифференцируемой по <math>w_{i}</math>. Коэффициенты можно вычислить при помощи любого стандартного итерационного метода для нейронных сетей.

Таким образом, радиальные базисные функции предоставляют собой гибкий инструмент интерполирования при условии, что множество центров более-менее равномерно покрывает область определения искомой функции (в идеале центры должны быть равноудалены от ближайших соседей). Тем не менее, как правило в промежуточных точках аппроксимация достигает высокой точности только если множество радиальных базисных функций дополнено полиномом, ортогональным к каждой из РБФ.

Примечания

Шаблон:Примечания

Литература

Шаблон:Машинное обучение

  1. Radial Basis Function networks Шаблон:Webarchive
  2. Шаблон:Harvard citation no brackets
  3. Шаблон:Статья
  4. Шаблон:Cite thesis
  5. Шаблон:Harvard citation no brackets: «We would like to thank Professor M.J.D. Powell at the Department of Applied Mathematics and Theoretical Physics at Cambridge University for providing the initial stimulus for this work.»
  6. Шаблон:Cite web