Русская Википедия:Разведочный анализ данных

Материал из Онлайн справочника
Версия от 03:03, 10 сентября 2023; EducationBot (обсуждение | вклад) (Новая страница: «{{Русская Википедия/Панель перехода}} '''Разведочный анализ данных''' ({{lang-en|exploratory data analysis, EDA}}) — анализ основных свойств данных, нахождение в них общих закономерностей, распределений и аномалий, построение начальных моделей, зачастую с использованием и...»)
(разн.) ← Предыдущая версия | Текущая версия (разн.) | Следующая версия → (разн.)
Перейти к навигацииПерейти к поиску

Разведочный анализ данных (Шаблон:Lang-en) — анализ основных свойств данных, нахождение в них общих закономерностей, распределений и аномалий, построение начальных моделей, зачастую с использованием инструментов визуализации.

Понятие введено математиком Джоном Тьюки, который сформулировал цели такого анализа следующим образом:

  • максимальное «проникновение» в данные,
  • выявление основных структур,
  • выбор наиболее важных переменных,
  • обнаружение отклонений и аномалий,
  • проверка основных гипотез,
  • разработка начальных моделей.

Основные средства разведочного анализа — изучение вероятностных распределений переменных, построение и анализ корреляционных матриц, факторный анализ, дискриминантный анализ, многомерное шкалирование.

Литература

Шаблон:Rq Шаблон:Перевести