PCA (Principal Component Analysis)
PCA (Principal Component Analysis, Метод главных компонент) — это статистический метод снижения размерности данных, который преобразует набор коррелирующих переменных в меньший набор некоррелирующих переменных, называемых главными компонентами. PCA находит направления (векторы) максимальной дисперсии данных, позволяя сжать информацию и визуализировать многомерные данные с минимальной потерей информации.
Что такое «PCA (Principal Component Analysis)» простыми словами
Представьте, что вы фотографируете чайник. Сверху — это круг. Сбоку — прямоугольник с носом. Данные многомерны. PCA (Метод главных компонент) находит такой ракурс (проекцию), с которого чайник виден лучше всего, где больше всего информации. Он сжимает 100 признаков в 2-3 главных «супер-признака», сохраняя суть данных. Это позволяет нарисовать на плоскости то, что живет в 100-мерном пространстве.