K-Means
K-Means (Метод k-средних) — это популярный и простой алгоритм кластеризации (обучение без учителя). Он разделяет данные на K кластеров, стремясь минимизировать суммарное квадратичное отклонение точек кластеров от их центров (центроидов). Требует заранее задать количество кластеров K.
Что такое «K-Means» простыми словами
Представьте, что вы рассыпали на полу конфеты разных цветов вперемешку. K-Means — это робот, который хочет разложить их на K кучек. Сначала он ставит корзинки наугад. Потом смотрит: «Ага, тут много красных», и двигает корзинку ближе к ним. И так бегает, пока не найдет центры скоплений конфет. Это самый простой способ сгруппировать похожие данные (кластеризация), даже не зная заранее, что это за группы.