DBSCAN
DBSCAN (Density-Based Spatial Clustering of Applications with Noise) — это популярный алгоритм кластеризации, который группирует точки, расположенные близко друг к другу (с высокой плотностью), и помечает как выбросы точки, находящиеся в областях с низкой плотностью. Он способен находить кластеры произвольной формы без предварительного задания их количества.
Что такое «DBSCAN» простыми словами
Большинство алгоритмов кластеризации ищут круглые кучки данных (K-Means). Но в жизни данные могут выстраиваться в дуги, спирали или кляксы. DBSCAN — это умный алгоритм, который ищет «плотные» места. Он идет от точки к точке, как муравей: «Тут есть соседи? Идем дальше». Он отлично находит кластеры любой странной формы и, что важно, умеет игнорировать одинокие точки-выбросы (шум), не включая их ни в одну группу.