One-Hot Encoding
One-Hot Encoding — это популярный метод кодирования категориальных переменных для использования в алгоритмах машинного обучения. Каждая категория превращается в бинарный вектор, где только один элемент равен 1 (hot), а остальные — 0. Это позволяет избежать ложного упорядочивания категорий, которое может возникнуть при использовании Label Encoding, но значительно увеличивает размерность данных при большом числе уникальных значений.
Что такое «One-Hot Encoding» простыми словами
Как объяснить компьютеру цвета? Красный=1, Синий=2? Тогда Синий будет «в два раза больше» Красного. Это бред. One-Hot Encoding создает новые колонки: «Это Красный?», «Это Синий?». И ставит 1 или 0. Теперь цвета равноправны, никакой ложной математики. Это самый надежный способ превратить категории в числа, понятные нейросети, хотя таблица становится шире.