Data Drift
Data Drift (Дрейф данных) — это изменение статистических характеристик входных данных с течением времени, которое приводит к снижению точности модели. Дрейф может быть вызван сезонностью, изменением предпочтений пользователей или внешними событиями. Мониторинг дрейфа — обязательная часть MLOps.
Что такое «Data Drift» простыми словами
Представьте, что вы обучили ИИ предсказывать спрос на мороженое. Модель отлично работала 5 лет. Но вдруг случилась пандемия или изменился климат. Поведение людей изменилось, старые закономерности больше не работают. Это Дрейф данных. Модель не сломалась технически, но она «сошла с ума», потому что реальность вокруг изменилась. Поэтому за моделями нужно следить вечно и переобучать их на свежих данных.