Локальный минимум
Локальный минимум — это точка на поверхности функции потерь, в которой значение ошибки меньше, чем во всех соседних точках, но может быть больше, чем в глобальном минимуме (самой глубокой точке). При обучении нейросетей градиентный спуск может «застрять» в локальном минимуме, прекратив улучшать модель. Современные методы оптимизации и седловые точки в многомерных пространствах делают эту проблему менее критичной для глубокого обучения.
Что такое «Локальный минимум» простыми словами
Представьте, что вы спускаетесь с горы в тумане и попали в небольшую ямку. Вам кажется, что вы на дне, потому что во все стороны идет подъем. Но на самом деле настоящее дно долины (глобальный минимум) намного ниже. В обучении нейросетей есть риск застрять в таком «локальном минимуме» и перестать улучшать модель, думая, что идеал достигнут.