Аугментации
Аугментация данных представляет собой комплекс методов и техник искусственного расширения обучающей выборки путём создания модифицированных версий исходных данных. Этот процесс включает применение различных преобразований, сохраняющих семантическую значимость данных: геометрические трансформации (поворот, масштабирование, сдвиг), изменения интенсивности, добавление шума, цветовые преобразования, а также более сложные модификации с использованием генеративных моделей. Аугментация является ключевым инструментом в глубоком обучении, позволяющим улучшить обобщающую способность моделей и предотвратить переобучение.
Что такое «Аугментации» простыми словами
Представьте, что у вас есть одна фотография цветка, но вам нужно научить компьютер узнавать этот цветок с разных ракурсов и при разном освещении. Аугментация позволяет из одной фотографии сделать много разных версий: повернуть её, сделать ярче или темнее, немного размыть или увеличить часть изображения. Это похоже на то, как если бы вы учили ребёнка узнавать кошку, показывая ему одну и ту же кошку в разных положениях - спящей, бегущей, сидящей. Так компьютер учится лучше распознавать объекты в разных условиях.