VGG

Бонус за регистрацию!
новые тарифы и нейросети
Начать

VGG (Visual Geometry Group) — это архитектура глубокой сверточной нейронной сети, известная своей простотой и однородностью. VGG использует только фильтры размера 3×3 во всех слоях, но увеличивает глубину сети (16 или 19 слоев). VGG показала отличные результаты в классификации изображений и часто используется как экстрактор признаков в трансферном обучении.

Что такое «VGG» простыми словами

VGG — это доказательство того, что простота работает. Разработчики сказали: «Не будем мудрить с размерами фильтров, сделаем везде маленькие 3x3, но сделаем сеть очень глубокой». И это сработало! VGG заняла 2 место на ImageNet. Она тяжелая и медленная, но её архитектура настолько проста и понятна, что её до сих пор используют как базу для обучения других сетей.

Вопросы и ответы
Модель сверточной нейронной сети, известная своей простотой и глубиной.
VGG-16 имеет 13 сверточных слоев и 3 полносвязных (всего 16 слоев с весами). Она использовала маленькие фильтры 3x3.
В VGG используются фильтры 3x3, потому что стек из двух слоев 3x3 имеет то же поле восприятия (receptive field), что и один слой 5x5 (5 пикселей), но содержит меньше параметров и имеет две нелинейности вместо одной. Это делает сеть более глубокой и выразительной при тех же ресурсах.
Константин Колясников
Эпоха (в обучении)
Эпоха (в обучении) — это один полный проход алгоритма обучения через весь тренировочный набор данных. Обучение нейросети обычно требует множества эпох, чтобы веса модели достаточно скорректировалис...
Константин Колясников
Цифровая гигиена (в контексте ИИ)
Цифровая гигиена (в контексте ИИ) — это набор практик по безопасному и ответственному использованию технологий ИИ. Включает проверку фактов (борьба с галлюцинациями), защиту личных данных от попада...
Константин Колясников
Загружаем...