Детектирование объектов (Object Detection)

Бонус за регистрацию!
Зарегистрируйся и получи бонус
15 рублей

Детектирование объектов (Object Detection) — это технология компьютерного зрения, связанная с обнаружением экземпляров семантических объектов определенного класса (например, людей, зданий или автомобилей) на цифровых изображениях и видео. В отличие от простой классификации, детектирование не только говорит «что» на фото, но и «где» (рисует ограничивающую рамку). Популярные архитектуры: семейство YOLO, SSD, Faster R-CNN.

Что такое «Детектирование объектов (Object Detection)» простыми словами

Это способность компьютера не просто сказать «на фото есть собака», а показать пальцем (рамкой), где именно она сидит, и где рядом стоит велосипед. Детектирование объектов находит и классифицирует множество предметов на одной картинке одновременно. Без этой технологии не могли бы ездить беспилотные автомобили — им нужно мгновенно видеть всех пешеходов, знаки и машины вокруг.

Вопросы и ответы
Чем задача детектирования объектов (Object Detection) отличается от простой классификации изображений?
Классификация определяет, что изображено на фото (класс). Детектирование (Object Detection) не только определяет класс, но и локализует объект, рисуя вокруг него прямоугольную рамку (bounding box) и позволяя считать объекты.
Что показывает метрика IoU (Intersection over Union) при оценке качества детекции объектов?
IoU (Intersection over Union) — это отношение площади пересечения предсказанной рамки и реальной (ground truth) к площади их объединения. IoU измеряет точность локализации объекта. Значение > 0.5 обычно считается успешным детектированием.
Что такое Non-Maximum Suppression (NMS) и как оно убирает дублирующиеся рамки в детекции?
Алгоритмы детекции часто предсказывают несколько рамок вокруг одного объекта с разной уверенностью. NMS сортирует рамки по уверенности и удаляет те, которые сильно перекрываются (IoU > порог) с уже выбранной лучшей рамкой, оставляя только одну на объект.
109
Константин Колясников

Эпоха (в обучении)

Эпоха (в обучении) — это один полный проход алгоритма обучения через весь тренировочный набор данных. Обучение нейросети обычно требует множества эпох, чтобы веса модели достаточно скорректировалис...
Константин Колясников

Цифровая гигиена (в контексте ИИ)

Цифровая гигиена (в контексте ИИ) — это набор практик по безопасному и ответственному использованию технологий ИИ. Включает проверку фактов (борьба с галлюцинациями), защиту личных данных от попада...
Константин Колясников
Термины подгружаются