Inference
Inference (Инференс) — это стадия работы модели машинного обучения, когда обученная модель применяется к новым, ранее не виденным данным для получения предсказаний (выводов). Инференс требует меньше вычислительных ресурсов, чем обучение, и часто оптимизируется для работы в реальном времени на серверах или граничных устройствах.
Что такое «Inference» простыми словами
Жизнь нейросети делится на два этапа: «Школа» (Training) и «Работа» (Inference). В школе она учится, потеет, тратит много энергии (месяцы на GPU). А на работе (Инференс) она уже всё знает и просто щелкает задачи как орешки за миллисекунды. Инференс — это то, что происходит в вашем телефоне, когда FaceID узнает вас. Модель не учится в этот момент, она применяет знания.