Эпоха (в обучении) — это один полный проход алгоритма обучения через весь тренировочный набор данных. Обучение нейросети обычно требует множества эпох, чтобы веса модели достаточно скорректировалис...
Метрика ROUGE
Бонус за регистрацию!
Зарегистрируйся и получи бонус
Метрика ROUGE — это набор метрик, используемых для оценки задач автоматического реферирования (summarization) и машинного перевода. Она измеряет перекрытие n-грамм между сгенерированным текстом и эталонным резюме. ROUGE ориентирована на полноту (насколько полно мы охватили содержание эталона), в отличие от BLEU, ориентированной на точность.
Что такое «Метрика ROUGE» простыми словами
Метрика для оценки кратких пересказов (саммаризации). Она проверяет, насколько полно машина пересказала текст, сравнивая его с эталоном человека. ROUGE смотрит, сколько важных слов и фраз из оригинала попало в результат. Это стандарт для оценки того, насколько хорошо ИИ умеет выделять главное.
Вопросы и ответы
Чем метрика ROUGE, используемая для оценки саммаризации текста, отличается от метрики BLEU?
ROUGE используется для оценки саммаризации. Она измеряет покрытие: сколько n-грамм из эталона попало в сгенерированный текст. Ориентирована на полноту (Recall).
Почему метрика ROUGE фокусируется на полноте (Recall), в отличие от BLEU?
В саммаризации (реферировании) важно, чтобы машина извлекла как можно больше информации из исходного текста. ROUGE измеряет покрытие: сколько n-грамм из эталонного саммари содержится в сгенерированном.
Как ROUGE-L учитывает самую длинную общую подпоследовательность слов?
ROUGE-L находит самую длинную общую последовательность слов (LCS) между текстами. Это позволяет оценить структурное сходство предложений, а не только наличие отдельных слов (как ROUGE-N), что важно для связности саммари.