Метрика ROUGE

Метрика ROUGE — это набор метрик, используемых для оценки задач автоматического реферирования (summarization) и машинного перевода. Она измеряет перекрытие n-грамм между сгенерированным текстом и эталонным резюме. ROUGE ориентирована на полноту (насколько полно мы охватили содержание эталона), в отличие от BLEU, ориентированной на точность.

Что такое «Метрика ROUGE» простыми словами

Метрика для оценки кратких пересказов (саммаризации). Она проверяет, насколько полно машина пересказала текст, сравнивая его с эталоном человека. ROUGE смотрит, сколько важных слов и фраз из оригинала попало в результат. Это стандарт для оценки того, насколько хорошо ИИ умеет выделять главное.

Вопросы и ответы

Чем метрика ROUGE, используемая для оценки саммаризации текста, отличается от метрики BLEU?

ROUGE используется для оценки саммаризации. Она измеряет покрытие: сколько n-грамм из эталона попало в сгенерированный текст. Ориентирована на полноту (Recall).

Почему метрика ROUGE фокусируется на полноте (Recall), в отличие от BLEU?

В саммаризации (реферировании) важно, чтобы машина извлекла как можно больше информации из исходного текста. ROUGE измеряет покрытие: сколько n-грамм из эталонного саммари содержится в сгенерированном.

Как ROUGE-L учитывает самую длинную общую подпоследовательность слов?

ROUGE-L находит самую длинную общую последовательность слов (LCS) между текстами. Это позволяет оценить структурное сходство предложений, а не только наличие отдельных слов (как ROUGE-N), что важно для связности саммари.

162

ChatGPT

27.11.2025