Метрика ROUGE

Бонус за регистрацию!
Зарегистрируйся и получи бонус
15 рублей

Метрика ROUGE — это набор метрик, используемых для оценки задач автоматического реферирования (summarization) и машинного перевода. Она измеряет перекрытие n-грамм между сгенерированным текстом и эталонным резюме. ROUGE ориентирована на полноту (насколько полно мы охватили содержание эталона), в отличие от BLEU, ориентированной на точность.

Что такое «Метрика ROUGE» простыми словами

Метрика для оценки кратких пересказов (саммаризации). Она проверяет, насколько полно машина пересказала текст, сравнивая его с эталоном человека. ROUGE смотрит, сколько важных слов и фраз из оригинала попало в результат. Это стандарт для оценки того, насколько хорошо ИИ умеет выделять главное.

Вопросы и ответы
Чем метрика ROUGE, используемая для оценки саммаризации текста, отличается от метрики BLEU?
ROUGE используется для оценки саммаризации. Она измеряет покрытие: сколько n-грамм из эталона попало в сгенерированный текст. Ориентирована на полноту (Recall).
Почему метрика ROUGE фокусируется на полноте (Recall), в отличие от BLEU?
В саммаризации (реферировании) важно, чтобы машина извлекла как можно больше информации из исходного текста. ROUGE измеряет покрытие: сколько n-грамм из эталонного саммари содержится в сгенерированном.
Как ROUGE-L учитывает самую длинную общую подпоследовательность слов?
ROUGE-L находит самую длинную общую последовательность слов (LCS) между текстами. Это позволяет оценить структурное сходство предложений, а не только наличие отдельных слов (как ROUGE-N), что важно для связности саммари.
162
Константин Колясников

Эпоха (в обучении)

Эпоха (в обучении) — это один полный проход алгоритма обучения через весь тренировочный набор данных. Обучение нейросети обычно требует множества эпох, чтобы веса модели достаточно скорректировалис...
Константин Колясников

Цифровая гигиена (в контексте ИИ)

Цифровая гигиена (в контексте ИИ) — это набор практик по безопасному и ответственному использованию технологий ИИ. Включает проверку фактов (борьба с галлюцинациями), защиту личных данных от попада...
Константин Колясников
Термины подгружаются