Document Summary Pair

Document summary pairs, comprising a source document and its corresponding summary, are central to advancing automatic summarization. Research focuses on improving the faithfulness and quality of these pairs, addressing issues like hallucination (where summaries contain unsupported information) and developing multilingual datasets to overcome the current English-language bias. This involves exploring novel training methods, such as contrastive learning and unlikelihood loss, and leveraging graph-based representations to capture document relationships more effectively. These advancements are crucial for enhancing the accuracy and applicability of summarization models across diverse languages and document types.

Papers

December 10, 2024

Subtopic-aware View Sampling and Temporal Aggregation for Long-form Document Matching
Youchao Zhou, Heyan Huang, Zhijing Wu, Yuhang Liu, Xinglin Wang
Long Document Document Summary Pair Topic Structure Document Comparison

November 28, 2024

Pralekha: An Indic Document Alignment Evaluation Benchmark
Sanjay Suryanarayanan, Haiyue Song, Mohammed Safi Ur Rahman Khan, Anoop Kunchukuttan, Mitesh M. Khapra, Raj Dabre
Unstructured Text Word Alignment Document Summary Pair

October 22, 2024

Distill-SynthKG: Distilling Knowledge Graph Synthesis Workflow for Improved Coverage and Efficiency
Prafulla Kumar Choubey, Xin Su, Man Luo, Xiangyu Peng, Caiming Xiong, Tiep Le, Shachar Rosenman, Vasudev Lal, Phil Mui, Ricky Ho, Phillip Howard, Chien-Sheng Wu
Large Language Model Knowledge Graph High Efficiency Retrieval Augmented Generation Knowledge Base Construction Document Summary Pair Entity Coverage

August 1, 2024

Leveraging Entailment Judgements in Cross-Lingual Summarisation
Huajian Zhang, Laura Perez-Beltrachini
Textual Entailment Cross Lingual Natural Language Inference Monolingual Summarization Document Summary Pair

July 17, 2024

M2DS: Multilingual Dataset for Multi-document Summarisation
Kushan Hewapathirana, Nisansa de Silva, C. D. Athuraliya
Multilingual Dataset Diverse Datasets Document Summary Pair Multi Document Summarisation

June 6, 2024

ABEX: Data Augmentation for Low-Resource NLU via Expanding Abstract Descriptions
Sreyan Ghosh, Utkarsh Tyagi, Sonal Kumar, C. K. Evuru, S Ramaneswaran, S Sakshi, Dinesh Manocha
Data Augmentation Generative Data Augmentation Natural Language Understanding Task X Klaim Abstract Text Document Summary Pair

February 7, 2024

Source Identification in Abstractive Summarization
Yoshi Suhara, Dimitris Alikaniotis
Abstractive Summarization Abstractive Summary Abstractive Summarization Model Reference Summary Source Identification Document Summary Pair

February 6, 2024

Sparse Graph Representations for Procedural Instructional Documents
Shruti Singh, Rishabh Gupta
Sparse Graph Pairwise Similarity Procedural Text Document Similarity Document Summary Pair

May 10, 2023

Unsupervised Dense Retrieval Training with Web Anchors
Yiqing Xie, Xiao Liu, Chenyan Xiong
Contrastive Learning Dense Retrieval Visual Information Anchor Unsupervised Image Retrieval Document Summary Pair

September 12, 2022

One-Shot Doc Snippet Detection: Powering Search in Document Beyond Text
Abhinav Java, Shripad Deshmukh, Milan Aggarwal, Surgan Jandial, Mausoom Sarkar, Balaji Krishnamurthy
Text Modality Document Understanding Structured Document Full Length Document Snippet Extraction Document Summary Pair

August 28, 2022

Podcast Summary Assessment: A Resource for Evaluating Summary Assessment Methods
Potsawee Manakul, Mark J. F. Gales
New Resource Evaluation Practice Document Summary Pair Podcast Summary Assessment