Paraphrase Generation

Paraphrase generation, the task of rewriting text while preserving meaning, is a core area of natural language processing research focused on improving both the quality and diversity of generated text. Current research emphasizes leveraging large language models (LLMs) and diffusion models, often incorporating techniques like knowledge distillation, in-context learning, and syntactic control to enhance generation capabilities and address challenges such as hallucination and maintaining semantic consistency. This field is crucial for applications ranging from improving the accessibility of complex texts to mitigating the spread of harmful or misleading AI-generated content, and its advancements are driving progress in various NLP tasks.

Papers

October 23, 2023

Paraphrase Types for Generation and Detection
Jan Philip Wahle, Bela Gipp, Terry Ruas
Data Detection Faithful Generation Paraphrase Generation Paraphrase Detection

October 20, 2023

A Quality-based Syntactic Template Retriever for Syntactically-controlled Paraphrase Generation
Xue Zhang, Songming Zhang, Yunlong Liang, Yufeng Chen, Jian Liu, Wenjuan Han, Jinan Xu
Paraphrase Generation High Quality Paraphrase Syntactic Graph Syntactic Template

October 16, 2023

Demonstrations Are All You Need: Advancing Offensive Content Paraphrasing using In-Context Learning
Anirudh Som, Karan Sikka, Helen Gent, Ajay Divakaran, Andreas Kathol, Dimitra Vergyri
Context Learning Noisy Demonstration Paraphrase Generation Offensive Content Hard Paraphrase

October 5, 2023

Automatic and Human-AI Interactive Text Generation
Yao Dou, Philippe Laban, Claire Gardent, Wei Xu
Text Generation Language Generation Natural Language Generation Paraphrase Generation

July 28, 2023

Multilingual Lexical Simplification via Paraphrase Generation
Kang Liu, Jipeng Qiang, Yun Li, Yunhao Yuan, Yi Zhu, Kaixun Hua
Language Model Paraphrase Generation Zero Shot Translation Lexical Simplification

June 20, 2023

Explicit Syntactic Guidance for Neural Text Generation
Yafu Li, Leyang Cui, Jianhao Yan, Yongjing Yin, Wei Bi, Shuming Shi, Yue Zhang
Sequence to Sequence Paraphrase Generation Text Generation Model Structured Generation Neural Text Generation Syntactic Representation Generative Grammar

June 8, 2023

Emotion and Sentiment Guided Paraphrasing
Justin J. Xie, Ameeta Agrawal
Underlying Emotion Paraphrase Generation Fine Grained Emotion Paraphrase Evaluation

May 26, 2023

May 22, 2023

ChatGPT to Replace Crowdsourcing of Paraphrases for Intent Classification: Higher Diversity and Comparable Model Robustness
Jan Cegin, Jakub Simko, Peter Brusilovsky
ChatGPT Generated Conversation Text Generation Crowdsourcing Context Intent Classification Paraphrase Generation High Quality Paraphrase Crowdsourcing Study

May 14, 2023

ParaLS: Lexical Substitution via Pretrained Paraphraser
Jipeng Qiang, Kang Liu, Yun Li, Yunhao Yuan, Yi Zhu
Language Model Pre Trained Language Model Paraphrase Generation Effective Paraphrasing Lexical Substitution

March 23, 2023

Paraphrasing evades detectors of AI-generated text, but retrieval is an effective defense
Kalpesh Krishna, Yixiao Song, Marzena Karpinska, John Wieting, Mohit Iyyer
Large Language Model App to App Retrieval AI Generated Text Paraphrase Generation Defense Method State of the Art Detector AI Generated Text Detection AI Generated Effective Paraphrasing

March 17, 2023

More Robust Schema-Guided Dialogue State Tracking via Tree-Based Paraphrase Ranking
A. Coca, B. H. Tseng, W. Lin, B. Byrne
Task Oriented Dialogue State Tracking Paraphrase Generation Refined Schema Natural Language Task Description

February 6, 2023

Coherence and Diversity through Noise: Self-Supervised Paraphrase Generation via Structure-Aware Denoising
Rishabh Gupta, Venktesh V., Mukesh Mohania, Vikram Goyal
Industrial Disturbing Noise Diversity Awareness Discourse Coherence Paraphrase Generation Effective Paraphrasing General Corpus

January 17, 2023

Syntactically Robust Training on Partially-Observed Data for Open Information Extraction
Ji Qi, Yuxiang Chen, Lei Hou, Juanzi Li, Bin Xu
Robust Training Paraphrase Generation Open Information Extraction Syntactic Feature Syntactic Evaluation

January 5, 2023

Language as a Latent Sequence: deep latent variable models for semi-supervised paraphrase generation
Jialin Yu, Alexandra I. Cristea, Anoushka Harit, Zhongtian Sun, Olanrewaju Tahir Aduragba, Lei Shi, Noura Al Moubayed
Human Language Latent Variable Model Paraphrase Generation Variable Model Paraphrase Detection Latent Sequence

November 2, 2022

Unsupervised Syntactically Controlled Paraphrase Generation with Abstract Meaning Representations
Kuan-Hao Huang, Varun Iyer, Anoop Kumar, Sriram Venkatapathy, Kai-Wei Chang, Aram Galstyan
Unsupervised Setting Paraphrase Generation Abstract Meaning Representation Syntactic Information Paraphrase Pair

October 25, 2022

Revision for Concision: A Constrained Paraphrase Generation Task
Wenchuan Mu, Kwan Hui Lim
Natural Language Processing Task Paraphrase Generation Text REVISION

October 19, 2022

A Data-Driven Investigation of Noise-Adaptive Utterance Generation with Linguistic Modification
Anupama Chingacham, Vera Demberg, Dietrich Klakow
Speech Synthesis Speech Intelligibility Speech Generation Paraphrase Generation Speech Perception Language Change

Paraphrase Generation

Papers

Paraphrase Types for Generation and Detection

A Quality-based Syntactic Template Retriever for Syntactically-controlled Paraphrase Generation

Demonstrations Are All You Need: Advancing Offensive Content Paraphrasing using In-Context Learning

Automatic and Human-AI Interactive Text Generation

Multilingual Lexical Simplification via Paraphrase Generation

Explicit Syntactic Guidance for Neural Text Generation

Emotion and Sentiment Guided Paraphrasing

PIP: Parse-Instructed Prefix for Syntactically Controlled Paraphrase Generation

Impossible Distillation: from Low-Quality Model to High-Quality Dataset & Model for Summarization and Paraphrasing

ParaAMR: A Large-Scale Syntactically Diverse Paraphrase Dataset by AMR Back-Translation

ChatGPT to Replace Crowdsourcing of Paraphrases for Intent Classification: Higher Diversity and Comparable Model Robustness

ParaLS: Lexical Substitution via Pretrained Paraphraser

Paraphrasing evades detectors of AI-generated text, but retrieval is an effective defense

More Robust Schema-Guided Dialogue State Tracking via Tree-Based Paraphrase Ranking

Coherence and Diversity through Noise: Self-Supervised Paraphrase Generation via Structure-Aware Denoising

Syntactically Robust Training on Partially-Observed Data for Open Information Extraction

Language as a Latent Sequence: deep latent variable models for semi-supervised paraphrase generation

Unsupervised Syntactically Controlled Paraphrase Generation with Abstract Meaning Representations

Revision for Concision: A Constrained Paraphrase Generation Task

A Data-Driven Investigation of Noise-Adaptive Utterance Generation with Linguistic Modification