Natural Language Generation

Natural Language Generation (NLG) focuses on creating human-readable text from structured data or other inputs. Current research emphasizes improving the accuracy and fluency of generated text, particularly addressing issues like information omission and biases stemming from the dominance of English in training data, and exploring diverse model architectures such as transformers. A significant focus is on developing more reliable and nuanced evaluation methods, moving beyond simple metrics to incorporate human judgment and address challenges like detecting hallucinations and ensuring fairness. These advancements have implications for various applications, including improved search engine advertising, more effective educational tools, and enhanced accessibility for low-resource languages.

Papers

March 17, 2022

RoMe: A Robust Metric for Evaluating Natural Language Generation
Md Rashad Al Hasan Rony, Liubov Kovriguina, Debanjan Chaudhuri, Ricardo Usbeck, Jens Lehmann
Language Understanding Language Generation Natural Language Generation Robustness Evaluation Generated Text Automatic Evaluation Metric Quality Sentence

March 10, 2022

March 6, 2022

Recent Advances in Neural Text Generation: A Task-Agnostic Survey
Chen Tang, Frank Guerin, Chenghua Lin
Language Generation Recent Advance Neural Model Natural Language Generation Task Agnostic Deep Learning Pipeline Neural Text Generation

March 5, 2022

The Proof is in the Pudding: Using Automated Theorem Proving to Generate Cooking Recipes
Louis Mahon, Carl Vogel
Language Generation Natural Language Generation Theorem Proving Partial Proof Recipe Generation Content Creator Content Selection

February 14, 2022

Repairing the Cracked Foundation: A Survey of Obstacles in Evaluation Practices for Generated Text
Sebastian Gehrmann, Elizabeth Clark, Thibault Sellam
Timely Survey Language Generation Natural Language Generation Generated Text Multiple Obstacle Evaluation Practice

January 16, 2022

WANLI: Worker and AI Collaboration for Natural Language Inference Dataset Creation
Alisa Liu, Swabha Swayamdipta, Noah A. Smith, Yejin Choi
Natural Language Natural Language Inference Human Ai Collaboration Natural Language Generation Co Worker Adversarial Natural Language

December 23, 2021

Measuring Attribution in Natural Language Generation Models
Hannah Rashkin, Vitaly Nikolaev, Matthew Lamm, Lora Aroyo, Michael Collins, Dipanjan Das, Slav Petrov, Gaurav Singh Tomar, Iulia Turc, David Reitter
Language Generation Natural Language Generation Source Attribution Language Generation Model Dataset Generation Conversational QA

December 22, 2021

A Survey of Natural Language Generation
Chenhe Dong, Yinghui Li, Haifan Gong, Miaoxin Chen, Junxin Li, Ying Shen, Min Yang
Timely Survey Text Generation Language Generation Natural Language Generation Data to Text Generation

December 15, 2021

Dynamic Human Evaluation for Relative Model Comparisons
Thórhildur Thorleiksdóttir, Cedric Renggli, Nora Hollenstein, Ce Zhang
Human Annotation Human Evaluation Natural Language Generation Model Comparison Interactive Evaluation Crowdsourcing Study

December 5, 2021

Protecting Intellectual Property of Language Generation APIs with Lexical Watermark
Xuanli He, Qiongkai Xu, Lingjuan Lyu, Fangzhao Wu, Chenguang Wang
Language Generation Natural Language Generation Intellectual Property

December 2, 2021

InfoLM: A New Metric to Evaluate Summarization & Data2Text Generation
Pierre Colombo, Chloe Clavel, Pablo Piantanida
Language Model Structured Summary Natural Language Generation Data to Text Generation Novel Metric String Based Metric

Natural Language Generation

Papers

RoMe: A Robust Metric for Evaluating Natural Language Generation

IndicNLG Benchmark: Multilingual Datasets for Diverse NLG Tasks in Indic Languages

Faithfulness in Natural Language Generation: A Systematic Survey of Analysis, Evaluation and Optimization Methods

Recent Advances in Neural Text Generation: A Task-Agnostic Survey

The Proof is in the Pudding: Using Automated Theorem Proving to Generate Cooking Recipes

Repairing the Cracked Foundation: A Survey of Obstacles in Evaluation Practices for Generated Text

WANLI: Worker and AI Collaboration for Natural Language Inference Dataset Creation

Measuring Attribution in Natural Language Generation Models

A Survey of Natural Language Generation

Dynamic Human Evaluation for Relative Model Comparisons

Protecting Intellectual Property of Language Generation APIs with Lexical Watermark

InfoLM: A New Metric to Evaluate Summarization & Data2Text Generation