Machine Generated

Machine-generated text detection focuses on distinguishing computer-generated content from human-written text, driven by the increasing sophistication of large language models (LLMs). Current research emphasizes developing robust and generalizable detection methods, often employing transformer-based architectures and exploring techniques like watermarking, rewriting analysis, and multi-modal approaches (combining text, image, and audio data). This field is crucial for mitigating the risks of misinformation, plagiarism, and other forms of malicious use of LLMs, impacting various sectors including journalism, education, and online content moderation.

Papers

February 22, 2024

Watermarking Makes Language Models Radioactive
Tom Sander, Pierre Fernandez, Alain Durmus, Matthijs Douze, Teddy Furon
Machine Generated Agnostic Watermarking Robust Watermark LLM Generated Text LLM Watermarking Synthetic Instruction

February 19, 2024

February 18, 2024

Stumbling Blocks: Stress Testing the Robustness of Machine-Generated Text Detectors Under Attacks
Yichen Wang, Shangbin Feng, Abe Bohan Hou, Xiao Pu, Chao Shen, Xiaoming Liu, Yulia Tsvetkov, Tianxing He
Large Language Model Native Robustness New Attack Machine Generated Machine Generated Text Movable Obstacle Continuous Chronic Stress

February 17, 2024

January 23, 2024

Raidar: geneRative AI Detection viA Rewriting
Chengzhi Mao, Carl Vondrick, Hao Wang, Junfeng Yang
Generated Content Machine Generated AI Generated Text GAN Image AI Content Detection

January 22, 2024

Spotting LLMs With Binoculars: Zero-Shot Detection of Machine-Generated Text
Abhimanyu Hans, Avi Schwarzschild, Valeriia Cherepanova, Hamid Kazemi, Aniruddha Saha, Micah Goldblum, Jonas Geiping, Tom Goldstein
Data Detection Medical LLM Machine Generated Monocular Camera Multiple Detector LLM Detector

January 17, 2024

Deciphering Textual Authenticity: A Generalized Strategy through the Lens of Large Language Semantics for Detecting Human vs. Machine-Generated Text
Mazal Bethany, Brandon Wherry, Emet Bethany, Nishant Vishwamitra, Anthony Rios, Peyman Najafirad
Text Generation Large Language Machine Generated Human Detection Multi Layer Generator Diverse Domain Deterministic Strategy Text Tampering

January 16, 2024

AiGen-FoodReview: A Multimodal Dataset of Machine-Generated Restaurant Reviews and Images on Social Media
Alessandro Gambetti, Qiwei Han
Social Medium Multimodal Dataset Machine Generated Fake Speech User Generated Content Fake Review Food Development Fake Review Detection

January 15, 2024

Authorship Obfuscation in Multilingual Machine-Generated Text Detection
Dominik Macko, Robert Moro, Adaku Uchendu, Ivan Srba, Jason Samuel Lucas, Michiharu Yamashita, Nafis Irtiza Tripto, Dongwon Lee, Jakub Simko, Maria Bielikova
Machine Generated Machine Generated Text Text Generation Capability Multilingual Detection Authorship Obfuscation Homoglyph Attack

January 12, 2024

Few-Shot Detection of Machine-Generated Text using Style Representations
Rafael Rivera Soto, Kailin Koch, Aleem Khan, Barry Chen, Marcus Bishop, Nicholas Andrews
Large Language Model Language Model Data Detection Style Representation Machine Generated Human Authored Text

January 11, 2024

LLM-as-a-Coauthor: Can Mixed Human-Written and Machine-Generated Text Be Detected?
Qihui Zhang, Chujie Gao, Dongping Chen, Yue Huang, Yixin Huang, Zhenyang Sun, Shilin Zhang, Weiye Li, Zhengyan Fu, Yao Wan, Lichao Sun
Machine Generated

January 8, 2024

TextMachina: Seamless Generation of Machine-Generated Text Datasets
Areg Mikael Sarvazyan, José Ángel González, Marc Franco-Salvador
Machine Generated Efficient Pipeline Controllable Generation

January 2, 2024

Detection of Machine-Generated Text: Literature Survey
Dmytro Valiaiev
Language Model Data Detection Machine Generated Generated Text Literature Survey

December 4, 2023

STADEE: STAtistics-based DEEp Detection of Machine Generated Text
Zheng Chen, Huming Liu
Pre Trained Language Model Machine Generated Deep Learning Classification Arena Hard Statistical Feature

December 1, 2023

Mark My Words: Analyzing and Evaluating Language Model Watermarks
Julien Piet, Chawin Sitawarin, Vivian Fang, Norman Mu, David Wagner
Language Model Word List Watermarking Method Machine Generated Text Watermarking Imperceptible Watermark

November 29, 2023

I Know You Did Not Write That! A Sampling Based Watermarking Method for Identifying Machine Generated Text
Kaan Efe Keleş, Ömer Kaan Gürbüz, Mucahid Kutlu
Watermarking Method Machine Generated Agnostic Watermarking Generated Text Quality Text

November 21, 2023