the latest in aiBeta

Truncation Sampling

Truncation sampling is a technique used to improve the quality and diversity of text generated by large language models (LLMs) and enhance the performance of diffusion-based generative models. Current research focuses on developing adaptive truncation methods, such as min-p sampling and η-sampling, that dynamically adjust probability thresholds to balance coherence and creativity, addressing limitations of simpler methods like top-k and top-p. These advancements aim to mitigate issues like exposure bias and neural text degeneration, leading to more fluent and diverse outputs with improved applications in tasks ranging from text generation to spam classification and image generation.

9papers

Papers

April 2, 2025

When to Truncate the Archive? On the Effect of the Truncation Frequency in Multi-Objective Optimisation
Multi Objective Optimisation Documentation Accuracy Multi Objective Evolutionary Algorithm Pareto Optimal Truncation Sampling Mixed Effect Subset Selection

August 24, 2024

Balancing Diversity and Risk in LLM Sampling: How to Select Your Method and Parameter for Open-Ended Text Generation
Open Ended Text Generation High Quality Risk Description Truncation Sampling Practical Method Diversity Enhancement

July 1, 2024

Turning Up the Heat: Min-p Sampling for Creative and Coherent LLM Outputs
Discourse Coherence Truncation Sampling Text Generation High Temperature Parallel Sampling

May 24, 2024

Zero-Shot Spam Email Classification Using Pre-trained Large Language Models
Pre Trained Large Language Model Zero Shot Text Classification Truncation Sampling Email Spam Detection

March 8, 2024

Improving Diffusion-Based Generative Models via Approximated Optimal Transport
Generative Model Diffusion Based Generative Model Diffusion Model Optimal Transport Truncation Sampling

October 2, 2023

Closing the Curious Case of Neural Text Degeneration
Text Degeneration Open Ended Text Generation Truncation Sampling Large Language Model Language Generation

September 5, 2023

Bilevel Scheduled Sampling for Dialogue Generation
Open Sampling Sentence Level Stochastic Sampling Dialogue Generation Exposure Bias Bilevel Optimization Truncation Sampling

December 16, 2022

Estimating truncation effects of quantum bosonic systems using sampling algorithms
Truncation Sampling Quantum Simulation Practical Algorithm Quantum Physic Quantum Application

October 27, 2022

Truncation Sampling as Language Model Desmoothing
Language Modelling Sample Quality Balanced Truncation Neural Language Model Language Model Truncation Sampling

February 11, 2022

Multi-level Latent Space Structuring for Generative Control
Generative Control Generative Model Latent Space Truncation Sampling Generative Design