Prompt Diffusion

Prompt diffusion leverages diffusion models to generate images and other data modalities (audio, text) conditioned on various inputs, primarily text prompts but increasingly incorporating visual context and other modalities. Current research focuses on improving in-context learning within these models, enhancing controllability through prompt engineering and embedding manipulation, and exploring prompt-free approaches using only visual input. This rapidly evolving field is significantly impacting image generation, semantic segmentation, and other areas by enabling more flexible, controllable, and efficient generation of high-quality data, particularly in scenarios with limited labeled data.

Papers

October 26, 2024

Prompt Diffusion Robustifies Any-Modality Prompt Learning
Yingjun Du, Gaowen Liu, Yuzhang Shang, Yuguang Yao, Ramana Kompella, Cees G. M. Snoek
Prompt Learning Prompt Learning Method Prompt Diffusion

June 29, 2024

Language-Guided Object-Centric Diffusion Policy for Collision-Aware Robotic Manipulation
Hang Li, Qian Feng, Zhi Zheng, Jianxiang Feng, Alois Knoll
Strong Generalization Obstacle Avoidance 3d Representation Diffusion Policy Prompt Diffusion

January 2, 2024

ColorizeDiffusion: Adjustable Sketch Colorization with Reference Image and Text
Dingkun Yan, Liang Yuan, Yuma Nishioka, Issei Fujishiro, Suguru Saito
Text Modality Reference Image Prompt Diffusion Sketch Colorization

December 3, 2023

Improving In-Context Learning in Diffusion Models with Visual Context-Modulated Prompts
Tianqi Chen, Yongfei Liu, Zhendong Wang, Jianbo Yuan, Quanzeng You, Hongxia Yang, Mingyuan Zhou
Diffusion Model Context Learning Visual Context Domain Invariant Prompt Prompt Diffusion Textual Guidance

October 15, 2023

GPT-Prompt Controlled Diffusion for Weakly-Supervised Semantic Segmentation
Wangyu Wu, Tianhong Dai, Xiaowei Huang, Fei Ma, Jimin Xiao
Semantic Segmentation Segmentation Model Weakly Supervised Semantic Segmentation Image Level Label Prompt Diffusion

August 23, 2023

Manipulating Embeddings of Stable Diffusion Prompts
Niklas Deckers, Julia Peters, Martin Potthast
Image Generation Prompt Engineering Prompt Embeddings Generative Text to Image Model Prompt Diffusion

May 25, 2023

Prompt-Free Diffusion: Taking "Text" out of Text-to-Image Diffusion Models
Xingqian Xu, Jiayi Guo, Zhangyang Wang, Gao Huang, Irfan Essa, Humphrey Shi
Text Modality Pre Trained Text to Image Diffusion Model Text to Image Textual Prompt Prompt Diffusion

May 6, 2023

Diffusion-NAT: Self-Prompting Discrete Diffusion for Non-Autoregressive Text Generation
Kun Zhou, Yifan Li, Wayne Xin Zhao, Ji-Rong Wen
Diffusion Model Text Generation Discrete Diffusion Model Pre Trained Language Autoregressive Text Generation Prompt Diffusion

May 1, 2023

In-Context Learning Unlocked for Diffusion Models
Zhendong Wang, Yifan Jiang, Yadong Lu, Yelong Shen, Pengcheng He, Weizhu Chen, Zhangyang Wang, Mingyuan Zhou
Diffusion Model Context Learning Diffusion Based Generative Model Prompt Diffusion

January 30, 2023

Make-An-Audio: Text-To-Audio Generation with Prompt-Enhanced Diffusion Models
Rongjie Huang, Jiawei Huang, Dongchao Yang, Yi Ren, Luping Liu, Mingze Li, Zhenhui Ye, Jinglin Liu, Xiang Yin, Zhou Zhao
Self Supervised Text to Audio Generation Audio Text Pair Contrastive Language Audio Pretraining Prompt Diffusion Generative Multimodal Model