Textual Guidance

Textual guidance in AI focuses on using text descriptions to control the generation and manipulation of visual data, including images, videos, and 3D models. Current research emphasizes improving the accuracy and efficiency of this control, exploring techniques like cross-frame textual guidance for video generation and visual context-modulated prompts for diffusion models. This field is crucial for advancing AI's creative capabilities and mitigating safety concerns, such as generating inappropriate content, through methods like adversarial prompt detection. The development of robust and reliable textual guidance is vital for numerous applications, ranging from content creation to image editing and 3D modeling.

Papers

August 15, 2024

FancyVideo: Towards Dynamic and Consistent Video Generation via Cross-frame Textual Guidance
Jiasong Feng, Ao Ma, Jing Wang, Bo Cheng, Xiaodan Liang, Dawei Leng, Yuhui Yin
Video Generation Temporal Feature Text to Video Synthesized Motion Textual Guidance

March 3, 2024

GuardT2I: Defending Text-to-Image Models from Adversarial Prompts
Yijun Yang, Ruiyuan Gao, Xiao Yang, Jianyuan Zhong, Qiang Xu
Text to Image Model Text to Image Adversarial Prompt Adversarial Scenario Textual Guidance

December 9, 2023

Perceptual Similarity guidance and text guidance optimization for Editing Real Images using Guided Diffusion Models
Ruichen Zhang
Diffusion Model Image Editing Latent Vector Real Image Perceptual Guidance Textual Guidance

December 3, 2023

Improving In-Context Learning in Diffusion Models with Visual Context-Modulated Prompts
Tianqi Chen, Yongfei Liu, Zhendong Wang, Jianbo Yuan, Quanzeng You, Hongxia Yang, Mingyuan Zhou
Diffusion Model Context Learning Visual Context Domain Invariant Prompt Prompt Diffusion Textual Guidance

March 28, 2023

X-Mesh: Towards Fast and Accurate Text-driven 3D Stylization via Dynamic Textual Guidance
Yiwei Ma, Xiaioqing Zhang, Xiaoshuai Sun, Jiayi Ji, Haowei Wang, Guannan Jiang, Weilin Zhuang, Rongrong Ji
Attention Network Mesh Ratio 3D Scene Stylization 3D Stylization Isomorphic Mesh Textual Guidance

Textual Guidance

Papers

FancyVideo: Towards Dynamic and Consistent Video Generation via Cross-frame Textual Guidance

GuardT2I: Defending Text-to-Image Models from Adversarial Prompts

Perceptual Similarity guidance and text guidance optimization for Editing Real Images using Guided Diffusion Models

Improving In-Context Learning in Diffusion Models with Visual Context-Modulated Prompts

X-Mesh: Towards Fast and Accurate Text-driven 3D Stylization via Dynamic Textual Guidance