Human Editing

Human-computer interaction is being revolutionized by advancements in "human editing," encompassing the ability to generate and modify various data modalities (images, audio, text, 3D models) using natural language instructions or other forms of user input. Current research heavily utilizes diffusion models and large language models (LLMs), often integrated within multimodal frameworks, to achieve precise and flexible control over the editing process, addressing challenges like hallucination and ambiguity. This field is significant for its potential to improve accessibility in creative fields, enhance the efficiency of content creation, and advance our understanding of how humans interact with and interpret AI-generated content.

Papers

January 3, 2024

Moonshot: Towards Controllable Video Generation and Editing with Multimodal Conditions
David Junhao Zhang, Dongxu Li, Hung Le, Mike Zheng Shou, Caiming Xiong, Doyen Sahoo
Video Diffusion Model Human Editing Controllable Video Generation Multimodal Video

December 26, 2023

SERF: Fine-Grained Interactive 3D Segmentation and Editing with Radiance Fields
Kaichen Zhou, Lanqing Hong, Enze Xie, Yongxin Yang, Zhenguo Li, Wei Zhang
Fine Grained Radiance Field Human Editing 3D Editing Surface Rendering Geometry Editing Human Trafficking Interactive 3D

December 22, 2023

December 21, 2023

Free-Editor: Zero-shot Text-driven 3D Scene Editing
Nazmul Karim, Umar Khalid, Hasan Iqbal, Jing Hua, Chen Chen
3D Scene Human Editing Text Driven 3D Scene Editing

December 14, 2023

Motion Flow Matching for Human Motion Synthesis and Editing
Vincent Tao Hu, Wenzhe Yin, Pingchuan Ma, Yunlu Chen, Basura Fernando, Yuki M Asano, Efstratios Gavves, Pascal Mettes, Bjorn Ommer, Cees G. M. Snoek
Motion Information Human Editing Human Motion Generation Human Motion Synthesis Motion Editing Motion Interpolation Motion Generation Benchmark

December 12, 2023

AI Control: Improving Safety Despite Intentional Subversion
Ryan Greenblatt, Buck Shlegeris, Kshitij Sachan, Fabien Roger
Backdoor Attack Human SAFETY Human Editing Population Protocol Untrusted Data AI Control

December 7, 2023

HyperDreamer: Hyper-Realistic 3D Content Generation and Editing from a Single Image
Tong Wu, Zhibing Li, Shuai Yang, Pan Zhang, Xinggang Pan, Jiaqi Wang, Dahua Lin, Ziwei Liu
3D Object 3D Content Single Image Human Editing High Fidelity Texture 3D Content Creation Material Map

December 5, 2023

Gaussian3Diff: 3D Gaussian Diffusion for 3D Full Head Synthesis and Editing
Yushi Lan, Feitong Tan, Di Qiu, Qiangeng Xu, Kyle Genova, Zeng Huang, Sean Fanello, Rohit Pandey, Thomas Funkhouser, Chen Change Loy, Yinda Zhang
3D Gaussian Human Editing 3D Diffusion Model Head Synthesis 3D Human Head 3D Head Parametric Face

December 1, 2023

November 27, 2023

Real Time GAZED: Online Shot Selection and Editing of Virtual Cameras from Wide-Angle Monocular Video Recordings
Sudheer Achary, Rohit Girmaji, Adhiraj Anil Deshmukh, Vineet Gandhi
Human Editing Video Stabilization Wide Angle Virtual Camera

November 2, 2023

FacadeNet: Conditional Facade Synthesis via Selective Editing
Yiangos Georgiou, Marios Loizou, Tom Kelly, Melinos Averkiou
Human Editing Facade Image

November 1, 2023

LLaVA-Interactive: An All-in-One Demo for Image Chat, Segmentation, Generation and Editing
Wei-Ge Chen, Irina Spiridonova, Jianwei Yang, Jianfeng Gao, Chunyuan Li
Segmentation Based Approach Human Editing Multi Turn Dialogue Multimodal Input Multimodal AI

October 18, 2023

VQ-NeRF: Neural Reflectance Decomposition and Editing with Vector Quantization
Hongliang Zhong, Jingbo Zhang, Jing Liao
Human Editing Vector Quantization Neural Reflectance Material Segmentation Vector Quantisation Material Decomposition Neural Reflectance Field

October 9, 2023

Improving Summarization with Human Edits
Zonghai Yao, Benjamin J Schloss, Sai P. Selvaraj
Text Summarization Human Editing Human Written Text Summarization Domain Medical Text Summarization Model Generated Summary

October 6, 2023

Auto-survey Challenge
Thanh Gia Hieu Khuong, Benedictus Kent Rachmat
Human Editing Peer Review

October 2, 2023

September 25, 2023

VoiceLens: Controllable Speaker Generation and Editing with Flow
Yao Shi, Ming Li
Speech Synthesis Human Editing Flow Mood Controllable Speech Synthesis