Talking Face Generation

Talking face generation aims to synthesize realistic and synchronized videos of a person speaking, given only an audio recording and potentially a single image of their face. Current research focuses on improving lip synchronization accuracy, generating natural head movements and facial expressions (including emotions), and enhancing the overall realism and visual quality of the generated videos, often employing diffusion models, GANs, and transformer-based architectures. These advancements have implications for various fields, including virtual assistants, video conferencing, and healthcare applications like creating personalized avatars for Alzheimer's patients.

16papers

Papers

February 13, 2025

Long-Term TalkingFace Generation via Motion-Prior Conditional Diffusion Model
Fei Shen, Cong Wang, Junyao Gao, Qin Guo, Jisheng Dang, Jinhui Tang, Tat-Seng Chua
Conditional Diffusion Talking Face Generation Single CLIP Face Video Motion Prior Full Model

January 3, 2025

JoyGen: Audio-Driven 3D Depth-Aware Talking-Face Video Editing
Qili Wang, Dajiang Wu, Zihang Xu, Junshi Huang, Jun Lv
Drug Smile String Face Video Editing Talking Face Generation Face Generation

October 9, 2024

MimicTalk: Mimicking a personalized and expressive 3D talking face in minutes
Zhenhui Ye, Tianyun Zhong, Yi Ren, Ziyue Jiang, Jiawei Huang, Rongjie Huang, Jinglin Liu, Jinzheng He, Chen Zhang, Zehan Wang, Xize Chen+2
Talking Face Generation Human Face Meeting Minute Perceptual Similarity Face Generation Personalized Image Facial Motion

May 23, 2024

OpFlowTalker: Realistic and Natural Talking Face Generation via Optical Flow Guidance
Shuheng Ge, Haoyu Xing, Li Zhang, Xiangqian Wu
Talking Face Generation Talking Face Video Image Generation Real World Optical Flow Lip Reading

May 12, 2024

SPEAK: Speech-Driven Pose and Emotion-Adjustable Talking Head Generation
Changpeng Cai, Guinan Guo, Jiao Li, Junhao Su, Fei Shen, Chenghao He, Jing Xiao, Yuanxu Chen, Lei Dai, Feiyu Zhu
Facial Animation Latent Code Disentangle Content Talking Face Generation External Control Face Generation Head Generation

May 7, 2024

Audio-Visual Speech Representation Expert for Enhanced Talking Face Video Generation and Evaluation
Dogucan Yaman, Fevziye Irem Eyiokur, Leonard Bärmann, Seymanur Aktı, Hazım Kemal Ekenel, Alexander Waibel
Lip Sync Audio Visual Speech Representation Global Evaluation Talking Face Generation

March 4, 2024

FaceChain-ImagineID: Freely Crafting High-Fidelity Diverse Talking Faces from Disentangled Audio
Chao Xu, Yang Liu, Jiazheng Xing, Weida Wang, Mingze Sun, Jun Dan, Tianxin Huang, Siyuan Li, Zhi-Qi Cheng, Ying Tai, Baigui Sun
Speech Representation Disentanglement Driven Portrait Animation Human Face Multi Fidelity Talking Face Talking Face Generation

February 25, 2024

AVI-Talking: Learning Audio-Visual Instructions for Expressive 3D Talking Face Generation
Yasheng Sun, Wenqing Chu, Hang Zhou, Kaisiyuan Wang, Hideki Koike
Talking Face Generation Driven 3D Instructional Video Face Generation Talking Face

January 16, 2024

EmoTalker: Emotionally Editable Talking Face Generation via Diffusion Model
Bingyuan Zhang, Xulong Zhang, Ning Cheng, Jun Yu, Jing Xiao, Jianzong Wang
Driven Portrait Animation Talking Face Generation Face Generator Diffusion Model Fine Grained

December 12, 2023

GSmoothFace: Generalized Smooth Talking Face Generation via Fine Grained 3D Face Guidance
Haiming Zhang, Zhihao Yuan, Chaoda Zheng, Xu Yan, Baoyuan Wang, Guanbin Li, Song Wu, Shuguang Cui, Zhen Li
Lip Synchronization Fine Grained Generalized Smoothness Source Face Talking Face Generation Lip Sync Face Generation

November 20, 2023

MemoryCompanion: A Smart Healthcare Solution to Empower Efficient Alzheimer's Care Via Unleashing Generative AI
Lifei Zheng, Yeonie Heo, Yi Fang
Conversational Assistant Smart Healthcare Healthcare Application Talking Face Generation Alzheimer'S Disease

April 2, 2023

A Unified Compression Framework for Efficient Speech-Driven Talking-Face Generation
Bo-Kyeong Kim, Jaemin Kang, Daeun Seo, Hancheol Park, Shinkook Choi, Hyoung-Kyu Song, Hyungshin Kim, Sungsu Lim
Talking Face Generation Generative Adversarial Network

March 30, 2023

DAE-Talker: High Fidelity Speech-Driven Talking Face Generation with Diffusion Autoencoder
Chenpeng Du, Qi Chen, Xie Chen, Kai Yu
High Fidelity Diffusion Autoencoder Face Generation Talking Face Generation Facial Video

January 16, 2023

DPE: Disentanglement of Pose and Expression for General Video Portrait Editing
Youxin Pang, Yong Zhang, Weize Quan, Yanbo Fan, Xiaodong Cun, Ying Shan, Dong-ming Yan
Talking Face Generation Portrait Editing Human Expression Video Portrait Supervised CAusal Disentanglement Facial Motion Disentanglement Capability Pose Generation Human Pose

January 6, 2023

Diffused Heads: Diffusion Models Beat GANs on Talking-Face Generation
Michał Stypułkowski, Konstantinos Vougioukas, Sen He, Maciej Zięba, Stavros Petridis, Maja Pantic
Talking Face Generation Diffusion Based Generative Model AutoRegressive Diffusion Diffusion Model Video Generation GAN Model Face Generation Generative Model

August 29, 2022

StableFace: Analyzing and Improving Motion Stability for Talking Face Generation
Jun Ling, Xu Tan, Liyang Chen, Runnan Li, Yuchao Zhang, Sheng Zhao, Li Song
Periodic Orbit Lip Sync Face Generation Talking Face Generation Lip Movement Face Video Generation

June 29, 2022

Cut Inner Layers: A Structured Pruning Strategy for Efficient U-Net GANs
Bo-Kyeong Kim, Shinkook Choi, Hancheol Park
Generative Model Talking Face Generation Pruning Method Conditional GANs Cut and Approximate Efficient GAN

May 2, 2022

Emotion-Controllable Generalized Talking Face Generation
Sanjana Sinha, Sandika Biswas, Ravindra Yadav, Brojeshwar Bhowmick
Face Generation Facial Landmark Talking Face Generation Emotion Transition

Talking Face Generation

Papers

Long-Term TalkingFace Generation via Motion-Prior Conditional Diffusion Model

JoyGen: Audio-Driven 3D Depth-Aware Talking-Face Video Editing

MimicTalk: Mimicking a personalized and expressive 3D talking face in minutes

OpFlowTalker: Realistic and Natural Talking Face Generation via Optical Flow Guidance

SPEAK: Speech-Driven Pose and Emotion-Adjustable Talking Head Generation

Audio-Visual Speech Representation Expert for Enhanced Talking Face Video Generation and Evaluation

FaceChain-ImagineID: Freely Crafting High-Fidelity Diverse Talking Faces from Disentangled Audio

AVI-Talking: Learning Audio-Visual Instructions for Expressive 3D Talking Face Generation

EmoTalker: Emotionally Editable Talking Face Generation via Diffusion Model

GSmoothFace: Generalized Smooth Talking Face Generation via Fine Grained 3D Face Guidance

MemoryCompanion: A Smart Healthcare Solution to Empower Efficient Alzheimer's Care Via Unleashing Generative AI

A Unified Compression Framework for Efficient Speech-Driven Talking-Face Generation

DAE-Talker: High Fidelity Speech-Driven Talking Face Generation with Diffusion Autoencoder

DPE: Disentanglement of Pose and Expression for General Video Portrait Editing

Diffused Heads: Diffusion Models Beat GANs on Talking-Face Generation

StableFace: Analyzing and Improving Motion Stability for Talking Face Generation

Cut Inner Layers: A Structured Pruning Strategy for Efficient U-Net GANs

Emotion-Controllable Generalized Talking Face Generation