Audio Visual Deepfake Detection

Audio-visual deepfake detection research aims to develop robust methods for identifying manipulated videos and audio where either or both modalities have been synthetically altered. Current efforts focus on detecting subtle inconsistencies between audio and visual streams using techniques like fine-grained feature analysis, contextual cross-modal attention, and statistical modeling of feature distributions, often employing recurrent neural networks or other deep learning architectures. These advancements are crucial for mitigating the spread of misinformation and enhancing the security of biometric authentication systems, impacting both the scientific community through the development of novel machine learning approaches and practical applications in media verification and security.

Papers

November 14, 2024

How Good is ChatGPT at Audiovisual Deepfake Detection: A Comparative Study of ChatGPT, AI Models and Human Perception
Sahibzada Adil Shahzad, Ammarah Hashmi, Yan-Tsung Peng, Yu Tsao, Hsin-Min Wang
ChatGPT Generated Conversation Study Feature Artificial Intelligence Model Human Perception Audio Visual Deepfake Detection Multimedia Forensics Video Forensics

October 9, 2024

Gumbel Rao Monte Carlo based Bi-Modal Neural Architecture Search for Audio-Visual Deepfake Detection
Aravinda Reddy PN, Raghavendra Ramachandra, Krothapalli Sreenivasa Rao, Pabitra Mitra Vinod Rathod
Deep Fake Monte Carlo Audio Visual Deepfake Detection Gumbel Max Trick

August 13, 2024

Detecting Audio-Visual Deepfakes with Fine-Grained Inconsistencies
Marcella Astrid, Enjie Ghorbel, Djamila Aouada
Deep Fake Video Quality Inconsistency Detection Audio Visual Deepfake Detection Audio Visual Model

August 2, 2024

Contextual Cross-Modal Attention for Audio-Visual Deepfake Detection and Localization
Vinaya Sree Katamneni, Ajita Rattani
Localization Focus Deepfake Detection Cross Modal Attention Audio Visual Deepfake Detection

July 16, 2024

Statistics-aware Audio-visual Deepfake Detector
Marcella Astrid, Enjie Ghorbel, Djamila Aouada
Low Quality Deepfake Audio Visual Deepfake Detection

June 20, 2024

A Multi-Stream Fusion Approach with One-Class Learning for Audio-Visual Deepfake Detection
Kyungbok Lee, You Zhang, Zhiyao Duan
Multi Stream Audio Visual Deepfake Detection

June 19, 2024

Straight Through Gumbel Softmax Estimator based Bimodal Neural Architecture Search for Audio-Visual Deepfake Detection
Aravinda Reddy PN, Raghavendra Ramachandra, Krothapalli Sreenivasa Rao, Pabitra Mitra, Vinod Rathod
Deep Fake Fake Video Fusion Architecture Gumbel Softmax Audio Visual Deepfake Detection

May 7, 2024

Unmasking Illusions: Understanding Human Perception of Audiovisual Deepfakes
Ammarah Hashmi, Sahibzada Adil Shahzad, Chia-Wen Lin, Yu Tsao, Hsin-Min Wang
Deep Fake Human Perception Deepfake Video Unseen Deepfakes Audio Visual Deepfake Detection Malicious Deepfakes

October 3, 2023

MIS-AVoiDD: Modality Invariant and Specific Representation for Audio-Visual Deepfake Detection
Vinaya Sree Katamneni, Ajita Rattani
Deepfake Detection Individual Representation Deepfake Detector Modality Representation Audio Visual Deepfake Detection

July 26, 2023

A Unified Framework for Modality-Agnostic Deepfakes Detection
Cai Yu, Peng Chen, Jiahe Tian, Jin Liu, Jiao Dai, Xi Wang, Yesheng Chai, Shan Jia, Siwei Lyu, Jizhong Han
Unified Framework Deepfake Detection Audio Visual Deepfake Detection

April 6, 2022

Audio-Visual Person-of-Interest DeepFake Detection
Davide Cozzolino, Alessandro Pianese, Matthias Nießner, Luisa Verdoliva
Audio Visual Multi Modality Deepfake Detector Talking Face Video Audio Visual Deepfake Detection

Audio Visual Deepfake Detection

Papers

How Good is ChatGPT at Audiovisual Deepfake Detection: A Comparative Study of ChatGPT, AI Models and Human Perception

Gumbel Rao Monte Carlo based Bi-Modal Neural Architecture Search for Audio-Visual Deepfake Detection

Detecting Audio-Visual Deepfakes with Fine-Grained Inconsistencies

Contextual Cross-Modal Attention for Audio-Visual Deepfake Detection and Localization

Statistics-aware Audio-visual Deepfake Detector

A Multi-Stream Fusion Approach with One-Class Learning for Audio-Visual Deepfake Detection

Straight Through Gumbel Softmax Estimator based Bimodal Neural Architecture Search for Audio-Visual Deepfake Detection

Unmasking Illusions: Understanding Human Perception of Audiovisual Deepfakes

MIS-AVoiDD: Modality Invariant and Specific Representation for Audio-Visual Deepfake Detection

A Unified Framework for Modality-Agnostic Deepfakes Detection

Audio-Visual Person-of-Interest DeepFake Detection