Egocentric Video

Egocentric video, capturing the world from a first-person perspective, is revolutionizing computer vision by enabling the analysis of human activities and interactions in their natural context. Current research heavily focuses on developing robust multimodal models, often leveraging transformer architectures and large language models, to understand and generate information from egocentric video data, addressing challenges like motion estimation, action recognition, and affordance prediction. This field is significant for advancing artificial intelligence, particularly in embodied AI and human-computer interaction, with applications ranging from assistive technologies and virtual reality to robotics and understanding human behavior. The development of large-scale datasets and standardized evaluation metrics is also driving progress.

Papers

September 17, 2024

AMEGO: Active Memory from long EGOcentric videos
Gabriele Goletto, Tushar Nagarajan, Giuseppe Averta, Dima Damen
Video Understanding Egocentric Video Memory Augmentation Video Reasoning

September 14, 2024

Egocentric Speaker Classification in Child-Adult Dyadic Interactions: From Sensing to Computational Modeling
Tiantian Feng, Anfeng Xu, Xuan Shi, Somer Bishop, Shrikanth Narayanan
Egocentric Video Human Sensing Computational Model Egocentric Video Language

September 11, 2024

Benchmarking 2D Egocentric Hand Pose Datasets
Olga Taran, Damian M. Manzone, Jose Zariffa
Egocentric Video Hand Object Egocentric Data Hand Datasets Egocentric 3D Hand Pose Estimation

September 6, 2024

HiSC4D: Human-centered interaction and 4D Scene Capture in Large-scale Space Using Wearable IMUs and LiDAR
Yudi Dai, Zhiyong Wang, Xiping Lin, Chenglu Wen, Lan Xu, Siqi Shen, Yuexin Ma, Cheng Wang
Mid Range LiDAR Egocentric Video Deep Space 4 Dimensional Human Centric 3D Room Head Mounted Human Point Cloud

September 4, 2024

MADiff: Motion-Aware Mamba Diffusion Models for Hand Trajectory Prediction on Egocentric Videos
Junyi Ma, Xieyuanli Chen, Wentao Bao, Jingyi Xu, Hesheng Wang
Egocentric Video Finger Motion Waypoint Generation

August 19, 2024

August 9, 2024

Spherical World-Locking for Audio-Visual Localization in Egocentric Videos
Heeseung Yun, Ruohan Gao, Ishwarya Ananthabhotla, Anurag Kumar, Jacob Donley, Chao Li, Gunhee Kim, Vamsi Krishna Ithapu, Calvin Murdock
Egocentric Video Spherical Surface Egocentric Video Understanding Audio Visual Event Localization Spherical Array

August 7, 2024

Unlocking Exocentric Video-Language Data for Egocentric Video Representation Learning
Zi-Yi Dou, Xitong Yang, Tushar Nagarajan, Huiyu Wang, Jing Huang, Nanyun Peng, Kris Kitani, Fu-Jen Chu
Egocentric Video Egocentric Perception Egocentric Data Egocentric Video Language

August 2, 2024

NOLO: Navigate Only Look Once
Bohan Zhou, Zhongbin Zhang, Jiangxing Wang, Zongqing Lu
Offline Reinforcement Learning Local Navigation Egocentric Video Visual Navigation Context Aware Navigation

July 30, 2024

EgoSonics: Generating Synchronized Audio for Silent Egocentric Videos
Aashish Rai, Srinath Sridhar
Egocentric Video Audio Driven Audio Synthesis Synthesized Sound Ego Noise

July 28, 2024

Ego-VPA: Egocentric Video Understanding with Parameter-efficient Adaptation
Tz-Ying Wu, Kyle Min, Subarna Tripathi, Nuno Vasconcelos
Video Understanding Egocentric Video Cross Modality Transfer Video Language Pre Training Egocentric Video Understanding Parameter Efficient Adaptation

July 18, 2024

Simultaneous Localization and Affordance Prediction for Tasks in Egocentric Video
Zachary Chavis, Hyun Soo Park, Stephen J. Guy
Vision Language Model Affordance Learning Simultaneous Localization New Task Egocentric Video Spatial Understanding Ego Pose

July 10, 2024

July 9, 2024

Masked Video and Body-worn IMU Autoencoder for Egocentric Action Recognition
Mingfang Zhang, Yifei Huang, Ruicong Liu, Yoichi Sato
Action Recognition Simultaneous Localization and Mapping Egocentric Video Egocentric Action Recognition

July 8, 2024

Short-term Object Interaction Anticipation with Disentangled Object Detection @ Ego4D Short Term Object Interaction Anticipation Challenge
Hyunjin Cho, Dong Un Kang, Se Young Chun
Egocentric Video Next Active Object Short Term Object Interaction Anticipation

July 5, 2024

ZARRIO @ Ego4D Short Term Object Interaction Anticipation Challenge: Leveraging Affordances and Attention-based models for STA
Lorenzo Mur-Labadia, Ruben Martinez-Cantin, Josechu Guerrero-Campo, Giovanni Maria Farinella
Affordance Learning Egocentric Video Attention Based Model Short Term Object Interaction Anticipation

June 26, 2024

EgoVideo: Exploring Egocentric Foundation Model and Downstream Adaptation
Baoqi Pei, Guo Chen, Jilan Xu, Yuping He, Yicheng Liu, Kanghua Pan, Yifei Huang, Yali Wang, Tong Lu, Limin Wang, Yu Qiao
Egocentric Video Downstream Fine Tuning Egocentric Video Understanding EGO4D Challenge

June 22, 2024

HCQA @ Ego4D EgoSchema Challenge 2024
Haoyu Zhang, Yuquan Xie, Yisen Feng, Zaijing Li, Meng Liu, Liqiang Nie
Question Answering Egocentric Video Egocentric Video Understanding Comprehension Model EGO4D Challenge