Frame Wise

Frame-wise analysis focuses on extracting meaningful information from individual frames within sequences, such as videos or audio recordings, to improve various downstream tasks. Current research emphasizes leveraging large language models and transformer architectures to enhance feature extraction and contextual understanding, often incorporating techniques like contrastive learning and temporal modeling to capture both local and global relationships within the data. This approach is proving valuable across diverse applications, including improving the accuracy of action recognition, sound event detection, and video retrieval, while also streamlining tasks like clinical trial analysis and sign language recognition.

Papers

January 8, 2025

Enhancing Low-Cost Video Editing with Lightweight Adaptors and Temporal-Aware Inversion
Yangfan He, Sida Li, Kun Li, Jianhui Wang, Binxu Li, Tianyu Shi, Jun Yin, Miao Zhang, Xueqian Wang
Temporal Consistency Frame Wise Temporal Coherence Spatial Consistency Iterative Inversion

December 12, 2024

Text-Video Multi-Grained Integration for Video Moment Montage
Zhihui Yin, Ye Ma, Xipeng Cao, Bo Wang, Quan Chen, Peng Jiang
Video Text Video Content Frame Wise Video Clip

September 15, 2024

AlpaPICO: Extraction of PICO Frames from Clinical Trial Documents Using LLMs
Madhusudan Ghosh, Shrimon Mukherjee, Asmit Ganguly, Partha Basuchowdhuri, Sudip Kumar Naskar, Debasis Ganguly
Large Language Model Context Learning Natural Language Process Extraction Frame Wise Frame Induction

July 30, 2024

Autogenic Language Embedding for Coherent Point Tracking
Zikai Song, Ying Tang, Run Luo, Lintao Ma, Junqing Yu, Yi-Ping Phoebe Chen, Wei Yang
Language Representation Point Tracking Point Correspondence Frame Wise

April 12, 2024

Improving Continuous Sign Language Recognition with Adapted Image Models
Lianyu Hu, Tongkai Shi, Liqing Gao, Zekang Liu, Wei Feng
Large Vision Language Model Image Text Pair Image Modeling Continuous Sign Language Recognition Frame Wise

March 4, 2024

RISeg: Robot Interactive Object Segmentation via Body Frame-Invariant Features
Howard H. Qian, Yangxiao Lu, Kejia Ren, Gaotian Wang, Ninad Khargonkar, Yu Xiang, Kaiyu Hang
Segmentation Mask Segmentation Accuracy Interactive Segmentation Human Body Segmentation Uncertainty Frame Wise Mi Segmentation

September 15, 2023

Semi-supervised Sound Event Detection with Local and Global Consistency Regularization
Yiming Li, Xiangdong Wang, Hong Liu, Rui Tao, Long Yan, Kazushige Ouchi
Frame Wise Feature Similarity Logic Regularization

September 12, 2023

Self-supervised Extraction of Human Motion Structures via Frame-wise Discrete Features
Tetsuya Abe, Ryusuke Sagawa, Ko Ayusawa, Wataru Takano
Human Motion Encoder Decoder Model Frame Wise Unsupervised Extraction Motion Code

August 7, 2023

Zero-shot Skeleton-based Action Recognition via Mutual Information Estimation and Maximization
Yujie Zhou, Wenwen Qiang, Anyi Rao, Ning Lin, Bing Su, Jiaqi Wang
Skeleton Based Action Recognition Skeleton Based Action Balancing Efficiency Frame Wise Singular Vector

July 10, 2023

Active Learning for Video Classification with Frame Level Queries
Debanjan Goswami, Shayok Chakraborty
Computer Vision Active Learning Video Classification Active Learning Framework Active Learning Algorithm Frame Wise

May 31, 2023

Permutation-Aware Action Segmentation via Unsupervised Frame-to-Segment Alignment
Quoc-Huy Tran, Ahmed Mehmood, Muhammad Ahmed, Muhammad Naufil, Anas Zafar, Andrey Konin, M. Zeeshan Zia
Action Segmentation Temporal Segmentation Frame Wise Unsupervised Alignment Activity Segmentation

March 16, 2023

EmotiEffNet Facial Features in Uni-task Emotion Recognition in Video at ABAW-5 competition
Andrey V. Savchenko
Emotion Recognition Source Video Expression Recognition Arousal Prediction ABAW Challenge Affective Behavior Analysis Frame Wise

March 15, 2023

VVS: Video-to-Video Retrieval with Irrelevant Frame Suppression
Won Jo, Geuntaek Lim, Gwangjin Lee, Hyunwoo Kim, Byungsoo Ko, Yukyung Choi
Video Retrieval Frame Wise

January 18, 2023

FPANet: Frequency-based Video Demoireing using Frame-level Post Alignment
Gyeongrok Oh, Sungjune Kim, Heon Gu, Sang Ho Yoon, Jinkyu Kim, Sangpil Kim
Frame Wise Video Quality Metric Moire Pattern Frame Alignment Consistent Image Video Demoireing

January 5, 2023

Hypotheses Tree Building for One-Shot Temporal Sentence Localization
Daizong Liu, Xiang Fang, Pan Zhou, Xing Di, Weining Lu, Yu Cheng
Scientific Hypothesis Video Annotation Frame Wise Temporal Sentence

April 7, 2022

Learning Local and Global Temporal Contexts for Video Semantic Segmentation
Guolei Sun, Yun Liu, Henghui Ding, Min Wu, Luc Van Gool
Semantic Segmentation Global Context Local Learning Video Semantic Segmentation Frame Wise Category Prototype Motion Context

March 6, 2022

Exploring Optical-Flow-Guided Motion and Detection-Based Appearance for Temporal Sentence Grounding
Daizong Liu, Xiang Fang, Wei Hu, Pan Zhou
Spatio Temporal Motion Information Temporal Sentence Grounding 3D Reasoning Object Feature Frame Wise Appearance Model

January 3, 2022

Exploring Motion and Appearance Information for Temporal Sentence Grounding
Daizong Liu, Xiaoye Qu, Pan Zhou, Yang Liu
Motion Information Temporal Sentence Grounding Appearance Learning Frame Wise Aspect Representation Appearance Information