Multimodal Entity

Multimodal entity research focuses on understanding and processing entities represented across multiple data modalities, such as text and images, primarily aiming to improve entity linking, alignment, and recognition tasks. Current research emphasizes leveraging large language models (LLMs) and incorporating advanced techniques like optimal transport and graph neural networks to effectively fuse and reason over multimodal information, often addressing challenges such as missing or ambiguous data. This field is significant for advancing knowledge graph construction, multimodal information retrieval, and applications requiring robust understanding of entities within complex, real-world scenarios.

Papers

December 31, 2024

Exploring the Implicit Semantic Ability of Multimodal Large Language Models: A Pilot Study on Entity Set Expansion
Hebin Wang, Yangning Li, Yinghui Li, Hai-Tao Zheng, Wenhao Jiang, Hong-Gee Kim
Full Model Multimodal Large Language Model Multimodal Information Semantic Understanding Pilot Study Multimodal Entity Entity Set Expansion Generative Bridging Domain

December 11, 2024

Multi-level Matching Network for Multimodal Entity Linking
Zhiwei Hu, Víctor Gutiérrez-Basulto, Ru Li, Jeff Z. Pan
Modal Similarity Multimodal Entity Cross Modal Matching

December 9, 2024

VP-MEL: Visual Prompts Guided Multimodal Entity Linking
Hongze Mi, Jinyuan Li, Xuying Zhang, Haoran Cheng, Jiahao Wang, Di Sun, Gang Pan
Image Text Pair Wikidata Statement Multimodal Entity Multimodal Prompt

October 8, 2024

$M^3EL$: A Multi-task Multi-topic Dataset for Multi-modal Entity Linking
Fang Wang, Shenglin Yin, Xiaoying Bai, Minghao Hu, Tianwei Yan, Yi Liang
Multi Task Multi Modal Model Multi Modal Task Multimodal Entity

July 29, 2024

LoginMEA: Local-to-Global Interaction Network for Multi-modal Entity Alignment
Taoyu Su, Xinghua Zhang, Jiawei Sheng, Zhenyu Zhang, Tingwen Liu
Entity Representation Multi Modal Knowledge Graph Multimodal Entity Multi Modal Entity Alignment Local to Global Interaction Network

July 23, 2024

UniMEL: A Unified Framework for Multimodal Entity Linking with Large Language Models
Liu Qi, He Yongyi, Lian Defu, Zheng Zhi, Xu Tong, Liu Che, Chen Enhong
Multimodal Large Language Model Unified Framework Multimodal Context Multimodal Entity

July 17, 2024

Multi-Grained Query-Guided Set Prediction Network for Grounded Multimodal Named Entity Recognition
Jielong Tang, Zhenxing Wang, Ziyang Gong, Jianxing Yu, Shuang Wang, Jian Yin
Feature Fusion Multimodal Entity Fine Grained Entity Type Multimodal Named Entity Recognition Multi Grained Set Prediction Network

June 27, 2024

DIM: Dynamic Integration of Multimodal Entity Linking with Large Language Model
Shezheng Song, Shasha Li, Jie Yu, Shan Zhao, Xiaopeng Li, Jun Ma, Xiaodong Liu, Zhuo Li, Xiaoguang Mao
Large Language Model Multimodal Information Entity Representation Entity Extraction Multimodal Entity

June 4, 2024

Optimal Transport Guided Correlation Assignment for Multimodal Entity Linking
Zefeng Zhang, Jiawei Sheng, Chuang Zhang, Yunzhi Liang, Wenyuan Zhang, Siqi Wang, Tingwen Liu
Optimal Transport Modality Gap Multimodal Knowledge Graph Multimodal Entity

March 11, 2024

Noise-powered Multi-modal Knowledge Graph Representation Framework
Zhuo Chen, Yin Fang, Yichi Zhang, Lingbing Guo, Jiaoyan Che, Jeff Z. Pan, Huajun Chen, Wen Zhang
Real Power Industrial Disturbing Noise Knowledge Graph Completion Multi Modal Large Language Model Multi Modal Knowledge Graph Multimodal Entity Multi Modal Entity Alignment

February 29, 2024

EAMA : Entity-Aware Multimodal Alignment Based Approach for News Image Captioning
Junzhe Zhang, Huixuan Zhang, Xunjian Yin, Xiaojun Wan
Multimodal Entity Multi Modal Entity Alignment News Image

February 18, 2024

MIKE: A New Benchmark for Fine-grained Multimodal Entity Knowledge Editing
Jiaqi Li, Miaozeng Du, Chuanyi Zhang, Yongrui Chen, Nan Hu, Guilin Qi, Haiyun Jiang, Siyuan Cheng, Bozhong Tian
New Benchmark Multimodal Large Language Model Knowledge Editing Multimodal Entity Multimodal Knowledge Editing

December 19, 2023

A Dual-way Enhanced Framework from Text Matching Point of View for Multimodal Entity Linking
Shezheng Song, Shan Zhao, Chengyu Wang, Tianwei Yan, Shasha Li, Xiaoguang Mao, Meng Wang
New Framework Multimodal Information Best View Entity Representation Text Matching Multimodal Entity

October 9, 2023

DRIN: Dynamic Relation Interactive Network for Multimodal Entity Linking
Shangyu Xing, Fei Zhao, Zhen Wu, Chunhui Li, Jianbing Zhang, Xinyu Dai
Fine Grained Dynamic Graph Multimodal Context Multimodal Entity RelAtion Network

August 13, 2023

MACO: A Modality Adversarial and Contrastive Framework for Modality-missing Multi-modal Knowledge Graph Completion
Yichi Zhang, Zhuo Chen, Wen Zhang
Cross Modal Knowledge Graph Completion Contrastive Method Large Scale Knowledge Graph Multimodal Entity Modality Adversarial

July 30, 2023

Rethinking Uncertainly Missing and Ambiguous Visual Modality in Multi-Modal Entity Alignment
Zhuo Chen, Lingbing Guo, Yin Fang, Yichi Zhang, Jiaoyan Chen, Jeff Z. Pan, Yangning Li, Huajun Chen, Wen Zhang
Entity Alignment Visual Modality Multimodal Entity Missingness Resilient Multi Modal Entity Alignment Modality Missing Brain Image

June 22, 2023

Generative Multimodal Entity Linking
Senbao Shi, Zhenran Xu, Baotian Hu, Min Zhang
Multimodal Entity Systematic Mapping Study

June 9, 2023

SNeL: A Structured Neuro-Symbolic Language for Entity-Based Multimodal Scene Understanding
Silvan Ferreira, Allan Martins, Ivanovitch Silva
Neuro Symbolic Symbolic Reasoning Multimodal AI Multimodal Entity

May 24, 2023

AMELI: Enhancing Multimodal Entity Linking with Fine-Grained Attributes
Barry Menglong Yao, Yu Chen, Qifan Wang, Sijia Wang, Minqian Liu, Zhiyang Xu, Licheng Yu, Lifu Huang
Fine Grained Multimodal Entity

December 29, 2022

MEAformer: Multi-modal Entity Alignment Transformer for Meta Modality Hybrid
Zhuo Chen, Jiaoyan Chen, Wen Zhang, Lingbing Guo, Yin Fang, Yufeng Huang, Yichi Zhang, Yuxia Geng, Jeff Z. Pan, Wenting Song, Huajun Chen
Fine Grained Modality Fusion Multimodal Entity Multi Modal Entity Alignment