Text Modality

September 12, 2022

One-Shot Doc Snippet Detection: Powering Search in Document Beyond Text
Abhinav Java, Shripad Deshmukh, Milan Aggarwal, Surgan Jandial, Mausoom Sarkar, Balaji Krishnamurthy
Text Modality Document Understanding Structured Document Full Length Document Snippet Extraction Document Summary Pair
DECK: Behavioral Tests to Improve Interpretability and Generalizability of BERT Models Detecting Depression from Text
Jekaterina Novikova, Ksenia Shkaruta
Inherent Interpretability Text Modality Stronger Generalizability BERT Based Depression Detection Depression Symptom Behavioral Testing

September 9, 2022

Conversion of Acoustic Signal (Speech) Into Text By Digital Filter using Natural Language Processing
Abhiram Katuri, Sindhu Salugu, Gelli Tharuni, Challa Sri Gouri
Natural Language Processing Speech Recognition Text Modality Speech Analysis Artificial Intelligence System Acoustic Signal

September 7, 2022

Text Growing on Leaf
Chuang. Yang, Mulin. Chen, Yuan. Yuan, Qi. Wang
Text Modality Text Representation Scene Text Detection Plant Leaf Text Shape Text Contour

September 5, 2022

Bridging Music and Text with Crowdsourced Music Comments: A Sequence-to-Sequence Framework for Thematic Music Comments Generation
Peining Zhang, Junliang Guo, Linli Xu, Mu You, Junming Yin
Text Modality Recurrent Neural Network Text Generation Sequence to Sequence Bridging Text Text Description Crowd Annotation

August 29, 2022

Extracting Mathematical Concepts from Text
Jacob Collard, Valeria de Paiva, Brendan Fong, Eswaran Subrahmanian
Text Modality Category Theory Mathematical Text Open Corpus Term Extraction Mathematical Entity

August 19, 2022

Text to Image Generation: Leaving no Language Behind
Pedro Reviriego, Elena Merino-Gómez
Artificial Intelligence Text Modality Image Generation Human Language Natural Language Description Natural Language Text Text to Image Generator

August 17, 2022

Neural Embeddings for Text
Oleg Vasilyev, John Bohannon
Language Model Text Modality Sentence Embeddings Feature Embeddings Natural Language Text

August 8, 2022

Txt2Img-MHN: Remote Sensing Image Generation from Text Using Modern Hopfield Networks
Yonghao Xu, Weikang Yu, Pedram Ghamisi, Michael Kopp, Sepp Hochreiter
Text Modality Image Generation Text to Image Satellite Image Image Text Text to Image Generation Task

August 5, 2022

A Sketch Is Worth a Thousand Words: Image Retrieval with Text and Sketch
Patsorn Sangkloy, Wittawat Jitkrittum, Diyi Yang, James Hays
Text Modality Image Retrieval Word List Effective Sketch Large Scale Retrieval Imperfect Recall

August 2, 2022

July 27, 2022

Lighting (In)consistency of Paint by Text
Hany Farid
Generative Adversarial Network Text Modality Strong Consistency Text to Image Synthesis Synthesized Image Image Forensics Lighting Element Synthetic Medium

July 26, 2022

Multimodal Speech Emotion Recognition using Cross Attention with Aligned Audio and Text
Yoonhyung Lee, Seunghyun Yoon, Kyomin Jung
Text Modality Speech Emotion Recognition Cross Attention Global Attention Text Based Cue Audio Alignment

July 24, 2022

Counterfactual Reasoning for Out-of-distribution Multimodal Sentiment Analysis
Teng Sun, Wenjie Wang, Liqiang Jing, Yiran Cui, Xuemeng Song, Liqiang Nie
Text Modality Multimodal Model Counterfactual Reasoning Multimodal Sentiment Analysis Sentiment Feature Multimodal Sentiment Multimodal Semantic

July 15, 2022

Reasoning about Actions over Visual and Linguistic Modalities: A Survey
Shailaja Keyur Sampat, Maitreya Patel, Subhasish Das, Yezhou Yang, Chitta Baral
Timely Survey Computer Vision Text Modality NLP Field Commonsense Reasoning Knowledge Representation Past Action

July 6, 2022

Text to Image Synthesis using Stacked Conditional Variational Autoencoders and Conditional Generative Adversarial Networks
Haileleol Tibebu, Aadil Malik, Varuna De Silva
Generative Adversarial Network Text Modality Image Synthesis Conditional Generative Adversarial Network Conditional GAN Conditional Variational Conditional GANs Stage GAN

July 5, 2022

ASR-Generated Text for Language Model Pre-training Applied to Speech Tasks
Valentin Pelloin, Franck Dary, Nicolas Herve, Benoit Favre, Nathalie Camelin, Antoine Laurent, Laurent Besacier
Language Model Text Modality Language Understanding Speech Language Model Speech System Speech Task

July 4, 2022

VEM$^2$L: A Plug-and-play Framework for Fusing Text and Structure Knowledge on Sparse Knowledge Graph Completion
Tao He, Ming Liu, Yixin Cao, Tianwen Jiang, Zihao Zheng, Jingrun Zhang, Sendong Zhao, Bing Qin
Text Modality Knowledge Graph Completion Plug and Play Knowledge Fusion Structural Knowledge Gaussian Densification Sparse Knowledge Graph

June 27, 2022

Perspective (In)consistency of Paint by Text
Hany Farid
Text Modality Strong Consistency Visual Perspective Text to Image Synthesis Synthesized Image Image Forensics Realistic Image

Papers

One-Shot Doc Snippet Detection: Powering Search in Document Beyond Text

DECK: Behavioral Tests to Improve Interpretability and Generalizability of BERT Models Detecting Depression from Text

Conversion of Acoustic Signal (Speech) Into Text By Digital Filter using Natural Language Processing

Text Growing on Leaf

Bridging Music and Text with Crowdsourced Music Comments: A Sequence-to-Sequence Framework for Thematic Music Comments Generation

Extracting Mathematical Concepts from Text

Text to Image Generation: Leaving no Language Behind

Neural Embeddings for Text

Txt2Img-MHN: Remote Sensing Image Generation from Text Using Modern Hopfield Networks

A Sketch Is Worth a Thousand Words: Image Retrieval with Text and Sketch

Recognizing and Extracting Cybersecurtity-relevant Entities from Text

Automatic Classification of Bug Reports Based on Multiple Text Information and Reports' Intention

Lighting (In)consistency of Paint by Text

Multimodal Speech Emotion Recognition using Cross Attention with Aligned Audio and Text

Counterfactual Reasoning for Out-of-distribution Multimodal Sentiment Analysis

Reasoning about Actions over Visual and Linguistic Modalities: A Survey

Text to Image Synthesis using Stacked Conditional Variational Autoencoders and Conditional Generative Adversarial Networks

ASR-Generated Text for Language Model Pre-training Applied to Speech Tasks

VEM$^2$L: A Plug-and-play Framework for Fusing Text and Structure Knowledge on Sparse Knowledge Graph Completion

Perspective (In)consistency of Paint by Text