Encoder Decoder Model

Encoder-decoder models are a class of neural networks designed for sequence-to-sequence tasks, aiming to map an input sequence (e.g., an image, audio, or text) to an output sequence (e.g., a caption, translation, or code). Current research emphasizes improving efficiency and robustness, exploring architectures like Transformers and LSTMs, and incorporating techniques such as contrastive learning, adversarial training, and direct preference optimization to enhance performance across diverse applications. These models are proving highly impactful, enabling advancements in various fields including machine translation, speech recognition, image captioning, and even biological sequence analysis.

Papers

May 2, 2022

Wav2Seq: Pre-training Speech-to-Text Encoder-Decoder Models Using Pseudo Languages
Felix Wu, Kwangyoun Kim, Shinji Watanabe, Kyu Han, Ryan McDonald, Kilian Q. Weinberger, Yoav Artzi
Automatic Speech Recognition Self Supervised Speech to Text Encoder Decoder Model Language Label

April 27, 2022

DialogVED: A Pre-trained Latent Variable Encoder-Decoder Model for Dialog Response Generation
Wei Chen, Yeyun Gong, Song Wang, Bolun Yao, Weizhen Qi, Zhongyu Wei, Xiaowu Hu, Bartuer Zhou, Yi Mao, Weizhu Chen, Biao Cheng, Nan Duan
Language Model Response Generation Pre Trained Representation Encoder Decoder Model Dialogue Response Generation Encoder DEcoder

April 25, 2022

ED2LM: Encoder-Decoder to Language Model for Faster Document Re-ranking Inference
Kai Hui, Honglei Zhuang, Tao Chen, Zhen Qin, Jing Lu, Dara Bahri, Ji Ma, Jai Prakash Gupta, Cicero Nogueira dos Santos, Yi Tay, Don Metzler
Language Model Encoder Decoder Encoder Decoder Model Static Word Embeddings Neural Ranker Decoder Only Language Model Query Document Pair

March 31, 2022

Scaling Up Models and Data with $\texttt{t5x}$ and $\texttt{seqio}$
Adam Roberts, Hyung Won Chung, Anselm Levskaya, Gaurav Mishra, James Bradbury, Daniel Andor, Sharan Narang, Brian Lester, Colin Gaffney, Afroz Mohiuddin, Curtis Hawthorne, Aitor Lewkowycz, Alex Salcianu, Marc van Zee, Jacob Austin, Sebastian Goodman, Livio Baldini Soares, Haitang Hu, Sasha Tsvyashchenko, Aakanksha Chowdhery, Jasmijn Bastings, Jannis Bulian, Xavier Garcia, Jianmo Ni, Andrew Chen, Kathleen Kenealy, Jonathan H. Clark, Stephan Lee, Dan Garrette, James Lee-Thorp, Colin Raffel, Noam Shazeer, Marvin Ritter, Maarten Bosma, Alexandre Passos, Jeremy Maitin-Shepard, Noah Fiedel, Mark Omernick, Brennan Saeta, Ryan Sepassi, Alexander Spiridonov, Joshua Newlan, Andrea Gesmundo
Large Language Model Full Model Raw Data Encoder Decoder Model Reproducible Deep Learning

February 1, 2022

Examining Scaling and Transfer of Language Model Architectures for Machine Translation
Biao Zhang, Behrooz Ghorbani, Ankur Bapna, Yong Cheng, Xavier Garcia, Jonathan Shen, Orhan Firat
Language Model Machine Translation Formality Transfer Multiplicative Size Scaling Encoder Decoder Model Zero Shot Translation Language Modeling Objective

January 5, 2022

Attention-based Dual Supervised Decoder for RGBD Semantic Segmentation
Yang Zhang, Yang Yang, Chenyun Xiong, Guodong Sun, Yanwen Guo
Semantic Segmentation Attention Based Encoder Decoder Model Multimodal Attention

January 4, 2022

CHERRY: a Computational metHod for accuratE pRediction of virus-pRokarYotic interactions using a graph encoder-decoder model
Jiayu Shang, Yanni Sun
Graph Drawing Encoder Decoder Model accuratE Prediction Viral Host Bacterial Interaction

November 24, 2021

Utilizing Resource-Rich Language Datasets for End-to-End Scene Text Recognition in Resource-Poor Languages
Shota Orihashi, Yoshihiro Yamazaki, Naoki Makishima, Mana Ihori, Akihiko Takashima, Tomohiro Tanaka, Ryo Masumura
Scene Text Recognition Encoder Decoder Model Low Resourced Language Language Dataset

November 19, 2021

Lattention: Lattice-attention in ASR rescoring
Prabhat Pandey, Sergio Duarte Torres, Ali Orkan Bayer, Ankur Gandhe, Volker Leutnant
Automatic Speech Recognition Recurrent Network Encoder Decoder Model Image Level Two Level Lattice Neural Network Lattice Volume

Encoder Decoder Model

Papers

Wav2Seq: Pre-training Speech-to-Text Encoder-Decoder Models Using Pseudo Languages

DialogVED: A Pre-trained Latent Variable Encoder-Decoder Model for Dialog Response Generation

ED2LM: Encoder-Decoder to Language Model for Faster Document Re-ranking Inference

Scaling Up Models and Data with $\texttt{t5x}$ and $\texttt{seqio}$

Examining Scaling and Transfer of Language Model Architectures for Machine Translation

Attention-based Dual Supervised Decoder for RGBD Semantic Segmentation

CHERRY: a Computational metHod for accuratE pRediction of virus-pRokarYotic interactions using a graph encoder-decoder model

Utilizing Resource-Rich Language Datasets for End-to-End Scene Text Recognition in Resource-Poor Languages

Lattention: Lattice-attention in ASR rescoring