Large Pre Trained Language Model

Large pre-trained language models (LLMs) are powerful AI systems trained on massive text datasets, aiming to achieve human-level natural language understanding and generation. Current research focuses on improving efficiency (e.g., through parameter-efficient fine-tuning methods like LoRA and BitFit, and exploring alternative architectures like ModuleFormer), addressing biases and improving robustness (e.g., via data augmentation and techniques to mitigate hallucinations), and adapting LLMs to low-resource languages (e.g., using translation and few-shot learning). These advancements have significant implications for various applications, including dialogue systems, text-to-code generation, and biomedical natural language processing, while also raising important considerations regarding computational cost and ethical implications.

Papers

July 10, 2022

FairDistillation: Mitigating Stereotyping in Language Models
Pieter Delobelle, Bettina Berendt
Language Model Knowledge Distillation Cross Lingual Large Pre Trained Language Model Smaller Language Model

June 18, 2022

Collocation2Text: Controllable Text Generation from Guide Phrases in Russian
Sergey Vychegzhanin, Evgeny Kotelnikov
Text Generation Large Pre Trained Language Model Autoregressive Language Model Auto Encoder Model Russian Language Nominal Phrase Lexical Collocation

June 3, 2022

Differentially Private Model Compression
Fatemehsadat Mireshghallah, Arturs Backurs, Huseyin A Inan, Lukas Wutschitz, Janardhan Kulkarni
Differential Privacy BERT Model Model Compression Large Pre Trained Language Model Non Private

May 29, 2022

SFE-AI at SemEval-2022 Task 11: Low-Resource Named Entity Recognition using Large Pre-trained Language Models
Changyu Hou, Jun Wang, Yixuan Qiao, Peng Jiang, Peng Gao, Guotong Xie, Qizhi Lin, Xiaopeng Wang, Xiandi Jiang, Benqi Wang, Qifeng Xiao
Language Model Entity Recognition Named Entity Recognition SemEval 2022 Task Large Pre Trained Language Model Pre Training Model Diverse Model Low Resource Named Entity Recognition

May 25, 2022

May 24, 2022

May 19, 2022

Are Prompt-based Models Clueless?
Pride Kavumba, Ryo Takahashi, Yusuke Oda
Language Model Large Pre Trained Language Model Prompt Based Few Shot Generalizable Cue

May 11, 2022

Making Pretrained Language Models Good Long-tailed Learners
Chen Zhang, Lei Ren, Jingang Wang, Wei Wu, Dawei Song
Prompt Tuning Shot Classification Large Pre Trained Language Model Long Tailed Learning Long Tailed Classification

May 4, 2022

Language Models in the Loop: Incorporating Prompting into Weak Supervision
Ryan Smith, Jason A. Fries, Braden Hancock, Stephen H. Bach
Large Language Model Language Model Noisy Label Weak Supervision Large Pre Trained Language Model

March 16, 2022

March 13, 2022

SummaReranker: A Multi-Task Mixture-of-Experts Re-ranking Framework for Abstractive Summarization
Mathieu Ravaut, Shafiq Joty, Nancy F. Chen
Multi Task Sequence to Sequence Abstractive Summarization Large Pre Trained Language Model Ranking Model First Stage Ranker

March 2, 2022

Do Prompts Solve NLP Tasks Using Natural Language?
Sen Yang, Yunchen Zhang, Leyang Cui, Yue Zhang
Natural Language Complex Prompt Large Pre Trained Language Model Diverse Prompt Prompt Based Fine Tuning Prompt Based NLP

February 16, 2022

ZeroGen: Efficient Zero-shot Learning via Dataset Generation
Jiacheng Ye, Jiahui Gao, Qintong Li, Hang Xu, Jiangtao Feng, Zhiyong Wu, Tao Yu, Lingpeng Kong
Natural Language Inference Zero Shot Learning Large Pre Trained Language Model Data Free Knowledge Distillation Dataset Generation

February 3, 2022

January 26, 2022

Synchromesh: Reliable code generation from pre-trained language models
Gabriel Poesia, Oleksandr Polozov, Vu Le, Ashish Tiwari, Gustavo Soares, Christopher Meek, Sumit Gulwani
Language Model Pre Trained Language Model Natural Language Code Generation Large Pre Trained Language Model