Large Scale Language Model

Large-scale language models (LLMs) are powerful AI systems designed to understand and generate human-like text, aiming to improve various natural language processing tasks. Current research focuses on enhancing LLM efficiency through techniques like iterative refinement, hierarchical architectures, and model compression methods such as quantization and pruning, as well as improving their reliability and addressing issues like hallucinations. These advancements are driving significant progress in diverse fields, including recommendation systems, mental health support, and legal document drafting, demonstrating LLMs' practical impact and their potential to revolutionize numerous applications.

Papers

January 24, 2024

Large Malaysian Language Model Based on Mistral for Enhanced Local Language Understanding
Husein Zolkepli, Aisyah Razak, Kamarul Adha, Ariff Nazhan
Language Model Language Understanding Large Scale Language Model Context Length Mistral 7B

January 21, 2024

AttentionLego: An Open-Source Building Block For Spatially-Scalable Large Language Model Accelerator With Processing-In-Memory Technology
Rongqing Cong, Wenyang He, Mingxuan Li, Bangning Luo, Zebin Yang, Yuchao Yang, Ru Huang, Bonan Yan
Self Attention Transformer Architecture Large Scale Language Model Transformer Based Large Language Model Technology Information Data Self Attention Module Attention Operation Building Block Lightweight LLM

December 30, 2023

Unicron: Economizing Self-Healing LLM Training at Scale
Tao He, Xue Li, Zhibin Wang, Kun Qian, Jingbo Xu, Wenyuan Yu, Jingren Zhou
Visual Analogue Scale Large Scale Language Model LLM Adaptation Failure Recovery Self Healing

December 17, 2023

FedMKGC: Privacy-Preserving Federated Multilingual Knowledge Graph Completion
Wei Tang, Zhiqian Wu, Yixin Cao, Yong Liao, Pengyuan Zhou
Knowledge Graph Knowledge Graph Completion Large Scale Language Model Knowledge Representation Learning

December 12, 2023

Mathematical Language Models: A Survey
Wentao Liu, Hanglei Hu, Jie Zhou, Yuyang Ding, Junsong Li, Jiayi Zeng, Mengliang He, Qin Chen, Bo Jiang, Aimin Zhou, Liang He
Language Model Timely Survey Pre Trained Language Model Large Scale Language Model

November 26, 2023

Learning to Skip for Language Modeling
Dewen Zeng, Nan Du, Tao Wang, Yuanzhong Xu, Tao Lei, Zhifeng Chen, Claire Cui
Language Model LeArning Abstract Large Scale Language Model Shot in Context Learning Skip and Recover

October 29, 2023

Robustifying Language Models with Test-Time Adaptation
Noah Thomas McDermott, Junfeng Yang, Chengzhi Mao
Language Model Test Time Adaptation Large Scale Language Model Adversarial Corruption Textual Adversarial Example

October 27, 2023

Large-scale Foundation Models and Generative AI for BigData Neuroscience
Ran Wang, Zhe Sage Chen
Foundation Model Generative AI Generative AI Model Large Scale Language Model Neuroscience Research Semantic Memory Brain Machine

October 23, 2023

ALCUNA: Large Language Models Meet New Knowledge
Xunjian Yin, Baizhou Huang, Xiaojun Wan
NLP Field Large Scale Language Model Entity Knowledge New Knowledge

October 22, 2023

Boosting Unsupervised Machine Translation with Pseudo-Parallel Data
Ivana Kvapilíková, Ondřej Bojar
Machine Translation Large Scale Language Model Monolingual Corpus Parallel Data

October 15, 2023

Diversifying the Mixture-of-Experts Representation for Language Models with Orthogonal Optimizer
Boan Liu, Liang Ding, Li Shen, Keqin Peng, Yu Cao, Dazhao Cheng, Dacheng Tao
Language Model Mixture of Expert Large Scale Language Model Inference Task Representation Diversity Orthogonal Gradient

October 7, 2023

Improving the Reliability of Large Language Models by Leveraging Uncertainty-Aware In-Context Learning
Yuchen Yang, Houqiang Li, Yanfeng Wang, Yu Wang
High Uncertainty Anticipation Large Scale Language Model Uncertainty Information

October 5, 2023

Procedural Text Mining with Large Language Models
Anisa Rula, Jennifer D'Souza
Large Language Model Natural Language Processing Context Learning Large Scale Language Model Procedural Text Understanding

September 25, 2023

Introducing DictaLM -- A Large Generative Language Model for Modern Hebrew
Shaltiel Shmidman, Avi Shmidman, Amir David Nissan Cohen, Moshe Koppel
Large Scale Language Model Hebrew Text Hebrew NLP Hebrew Language Model Hebrew Geo Location

September 19, 2023

Baichuan 2: Open Large-scale Language Models
Aiyuan Yang, Bin Xiao, Bingning Wang, Borong Zhang, Ce Bian, Chao Yin, Chenxu Lv, Da Pan, Dian Wang, Dong Yan, Fan Yang, Fei Deng, Feng Wang, Feng Liu, Guangwei Ai, Guosheng Dong, Haizhou Zhao, Hang Xu, Haoze Sun, Hongda Zhang, Hui Liu, Jiaming Ji, Jian Xie, JunTao Dai, Kun Fang, Lei Su, Liang Song, Lifeng Liu, Liyun Ru, Luyao Ma, Mang Wang, Mickel Liu, MingAn Lin, Nuolan Nie, Peidong Guo, Ruiyang Sun, Tao Zhang, Tianpeng Li, Tianyu Li, Wei Cheng, Weipeng Chen, Xiangrong Zeng, Xiaochuan Wang, Xiaoxi Chen, Xin Men, Xin Yu, Xuehai Pan, Yanjun Shen, Yiding Wang, Yiyu Li, Youxin Jiang, Yuchen Gao, Yupeng Zhang, Zenan Zhou, Zhiying Wu
Large Language Model Pre Trained Natural Language Instruction Large Scale Language Model Multilingual Large Language Model Rural China Natural Language Task

September 5, 2023

August 30, 2023

FPTQ: Fine-grained Post-Training Quantization for Large Language Models
Qingyuan Li, Yifan Zhang, Liang Li, Peng Yao, Bo Zhang, Xiangxiang Chu, Yerui Sun, Li Du, Yuchen Xie
Large Language Model Fine Grained Quantization Operator Large Scale Language Model Weight Quantization Fine Grained Quantization W4A8 Quantization

July 26, 2023

Data Augmentation for Neural Machine Translation using Generative Language Model
Seokjin Oh, Su Ah Lee, Woohwan Jung
Data Augmentation Neural Machine Translation Generative Language Model Parallel Corpus Large Scale Language Model Prompt Augmentation

July 25, 2023

Multilevel Large Language Models for Everyone
Yuanhao Gong
Large Language Model Large Scale Language Model User Modeling