Emergent Ability

Emergent abilities in large language models (LLMs) refer to the sudden appearance of unexpected capabilities in larger models that are absent in smaller ones, defying simple extrapolations of performance. Current research focuses on understanding the underlying mechanisms driving this phenomenon, investigating factors like model size, training data, and pre-training loss, often using transformer-based architectures. This research is crucial for improving LLMs and for developing a deeper understanding of how complex capabilities arise in artificial systems, with implications for both AI safety and the development of more powerful and reliable AI tools for scientific research and other applications.

Papers

September 4, 2023

Are Emergent Abilities in Large Language Models just In-Context Learning?
Sheng Lu, Irina Bigoulaeva, Rachneet Sachdeva, Harish Tayyar Madabushi, Iryna Gurevych
Large Language Model Context Learning Reasoning Ability Emergent Ability

August 9, 2023

On the Unexpected Abilities of Large Language Models
Stefano Nolfi
Human Cognition Cognitive Capability Human Written Text Emergent Ability Training Task

July 16, 2023

Do Emergent Abilities Exist in Quantized Large Language Models: An Empirical Study
Peiyu Liu, Zikang Liu, Ze-Feng Gao, Dawei Gao, Wayne Xin Zhao, Yaliang Li, Bolin Ding, Ji-Rong Wen
Large Language Model Language Model Empirical Study Low Bit Quantization Low Bit Emergent Ability Quantization Model

May 24, 2023

Emergent inabilities? Inverse scaling over the course of pretraining
James A. Michaelov, Benjamin K. Bergen
Language Model New Benchmark Multiplicative Size Scaling Larger Language Model Emergent Ability Course Specific Context Inverse Scaling

May 1, 2023

ArK: Augmented Reality with Knowledge Interactive Emergent Ability
Qiuyuan Huang, Jae Sung Park, Abhinav Gupta, Paul Bennett, Ran Gong, Subhojit Som, Baolin Peng, Owais Khan Mohammed, Chris Pal, Yejin Choi, Jianfeng Gao
Generative AI Augmented Reality Mixed Reality Unseen Environment Emergent Ability Knowledge Memory

April 28, 2023

Are Emergent Abilities of Large Language Models a Mirage?
Rylan Schaeffer, Brando Miranda, Sanmi Koyejo
Large Language Model Artificial Intelligence Model Model Behavior Emergent Ability

April 19, 2023

A Latent Space Theory for Emergent Abilities in Large Language Models
Hui Jiang
Latent Space Language Understanding Bayesian Inference Chain of Thought Prompting Sparse Structure Emergent Ability

March 24, 2023

Machine Psychology: Investigating Emergent Capabilities and Behavior in Large Language Models Using Psychological Methods
Thilo Hagendorff
Large Language Model BEHAVIOR Explanation Psychological Phenomenon Emergent Ability Natural Language Processing Benchmark Machine Psychology Novel Behavior

January 31, 2023

Numeracy from Literacy: Data Science as an Emergent Skill from Large Language Models
David Noever, Forrest McKee
Large Language Model Transformer Based Model Data Science Next Token Prediction Emergent Ability Internal Numeracy Foundational Literacy

June 15, 2022

Emergent Abilities of Large Language Models
Jason Wei, Yi Tay, Rishi Bommasani, Colin Raffel, Barret Zoph, Sebastian Borgeaud, Dani Yogatama, Maarten Bosma, Denny Zhou, Donald Metzler, Ed H. Chi, Tatsunori Hashimoto, Oriol Vinyals, Percy Liang, Jeff Dean, William Fedus
Large Language Model Language Model Path Breaking Emergence Multiplicative Size Scaling Emergent Ability