Knowledge Mechanism

Understanding how large language models (LLMs) acquire, store, and utilize knowledge is a crucial area of research. Current investigations focus on characterizing knowledge representation within LLMs, exploring whether knowledge is localized to specific "neurons" or distributed more broadly, and examining how this knowledge is accessed and modified, including techniques for mitigating harmful outputs. These efforts aim to improve the trustworthiness and safety of LLMs, ultimately impacting their deployment in various applications and furthering our understanding of artificial intelligence.

Papers

July 22, 2024

Knowledge Mechanisms in Large Language Models: A Survey and Perspective
Mengru Wang, Yunzhi Yao, Ziwen Xu, Shuofei Qiao, Shumin Deng, Peng Wang, Xiang Chen, Jia-Chen Gu, Yong Jiang, Pengjun Xie, Fei Huang, Huajun Chen, Ningyu Zhang
Timely Survey Visual Perspective Parametric Knowledge Knowledge Sharing Knowledge Mechanism

May 23, 2024

Knowledge Localization: Mission Not Accomplished? Enter Query Localization!
Yuheng Chen, Pengfei Cao, Yubo Chen, Kang Liu, Jun Zhao
Mission Specification Knowledge Neuron Knowledge Storage Knowledge Mechanism

March 21, 2024

Detoxifying Large Language Models via Knowledge Editing
Mengru Wang, Ningyu Zhang, Ziwen Xu, Zekun Xi, Shumin Deng, Yunzhi Yao, Qishen Zhang, Linyi Yang, Jindong Wang, Huajun Chen
Knowledge Editing Knowledge Mechanism

Knowledge Mechanism

Papers

Knowledge Mechanisms in Large Language Models: A Survey and Perspective

Knowledge Localization: Mission Not Accomplished? Enter Query Localization!

Detoxifying Large Language Models via Knowledge Editing