Code Language Model

Code language models (CLMs) aim to generate and understand code from natural language instructions, bridging the gap between human intent and machine execution. Current research focuses on improving CLM performance through techniques like retrieval augmentation, instruction tuning, and incorporating structural information (e.g., using graph neural networks) into model architectures such as transformers. These advancements are significant because they enable more robust, efficient, and reliable code generation, impacting software development, automated program synthesis, and potentially even automated code debugging and security analysis.

Papers

February 8, 2023

CodeLMSec Benchmark: Systematically Evaluating and Finding Security Vulnerabilities in Black-Box Code Language Models
Hossein Hajipour, Keno Hassler, Thorsten Holz, Lea Schönherr, Mario Fritz
Code Generation Code Language Model Code Generation Model Vulnerable Code Black Box Language Model Web Attack

December 20, 2022

December 19, 2022

Natural Language to Code Generation in Interactive Data Science Notebooks
Pengcheng Yin, Wen-Ding Li, Kefan Xiao, Abhishek Rao, Yeming Wen, Kensen Shi, Joshua Howland, Paige Bailey, Michele Catasta, Henryk Michalewski, Alex Polozov, Charles Sutton
Natural Language Code Generation Code Language Model Computational Notebook AI Pair

December 12, 2022

Prompting Is Programming: A Query Language for Large Language Models
Luca Beurer-Kellner, Marc Fischer, Martin Vechev
Language Model Programming Assistance Code Language Model Language Model Output

November 29, 2022

Coder Reviewer Reranking for Code Generation
Tianyi Zhang, Tao Yu, Tatsunori B. Hashimoto, Mike Lewis, Wen-tau Yih, Daniel Fried, Sida I. Wang
Language Model Code Generation Code Language Model

March 1, 2022

E-LANG: Energy-Based Joint Inferencing of Super and Swift Language Models
Mohammad Akbari, Amin Banitalebi-Dehkordi, Yong Zhang
Language Model Encoder Decoder Joint Learning BERT Based Code Language Model Dynamic Inference

February 26, 2022

A Systematic Evaluation of Large Language Models of Code
Frank F. Xu, Uri Alon, Graham Neubig, Vincent J. Hellendoorn
Large Language Model Real World Code Open Source Model Code Language Model