Code Generation

Code generation research focuses on using large language models (LLMs) to automatically produce functional and secure code from natural language descriptions or other inputs. Current efforts concentrate on improving the accuracy and efficiency of code generation, including developing novel training objectives like horizon-length prediction and employing techniques such as multi-agent frameworks, Monte Carlo Tree Search, and prompt engineering to guide LLMs towards better solutions. This field is significant because it promises to dramatically increase developer productivity and accelerate software development, while also raising important questions about code security and reliability that require further investigation.

Papers

July 26, 2024

LLASP: Fine-tuning Large Language Models for Answer Set Programming
Erica Coppolillo, Francesco Calimeri, Giuseppe Manco, Simona Perri, Francesco Ricca
Code Generation Answer Set Programming

July 25, 2024

HDL-GPT: High-Quality HDL is All You Need
Bhuvnesh Kumar, Saurav Nanda, Ganapathy Parthasarathy, Pawan Patil, Austin Tsai, Parivesh Choudhary
Code Generation Hardware Description Language Large Code Model VHDL Code

July 21, 2024

AutoVCoder: A Systematic Framework for Automated Verilog Code Generation using LLMs
Mingzhe Gao, Jieru Zhao, Zhe Lin, Wenchao Ding, Xiaofeng Hou, Yu Feng, Chao Li, Minyi Guo
Large Language Model Code Generation LLM Benchmark Verilog Code Generation Functional Verilog Description

July 19, 2024

ECCO: Can We Improve Model-Generated Code Efficiency Without Sacrificing Functional Correctness?
Siddhant Waghjale, Vishruth Veerendranath, Zora Zhiruo Wang, Daniel Fried
High Efficiency Code Generation LLM Generation Code Efficiency Functional Correctness Probabilistic Equivariant Continuous Convolution

July 16, 2024

July 12, 2024

Benchmarking Language Model Creativity: A Case Study on Code Generation
Yining Lu, Dixuan Wang, Tianjian Li, Dongwei Jiang, Daniel Khashabi
Large Language Model Case Study Code Generation LLM Generated Sustained Creativity Human Level Creativity Divergent Thinking

July 10, 2024

On Leakage of Code Generation Evaluation Datasets
Alexandre Matton, Tom Sherborne, Dennis Aumiller, Elena Tommasone, Milad Alizadeh, Jingyi He, Raymond Ma, Maxime Voisin, Ellen Gilsenan-McMahon, Matthias Gallé
Code Generation Data Leakage Test Generation Evaluation Set Deep Leakage

July 9, 2024

Prompting Techniques for Secure Code Generation: A Systematic Investigation
Catherine Tony, Nicolás E. Díaz Ferreyra, Markus Mutas, Salem Dhiff, Riccardo Scandariato
Code Generation Prompt Based LLM Generated Code Systematic Study

July 8, 2024

July 7, 2024

Enhancing Computer Programming Education with LLMs: A Study on Effective Prompt Engineering for Python Code Generation
Tianyu Wang, Nianjun Zhou, Zhixiong Chen
Large Language Model Code Generation Study Feature Prompt Engineering LLM Based Programming Education

July 6, 2024

Code Less, Align More: Efficient LLM Fine-tuning for Code Generation with Data Pruning
Yun-Da Tsai, Mingjie Liu, Haoxing Ren
Large Language Model Code Generation Real World Code LLM Fine Tuning LD Align Synthetic Training Data Data Pruning Synthetic Instruction

July 4, 2024

Classification-Based Automatic HDL Code Generation Using LLMs
Wenhao Sun, Bing Li, Grace Li Zhang, Xunzhao Yin, Cheng Zhuo, Ulf Schlichtmann
Large Language Model Code Generation Electronic Design Automation Hardware Description Language Digital Circuit

July 3, 2024

July 2, 2024

Is Your AI-Generated Code Really Safe? Evaluating Large Language Models on Secure Code Generation with CodeSecEval
Jiexin Wang, Xitong Luo, Liuwen Cao, Hongkui He, Hailin Huang, Jiayuan Xie, Adam Jatowt, Yi Cai
Code Generation Program Repair Vulnerable Code Code Model Safe AI

June 29, 2024

June 28, 2024

Applying RLAIF for Code Generation with API-usage in Lightweight LLMs
Sujan Dutta, Sayantan Mahinder, Raviteja Anantha, Bortik Bandyopadhyay
Reinforcement Learning Code Generation Code Generation Task API Usage AI Feedback Code Efficiency Code Generation Ability Lightweight LLM LLM Based Baseline

Code Generation

Papers

LLASP: Fine-tuning Large Language Models for Answer Set Programming

HDL-GPT: High-Quality HDL is All You Need

AutoVCoder: A Systematic Framework for Automated Verilog Code Generation using LLMs

ECCO: Can We Improve Model-Generated Code Efficiency Without Sacrificing Functional Correctness?

Beyond Correctness: Benchmarking Multi-dimensional Code Generation for Large Language Models

Revisiting the Impact of Pursuing Modularity for Code Generation

Benchmarking Language Model Creativity: A Case Study on Code Generation

On Leakage of Code Generation Evaluation Datasets

Prompting Techniques for Secure Code Generation: A Systematic Investigation

What's Wrong with Your Code Generated by Large Language Models? An Extensive Study

InverseCoder: Self-improving Instruction-Tuned Code LLMs with Inverse-Instruct

Enhancing Computer Programming Education with LLMs: A Study on Effective Prompt Engineering for Python Code Generation

Code Less, Align More: Efficient LLM Fine-tuning for Code Generation with Data Pruning

Classification-Based Automatic HDL Code Generation Using LLMs

Let the Code LLM Edit Itself When You Edit the Code

A Comparative Study of DSL Code Generation: Fine-Tuning vs. Optimized Retrieval Augmentation

Is Your AI-Generated Code Really Safe? Evaluating Large Language Models on Secure Code Generation with CodeSecEval

Beyond Functional Correctness: Investigating Coding Style Inconsistencies in Large Language Models

Brevity is the soul of wit: Pruning long files for code generation

Applying RLAIF for Code Generation with API-usage in Lightweight LLMs