Code Generation

Code generation research focuses on using large language models (LLMs) to automatically produce functional and secure code from natural language descriptions or other inputs. Current efforts concentrate on improving the accuracy and efficiency of code generation, including developing novel training objectives like horizon-length prediction and employing techniques such as multi-agent frameworks, Monte Carlo Tree Search, and prompt engineering to guide LLMs towards better solutions. This field is significant because it promises to dramatically increase developer productivity and accelerate software development, while also raising important questions about code security and reliability that require further investigation.

Papers

March 23, 2024

SOEN-101: Code Generation by Emulating Software Process Models Using Large Language Model Agents
Feng Lin, Dong Jae Kim, Tse-Husn (Peter) Chen
Code Generation Code Quality Code Generation Benchmark Software Development

March 21, 2024

Semantically Aligned Question and Code Generation for Automated Insight Generation
Ananya Singha, Bhavya Chopra, Anirudh Khatry, Sumit Gulwani, Austin Z. Henley, Vu Le, Chris Parnin, Mukul Singh, Gust Verbruggen
Large Language Model Code Generation Semantic Knowledge Insight Generation Open Ended Response

March 20, 2024

CoCoST: Automatic Complex Code Generation with Online Searching and Correctness Testing
Xinyi He, Jiaru Zou, Yun Lin, Mengyu Zhou, Shi Han, Zejian Yuan, Dongmei Zhang
Code Generation Search Query Best Fit Line Code Generation Ability Correctness Check

March 19, 2024

A Study of Vulnerability Repair in JavaScript Programs with Large Language Models
Tan Khang Le, Saba Alimadadi, Steven Y. Ko
Code Generation Study Feature Security Vulnerability Vulnerability Repair Insecure Code

March 18, 2024

Linguacodus: A Synergistic Framework for Transformative Code Generation in Machine Learning Pipelines
Ekaterina Trofimova, Emil Sataev, Andrey E. Ustyuzhanin
Code Generation Natural Language Description Fine Tuned Large Language Model Machine Learning Pipeline Synergistic Information Machine Learning Task Natural Language Task Description

March 13, 2024

March 12, 2024

LiveCodeBench: Holistic and Contamination Free Evaluation of Large Language Models for Code
Naman Jain, King Han, Alex Gu, Wen-Ding Li, Fanjia Yan, Tianjun Zhang, Sida Wang, Armando Solar-Lezama, Koushik Sen, Ion Stoica
Financial Application Code Generation Real World Code Evaluation Benchmark Holistic Approach

March 11, 2024

March 6, 2024

March 5, 2024

Learn to Code Sustainably: An Empirical Study on LLM-based Green Code Generation
Tina Vartziotis, Ippolyti Dellatolas, George Dasoulas, Maximilian Schmidt, Florian Schneider, Tim Hoffmann, Sotirios Kotsopoulos, Michael Keckeisen
Code Generation Empirical Study Real World Code Source Code Code Data Sustainable Computing Sustainability Indicator

March 4, 2024

March 1, 2024

Comparing large language models and human programmers for generating programming code
Wenpin Hou, Zhicheng Ji
Large Language Model Code Generation Real World Code Human Programmer Programming Language

February 29, 2024

SoD$^2$: Statically Optimizing Dynamic Deep Neural Network
Wei Niu, Gagan Agrawal, Bin Ren
Code Generation DNN Framework Dynamic Deep Static Deep Neural Network Memory Allocation

Code Generation

Papers

SOEN-101: Code Generation by Emulating Software Process Models Using Large Language Model Agents

Semantically Aligned Question and Code Generation for Automated Insight Generation

CoCoST: Automatic Complex Code Generation with Online Searching and Correctness Testing

A Study of Vulnerability Repair in JavaScript Programs with Large Language Models

Linguacodus: A Synergistic Framework for Transformative Code Generation in Machine Learning Pipelines

Bugs in Large Language Models Generated Code: An Empirical Study

Prompting Large Language Models to Tackle the Full Software Development Lifecycle: A Case Study

Software Vulnerability and Functionality Assessment using LLMs

AutoDev: Automated AI-Driven Development

LiveCodeBench: Holistic and Contamination Free Evaluation of Large Language Models for Code

Automatic Generation of Python Programs Using Context-Free Grammars

Prompt Selection and Augmentation for Few Examples Code Generation in Large Language Model and its Application in Robotics Control

InfiBench: Evaluating the Question-Answering Capabilities of Code Large Language Models

Quantifying Contamination in Evaluating Code Generation Capabilities of Language Models

IRCoder: Intermediate Representations Make Language Models Robust Multilingual Code Generators

Learn to Code Sustainably: An Empirical Study on LLM-based Green Code Generation

DACO: Towards Application-Driven and Comprehensive Data Analysis via Code Generation

CatCode: A Comprehensive Evaluation Framework for LLMs On the Mixture of Code and Text

Comparing large language models and human programmers for generating programming code

SoD$^2$: Statically Optimizing Dynamic Deep Neural Network