Code Generation

Code generation research focuses on using large language models (LLMs) to automatically produce functional and secure code from natural language descriptions or other inputs. Current efforts concentrate on improving the accuracy and efficiency of code generation, including developing novel training objectives like horizon-length prediction and employing techniques such as multi-agent frameworks, Monte Carlo Tree Search, and prompt engineering to guide LLMs towards better solutions. This field is significant because it promises to dramatically increase developer productivity and accelerate software development, while also raising important questions about code security and reliability that require further investigation.

Papers

November 21, 2024

Planning-Driven Programming: A Large Language Model Programming Workflow
Chao Lei, Yanchuan Chang, Nir Lipovetzky, Krista A. Ehinger
Large Language Model Code Generation Tool Augmented LLM

November 20, 2024

November 18, 2024

GNN-Based Code Annotation Logic for Establishing Security Boundaries in C Code
Varun Gadey, Raphael Goetz, Christoph Sendner, Sampo Sovio, Alexandra Dmitrienko
Code Generation Trusted Execution Environment C Program Insecure Code Uncertain Boundary

November 17, 2024

SRA-MCTS: Self-driven Reasoning Aurmentation with Monte Carlo Tree Search for Enhanced Code Generation
Bin Xu, Yiguan Lin, Yinghao Li, YangGao
Large Language Model Language Model Code Generation Search Query Reasoning Path Augmented Data Minimax McTs Self Reasoning

November 16, 2024

November 12, 2024

A Comprehensive Survey of AI-Driven Advancements and Techniques in Automated Program Repair and Code Generation
Avinash Anand, Akshit Gupta, Nishchay Yadav, Shaurya Bajaj
Code Generation Comprehensive Survey Barzilai Borwein Technique Program Repair Bug Detection Simultaneous Improvement Potential Fix

November 8, 2024

Assessing the Answerability of Queries in Retrieval-Augmented Code Generation
Geonmin Kim, Jaeyeon Kim, Hancheol Park, Wooksu Shin, Tae-Ho Kim
Large Language Model Natural Language Code Generation Faithful Generation Query Information

November 7, 2024

November 6, 2024

Crystal: Illuminating LLM Abilities on Language and Code
Tianhua Tao, Junbo Li, Bowen Tan, Hongyi Wang, William Marshall, Bhargav M Kanakiya, Joel Hestness, Natalia Vassilieva, Zhiqiang Shen, Eric P. Xing, Zhengzhong Liu
Code Generation Human Language Real World Code Code Mixed Code LLM Crystalline Material LLM Capability

November 5, 2024

GitChameleon: Unmasking the Version-Switching Capabilities of Code Generation Models
Nizar Islah, Justine Gehring, Diganta Misra, Eilif Muller, Irina Rish, Terry Yue Zhuo, Massimo Caccia
Code Generation Real World Code Code Completion Code Generation Model Version Identification Generation Model Code Model

November 3, 2024

A Deep Dive Into Large Language Model Code Generation Mistakes: What and Why?
QiHong Chen, Jiawei Li, Jiecheng Deng, Jiachen Yu, Justin Tian Jin Chen, Iftekhar Ahmed
Large Language Model Code Generation Real World Code Deep Dive LLM Generated Code

October 31, 2024

SelfCodeAlign: Self-Alignment for Code Generation
Yuxiang Wei, Federico Cassano, Jiawei Liu, Yifeng Ding, Naman Jain, Zachary Mueller, Harm de Vries, Leandro von Werra, Arjun Guha, Lingming Zhang
Large Language Model Code Generation Instruction Tuning Self Alignment Instruction Response Pair

October 30, 2024

DemoCraft: Using In-Context Learning to Improve Code Generation in Large Language Models
Nirmal Joshua Kapu, Mihit Sreejith
Language Model Context Learning Code Generation Natural Language Instruction Latent Concept Semantic Token

October 29, 2024

Can Language Models Replace Programmers? REPOCOD Says 'Not Yet'
Shanchao Liang, Yiran Hu, Nan Jiang, Lin Tan
Language Model Code Generation Real World Code Human Programmer Generation Benchmark

October 28, 2024

Code Generation

Papers

Planning-Driven Programming: A Large Language Model Programming Workflow

Are Large Language Models Memorizing Bug Benchmarks?

Towards Specification-Driven LLM-Based Generation of Embedded Automotive Software

GNN-Based Code Annotation Logic for Establishing Security Boundaries in C Code

SRA-MCTS: Self-driven Reasoning Aurmentation with Monte Carlo Tree Search for Enhanced Code Generation

See-Saw Generative Mechanism for Scalable Recursive Code Generation with Generative AI

Chain-of-Programming (CoP) : Empowering Large Language Models for Geospatial Code Generation

A Comprehensive Survey of AI-Driven Advancements and Techniques in Automated Program Repair and Code Generation

Assessing the Answerability of Queries in Retrieval-Augmented Code Generation

CodeLutra: Boosting LLM Code Generation via Preference-Guided Refinement

OpenCoder: The Open Cookbook for Top-Tier Code Large Language Models

CodeTree: Agent-guided Tree Search for Code Generation with Large Language Models

Crystal: Illuminating LLM Abilities on Language and Code

GitChameleon: Unmasking the Version-Switching Capabilities of Code Generation Models

A Deep Dive Into Large Language Model Code Generation Mistakes: What and Why?

SelfCodeAlign: Self-Alignment for Code Generation

DemoCraft: Using In-Context Learning to Improve Code Generation in Large Language Models

Can Language Models Replace Programmers? REPOCOD Says 'Not Yet'

Geo-FuB: A Method for Constructing an Operator-Function Knowledge Base for Geospatial Code Generation Tasks Using Large Language Models

FALCON: Feedback-driven Adaptive Long/short-term memory reinforced Coding Optimization system