Code Generation

Code generation research focuses on using large language models (LLMs) to automatically produce functional and secure code from natural language descriptions or other inputs. Current efforts concentrate on improving the accuracy and efficiency of code generation, including developing novel training objectives like horizon-length prediction and employing techniques such as multi-agent frameworks, Monte Carlo Tree Search, and prompt engineering to guide LLMs towards better solutions. This field is significant because it promises to dramatically increase developer productivity and accelerate software development, while also raising important questions about code security and reliability that require further investigation.

Papers

June 5, 2024

Enhancing Repository-Level Code Generation with Integrated Contextual Information
Zhiyuan Pan, Xing Hu, Xin Xia, Xiaohu Yang
Code Generation Code Generation Task Code Model

June 3, 2024

SemCoder: Training Code Language Models with Comprehensive Semantics Reasoning
Yangruibo Ding, Jinjun Peng, Marcus J. Min, Gail Kaiser, Junfeng Yang, Baishakhi Ray
Large Language Model Language Model Code Generation Code Mixed Code LLM Analytical Semantics

June 1, 2024

A Survey on Large Language Models for Code Generation
Juyong Jiang, Fan Wang, Jiasi Shen, Sungju Kim, Sunghun Kim
Large Language Model Natural Language Processing Timely Survey Code Generation

May 31, 2024

Grammar-Aligned Decoding
Kanghee Park, Jiayu Wang, Taylor Berg-Kirkpatrick, Nadia Polikarpova, Loris D'Antoni
Code Generation Structured Output Natural Language Constraint

May 30, 2024

May 29, 2024

May 28, 2024

May 27, 2024

ReflectionCoder: Learning from Reflection Sequence for Enhanced One-off Code Generation
Houxing Ren, Mingjie Zhan, Zhongyuan Wu, Aojun Zhou, Junting Pan, Hongsheng Li
Code Generation Reflective Flare DeepSeek Coder

May 25, 2024

Learning to Reason via Program Generation, Emulation, and Search
Nathaniel Weir, Muhammad Khalifa, Linlu Qiu, Orion Weller, Peter Clark
LeArning Abstract Code Generation Search Query Program Synthesis Reason Giving Code Language Model Code Synthesis Basic Emulator Symbolic Task Program Generation

May 24, 2024

May 23, 2024

May 20, 2024

Can Github issues be solved with Tree Of Thoughts?
Ricardo La Rosa, Corey Hulse, Bangdi Liu
Code Generation Thought Reasoning Language Model Reasoning GitHub Issue Reasoning Trajectory

May 19, 2024

MHPP: Exploring the Capabilities and Limitations of Language Models Beyond Basic Code Generation
Jianbo Dai, Jianqiao Lu, Yunlong Feng, Dong Huang, Guangtao Zeng, Rongju Ruan, Ming Cheng, Haochen Tan, Zhijiang Guo
Large Language Model Language Model Code Generation Fundamental Limitation Capability Evolution

May 18, 2024

MapCoder: Multi-Agent Code Generation for Competitive Problem Solving
Md. Ashraful Islam, Mohammed Eunus Ali, Md Rizwan Parvez
Multi Agent Code Generation Code Generation Task Code Synthesis Code Generation Ability Programming Problem Program Synthesis Benchmark

Code Generation

Papers

Enhancing Repository-Level Code Generation with Integrated Contextual Information

SemCoder: Training Code Language Models with Comprehensive Semantics Reasoning

A Survey on Large Language Models for Code Generation

Grammar-Aligned Decoding

Divide-and-Conquer Meets Consensus: Unleashing the Power of Functions in Code Generation

From Symbolic Tasks to Code Generation: Diversification Yields Better Task Performers

AlchemistCoder: Harmonizing and Eliciting Code Capability by Hindsight Tuning on Multi-source Data

Large Language Models for Code Summarization

Training LLMs to Better Self-Debug and Explain Code

Exploiting LLM Quantization

ReflectionCoder: Learning from Reflection Sequence for Enhanced One-off Code Generation

Learning to Reason via Program Generation, Emulation, and Search

Model Cascading for Code: Reducing Inference Costs with Model Cascading for LLM Based Code Generation

ChatGPT Code Detection: Techniques for Uncovering the Source of Code

EffiLearner: Enhancing Efficiency of Generated Code via Self-Optimization

Evaluation of the Programming Skills of Large Language Models

AutoCoder: Enhancing Code Large Language Model with \textsc{AIEV-Instruct}

Can Github issues be solved with Tree Of Thoughts?

MHPP: Exploring the Capabilities and Limitations of Language Models Beyond Basic Code Generation

MapCoder: Multi-Agent Code Generation for Competitive Problem Solving