Real World Code

Real-world code research focuses on bridging the gap between large language models (LLMs) and practical software development, aiming to improve the quality, security, and efficiency of automatically generated code. Current research emphasizes developing methods for generating equivalent code representations, ensuring code correctness through techniques like hierarchical debugging and polyhedral modeling, and mitigating security vulnerabilities via prompt optimization and generative adversarial networks. This field is significant because it directly impacts software engineering practices, potentially increasing developer productivity and improving software reliability and security.

Papers

August 24, 2023

Code Llama: Open Foundation Models for Code
Baptiste Rozière, Jonas Gehring, Fabian Gloeckle, Sten Sootla, Itai Gat, Xiaoqing Ellen Tan, Yossi Adi, Jingyu Liu, Romain Sauvestre, Tal Remez, Jérémy Rapin, Artyom Kozhevnikov, Ivan Evtimov, Joanna Bitton, Manish Bhatt, Cristian Canton Ferrer, Aaron Grattafiori, Wenhan Xiong, Alexandre Défossez, Jade Copet, Faisal Azhar, Hugo Touvron, Louis Martin, Nicolas Usunier, Thomas Scialom, Gabriel Synnaeve
Large Language Model Zero Shot Foundation Model Real World Code Code Benchmark LLaMA 3 Instruction Following Model Long Input Context

August 20, 2023

Can ChatGPT replace StackOverflow? A Study on Robustness and Reliability of Large Language Model Code Generation
Li Zhong, Zilong Wang
Large Language Model Native Robustness ChatGPT Generated Conversation Code Generation Real World Code Code Benchmark Stack Overflow

August 14, 2023

OctoPack: Instruction Tuning Code Large Language Models
Niklas Muennighoff, Qian Liu, Armel Zebaze, Qinkai Zheng, Binyuan Hui, Terry Yue Zhuo, Swayam Singh, Xiangru Tang, Leandro von Werra, Shayne Longpre
Large Language Model Real World Code Code Benchmark Synthetic Instruction Code Synthesis

August 11, 2023

Enhancing Network Management Using Code Generated by Large Language Models
Sathiya Kumaran Mani, Yajie Zhou, Kevin Hsieh, Santiago Segarra, Ranveer Chandra, Srikanth Kandula
Large Language Model Real World Code Natural Language Query Network Topology Communication Graph Network Management

August 7, 2023

Evaluating and Explaining Large Language Models for Code Using Syntactic Structures
David N Palacio, Alejandro Velasco, Daniel Rodriguez-Cardenas, Kevin Moran, Denys Poshyvanyk
Real World Code Explainability Method Model Evaluation Syntactic Structure Software Development Visual Text

August 5, 2023

An Empirical Study of AI-based Smart Contract Creation
Rabimba Karanjai, Edward Li, Lei Xu, Weidong Shi
Empirical Study Real World Code Smart Contract

July 30, 2023

Evaluating ChatGPT and GPT-4 for Visual Programming
Adish Singla
Generative Model Generative AI GPT 4 Real World Code Visual Programming Exploring ChatGPT

July 27, 2023

July 17, 2023

FRANC: A Lightweight Framework for High-Quality Code Generation
Mohammed Latif Siddiq, Beatrice Casey, Joanna C. S. Santos
Code Generation Real World Code Code Generation Model Lightweight Framework

July 10, 2023

Can You Improve My Code? Optimizing Programs with Local Search
Fatemeh Abdollahi, Saqib Ameen, Matthew E. Taylor, Levi H. S. Lelis
Real World Code Local Search Single Agent Past Present Temporal Program Code Optimization

July 9, 2023

Automatic Coding at Scale: Design and Deployment of a Nationwide System for Normalizing Referrals in the Chilean Public Healthcare System
Fabián Villena, Matías Rojas, Felipe Arias, Jorge Pacheco, Paulina Vera, Jocelyn Dunstan
Visual Analogue Scale Real World Code Healthcare System Common Disease Unstructured Data Code Data Automatic Coding

June 22, 2023

FLAG: Finding Line Anomalies (in code) with Generative AI
Baleegh Ahmad, Benjamin Tan, Ramesh Karri, Hammond Pearce
Generative AI Real World Code Source Code Code Debugging Bug Report Line Detection Label Aggregation LLM Era

June 20, 2023

Textbooks Are All You Need
Suriya Gunasekar, Yi Zhang, Jyoti Aneja, Caio César Teodoro Mendes, Allie Del Giorno, Sivakanth Gopi, Mojan Javaheripi, Piero Kauffmann, Gustavo de Rosa, Olli Saarikivi, Adil Salim, Shital Shah, Harkirat Singh Behl, Xin Wang, Sébastien Bubeck, Ronen Eldan, Adam Tauman Kalai, Yin Tat Lee, Yuanzhi Li
Large Language Model Transformer Based Model Real World Code Phi 3 New Curriculum Textbook

June 19, 2023

Guiding Language Models of Code with Global Context using Monitors
Lakshya A Agrawal, Aditya Kanade, Navin Goyal, Shuvendu K. Lahiri, Sriram K. Rajamani
Real World Code Global Context Static Analysis High Frequency Display Instruct Tuned Model

June 16, 2023

Is Self-Repair a Silver Bullet for Code Generation?
Theo X. Olausson, Jeevana Priya Inala, Chenglong Wang, Jianfeng Gao, Armando Solar-Lezama
Large Language Model Code Generation Real World Code Code Debugging Self Repair

June 14, 2023

June 7, 2023

StudentEval: A Benchmark of Student-Written Prompts for Large Language Models of Code
Hannah McLean Babe, Sydney Nguyen, Yangtian Zi, Arjun Guha, Molly Q Feldman, Carolyn Jane Anderson
New Benchmark Code Generation Real World Code Student Friendly Knowledge Code LLM Augmented LLM Working Programmer

June 5, 2023

"Medium" LMs of Code in the Era of LLMs: Lessons From StackOverflow
Manisha Mukherjee, Vincent J. Hellendoorn
Large Language Model Medical LLM Pre Trained Model Large Corpus Real World Code Critical Lesson Large Pre Trained Language Model BERT Based Tuned Lm Stack Overflow