Symbolic Regression

Symbolic regression (SR) is a machine learning technique aiming to discover concise, interpretable mathematical expressions that accurately model data. Current research emphasizes improving the efficiency and accuracy of SR algorithms, such as genetic programming and newer approaches incorporating neural networks and large language models, often focusing on techniques to handle noisy data and limited datasets. These advancements are significantly impacting scientific fields like materials science and physics by enabling the discovery of underlying physical laws and the development of more accurate and interpretable models for complex systems. The resulting interpretable models enhance scientific understanding and facilitate more efficient data analysis across various disciplines.

Papers

May 31, 2024

Shape Constraints in Symbolic Regression using Penalized Least Squares
Viktor Martinek, Julia Reuter, Ophelia Frotscher, Sanaz Mostaghim, Markus Richter, Roland Herzog
Symbolic Regression Least Square Parameter Estimation Shape Constraint Appropriate Penalty Term

May 28, 2024

May 11, 2024

Sharpness-Aware Minimization for Evolutionary Feature Construction in Regression
Hengzhe Zhang, Qi Chen, Bing Xue, Wolfgang Banzhaf, Mengjie Zhang
Novel Regression Symbolic Regression Genetic Programming Sharpness Aware Minimization

May 10, 2024

ISR: Invertible Symbolic Regression
Tony Tohme, Mohammad Javad Khojasteh, Mohsen Sadr, Florian Meyer, Kamal Youcef-Toumi
Symbolic Regression Invertible Neural Network Differentiable Architecture Inversion Problem

May 7, 2024

Integrating knowledge-guided symbolic regression and model-based design of experiments to automate process flow diagram development
Alexander W. Rogers, Amanda Lane, Cesar Mendoza, Simon Watson, Adam Kowalski, Philip Martin, Dongda Zhang
Symbolic Regression Optical Experiment Model Based Complex Process First Integral Flow Diagram Process Enhancement

April 29, 2024

In-Context Symbolic Regression: Leveraging Large Language Models for Function Discovery
Matteo Merler, Katsiaryna Haitsiukevich, Nicola Dainese, Pekka Marttinen
Language Model Vision Language Model Transformer Based Symbolic Regression Genetic Programming Protein Function Prediction

April 26, 2024

The Inefficiency of Genetic Programming for Symbolic Regression -- Extended Version
Gabriel Kronberger, Fabricio Olivetti de Franca, Harry Desmond, Deaglan J. Bartlett, Lukas Kammerer
High Efficiency Search Query Symbolic Regression Genetic Programming Extended Version

April 24, 2024

Generalizing the SINDy approach with nested neural networks
Camilla Fiorini, Clément Flint, Louis Fostier, Emmanuel Franck, Reyhaneh Hashemi, Victor Michel-Dansac, Wassim Tenachi
Neural Network Dynamical System Symbolic Regression System Identification SINDy Algorithm

April 22, 2024

Prove Symbolic Regression is NP-hard by Symbol Graph
Jinglu Song, Qiang Lu, Bozhou Tian, Jingwen Zhang, Jake Luo, Zhiguang Wang
Graph Representation Symbolic Regression NP Complete Symbolic Expression Steiner Tree

April 19, 2024

Leveraging Symbolic Regression for Heuristic Design in the Traveling Thief Problem
Andrew Ni, Lee Spector
Evolutionary Algorithm Symbolic Regression Knapsack Problem Online Packing Initialization Bias Thief Problem Heuristic Design

April 17, 2024

Discovering Nuclear Models from Symbolic Machine Learning
Jose M. Munoz, Silviu M. Udrescu, Ronald F. Garcia Ruiz
Symbolic Regression Symbolic Learning Nuclear Model

April 15, 2024

Shape Arithmetic Expressions: Advancing Scientific Discovery Beyond Closed-Form Equations
Krzysztof Kacprzyk, Mihaela van der Schaar
Scientific Discovery Symbolic Regression Generalized Additive Model Mathematical Expression Shape Function Closed Form Solution

April 9, 2024

Generative Pre-Trained Transformer for Symbolic Regression Base In-Context Reinforcement Learning
Yanjie Li, Weijun Li, Lina Yu, Min Wu, Jingyi Liu, Wenqiang Li, Meilan Hao, Shu Wei, Yusong Deng
Symbolic Regression Generative Pre Trained Transformer

April 8, 2024

March 21, 2024

Distilling Reinforcement Learning Policies for Interpretable Robot Locomotion: Gradient Boosting Machines and Symbolic Regression
Fernando Acero, Zhibin Li
Reinforcement Learning Symbolic Regression Gradient Boosting Robot Locomotion Policy Distillation Reinforcement Learning Policy Neural Network Policy

March 4, 2024

Deep Neural Network for Constraint Acquisition through Tailored Loss Function
Eduardo Vyhmeister, Rocio Paez, Gabriel Gonzalez
Deep Neural Network Loss Function Symbolic Regression Participation Constraint Constraint Learning Constraint Acquisition

February 28, 2024

MMSR: Symbolic Regression is a Multi-Modal Information Fusion Task
Yanjie Li, Jingyi Liu, Weijun Li, Lina Yu, Min Wu, Wenqiang Li, Meilan Hao, Su Wei, Yusong Deng
Contrastive Loss Symbolic Regression Multi Modal Task Multimodal Problem Expression Tree Modal Fusion

Symbolic Regression

Papers

Shape Constraints in Symbolic Regression using Penalized Least Squares

Symbolic Regression for Beyond the Standard Model Physics

Is machine learning good or bad for the natural sciences?

Sharpness-Aware Minimization for Evolutionary Feature Construction in Regression

ISR: Invertible Symbolic Regression

Integrating knowledge-guided symbolic regression and model-based design of experiments to automate process flow diagram development

In-Context Symbolic Regression: Leveraging Large Language Models for Function Discovery

The Inefficiency of Genetic Programming for Symbolic Regression -- Extended Version

Generalizing the SINDy approach with nested neural networks

Prove Symbolic Regression is NP-hard by Symbol Graph

Leveraging Symbolic Regression for Heuristic Design in the Traveling Thief Problem

Discovering Nuclear Models from Symbolic Machine Learning

Shape Arithmetic Expressions: Advancing Scientific Discovery Beyond Closed-Form Equations

Generative Pre-Trained Transformer for Symbolic Regression Base In-Context Reinforcement Learning

Minimum variance threshold for epsilon-lexicase selection

Interpretability in Symbolic Regression: a benchmark of Explanatory Methods using the Feynman data set

Inexact Simplification of Symbolic Regression Expressions with Locality-sensitive Hashing

Distilling Reinforcement Learning Policies for Interpretable Robot Locomotion: Gradient Boosting Machines and Symbolic Regression

Deep Neural Network for Constraint Acquisition through Tailored Loss Function

MMSR: Symbolic Regression is a Multi-Modal Information Fusion Task