the latest in aiBeta

Mathematical Reasoning

Mathematical reasoning in large language models (LLMs) is a burgeoning research area focused on evaluating and improving the ability of these models to solve mathematical problems, encompassing both symbolic and numerical reasoning. Current research emphasizes developing more robust benchmarks that assess not only final accuracy but also the reasoning process itself, including error detection and correction, and exploring various training methods such as reinforcement learning from human feedback and instruction tuning to enhance model performance. This field is significant because advancements in mathematical reasoning capabilities in LLMs have broad implications for various applications, including education, scientific discovery, and automated problem-solving.

151papers

Papers

May 22, 2025

May 21, 2025

May 19, 2025

AutoMathKG: The automated mathematical knowledge graph based on LLM and vector database
Rong Bian, Yu Geng, Zijian Yang, Bing Cheng
Chinese Academy of Sciences●University of Chinese Academy of Sciences●AMSS Center for Forecasting Science●Academy of Mathematics and...+1
Vector Database Medical LLM Mathematical Reasoning Knowledge Fusion

May 18, 2025

May 15, 2025

MathCoder-VL: Bridging Vision and Code for Enhanced Multimodal Mathematical Reasoning
Ke Wang, Junting Pan, Linda Wei, Aojun Zhou, Weikang Shi, Zimu Lu, Han Xiao, Yunqiao Yang, Houxing Ren, Mingjie Zhan, Hongsheng Li
The Chinese University of Hong Kong●CPII
Multimodal Mathematical Mathematical Reasoning Real World Code Multimodal Model Image Caption Image to Text Vision Paper

May 5, 2025

FormalMATH: Benchmarking Formal Mathematical Reasoning of Large Language Models
Zhouliang Yu, Ruotian Peng, Keyi Ding, Yizhe Li, Zhongyuan Peng, Minghao Liu, Yifan Zhang, Zheng Yuan, Huajian Xin, Wenhao Huang, Yandong Wen+2
The Chinese University of Hong Kong●Numina●Westlake University●M-A-P●2077AI●Los Angeles●Max Planck Institute for Intelligent Systems
Large Language Mathematical Reasoning LLM Based Formal Mathematics Full Model Theorem Provers

April 30, 2025

DeepSeek-Prover-V2: Advancing Formal Mathematical Reasoning via Reinforcement Learning for Subgoal Decomposition
Z.Z. Ren, Zhihong Shao, Junxiao Song, Huajian Xin, Haocheng Wang, Wanjia Zhao, Liyue Zhang, Zhe Fu, Qihao Zhu, Dejian Yang, Z.F. Wu, Zhibin Gou+6
DeepSeek-AI
Large Language Model Step by Step Reasoning Mathematical Reasoning Reinforcement Learning Theorem Proving

April 27, 2025

Hierarchical Attention Generates Better Proofs
Jianlong Chen, Chao Li, Yang Yuan, Andrew C Yao
The Chinese University of Hong Kong●Shanghai Qi Zhi Institute●Tsinghua University
Token Level Hierarchical Attention Proof Generation Theorem Proving Mathematical Proof Mathematical Reasoning

April 25, 2025

PolyMath: Evaluating Mathematical Reasoning in Multilingual Contexts
Yiming Wang, Pei Zhang, Jialong Tang, Haoran Wei, Baosong Yang, Rui Wang, Chenshu Sun, Feitong Sun, Jiran Zhang, Junxuan Wu, Qiqian Cang+5
Alibaba Group●Shanghai Jiao Tong University
Complex Reasoning Mathematical Reasoning Multilingual Reasoning Reasoning Performance Multilingual Context

April 23, 2025

AIMO-2 Winning Solution: Building State-of-the-Art Mathematical Reasoning Models with OpenMathReasoning dataset
Ivan Moshkov, Darragh Hanley, Ivan Sorokin, Shubham Toshniwal, Christof Henkel, Benedikt Schifferer, Wei Du, Igor Gitman
Reasoning Benchmark MATH Dataset Place Solution State of the Art Reasoning System Mathematical Reasoning

April 17, 2025

Enhancing the Geometric Problem-Solving Ability of Multimodal LLMs via Symbolic-Neural Integration
Yicheng Pan, Zhenrong Zhang, Pengfei Hu, Jiefeng Ma, Jun Du, Jianshu Zhang, Quan Liu, Jianqing Gao, Feng Ma
University of Science and Technology of China●iFLYTEK Research
Mathematical Reasoning Geometric Reasoning Symbolic Integration Reasoning Path Symbolic Reasoning Multimodal LLM

April 15, 2025