LLM Reasoning

Research on Large Language Model (LLM) reasoning focuses on improving the ability of LLMs to perform complex, multi-step reasoning tasks, often by augmenting them with techniques like chain-of-thought prompting, reinforcement learning (RL), and integration with symbolic reasoning methods. Current efforts concentrate on enhancing the accuracy and reliability of LLM reasoning, addressing issues like hallucination and inconsistent performance across different domains and tasks, often through improved credit assignment in RL and the development of novel evaluation metrics. These advancements are significant because reliable LLM reasoning is crucial for building trustworthy AI systems across diverse applications, from robotics and healthcare to scientific discovery and decision support.

Papers

November 12, 2024

What Do Learning Dynamics Reveal About Generalization in LLM Reasoning?
Katie Kang, Amrith Setlur, Dibya Ghosh, Jacob Steinhardt, Claire Tomlin, Sergey Levine, Aviral Kumar
Strong Generalization Pre Training Downstream Task Learning Dynamic LLM Reasoning

November 7, 2024

Kwai-STaR: Transform LLMs into State-Transition Reasoners
Xingyu Lu, Yuhang Hu, Changyi Liu, Tianke Zhang, Zhenyu Yang, Zhixiang Ding, Shengsheng Qian, Meng Du, Ruiwen Kang, Kaiyu Tang, Fan Yang, Tingting Gao, Di Zhang, Hai-Tao Zheng, Bin Wen
Medical LLM Mathematical Reasoning LLM Reasoning Intuitive Explanation

October 31, 2024

Thought Space Explorer: Navigating and Expanding Thought Space for Large Language Model Reasoning
Jinghan Zhang, Fengran Mo, Xiting Wang, Kunpeng Liu
Reasoning Task Complex Reasoning Task Thought Reasoning LLM Reasoning Language Model Reasoning Thought Expansion

October 30, 2024

ReasoningRec: Bridging Personalized Recommendations and Human-Interpretable Explanations through LLM Reasoning
Millennium Bismay, Xiangjue Dong, James Caverlee
Personalized Recommendation LLM Reasoning Human Understandable Explanation

October 29, 2024

Flow-DPO: Improving LLM Mathematical Reasoning through Online Multi-Agent Learning
Yihe Deng, Paul Mineiro
Complex Reasoning Online Service Multi Agent Learning LLM Fine Tuning LLM Reasoning Reasoning Trace

October 22, 2024

Language Model Non-myopic Generation for Reasoning and Planning
Chang Ma, Haiteng Zhao, Junlei Zhang, Junxian He, Lingpeng Kong
Language Model Complex Reasoning Faithful Generation Task Planning LLM Based Predictive Coding LLM Reasoning Optimal Planning

October 19, 2024

On Designing Effective RL Reward at Training Time for LLM Reasoning
Jiaxuan Gao, Shusheng Xu, Wenjie Ye, Weilin Liu, Chuyi He, Wei Fu, Zhiyu Mei, Guangju Wang, Yi Wu
Reward Model Sparse Reward LLM Reasoning Training Time

October 17, 2024

Unconstrained Model Merging for Enhanced LLM Reasoning
Yiming Zhang, Baoyi He, Shengyu Zhang, Yuhao Fu, Qi Zhou, Zhijie Sang, Zijin Hong, Kejing Yang, Wenjun Wang, Jianbo Yuan, Guangning Han, Linyi Li, Chunlin Ji, Fei Wu, Hongxia Yang
Large Language Model LLM Reasoning Model Merging

October 16, 2024

Enhancing LLM Trading Performance with Fact-Subjectivity Aware Reasoning
Qian Wang, Yuchen Gao, Zhenheng Tang, Bingqiao Luo, Bingsheng He
LLM Reasoning Human Opinion LLM Performance Subjectivity Detection Trading Policy

October 13, 2024

Expanding Search Space with Diverse Prompting Agents: An Efficient Sampling Approach for LLM Mathematical Reasoning
Gisang Lee, Sangwoo Park, Junyoung Park, Andrew Chung, Sieun Park, Yoonah Park, Byungju Kim, Min-gyu Cho
High Efficiency Mathematical Reasoning Reasoning Ability LLM Reasoning Search Space MATH Dataset Sampling Strategy Problem Solving Strategy

October 11, 2024

Aerial Vision-and-Language Navigation via Semantic-Topo-Metric Representation Guided LLM Reasoning
Yunpeng Gao, Zhigang Wang, Linglin Jing, Dong Wang, Xuelong Li, Bin Zhao
Vision and Language Navigation LLM Reasoning Language Navigation Action Prediction Semantic Topometric

October 10, 2024

October 5, 2024

Improving LLM Reasoning through Scaling Inference Computation with Collaborative Verification
Zhenwen Liang, Ye Liu, Tong Niu, Xiangliang Zhang, Yingbo Zhou, Semih Yavuz
Complex Reasoning Reasoning Path LLM Reasoning Reasoning Strategy Scalable Inference

October 4, 2024

GenSim2: Scaling Robot Data Generation with Multi-modal and Reasoning LLMs
Pu Hua, Minghuan Liu, Annabella Macaluso, Yunfeng Lin, Weinan Zhang, Huazhe Xu, Lirui Wang
LLM Reasoning Interactive Simulation Language Conditioned Robot Simulation Zero Shot Sim to Real

September 30, 2024

Ranking Over Scoring: Towards Reliable and Robust Automated Evaluation of LLM-Generated Medical Explanatory Arguments
Iker De la Iglesia, Iakes Goenaga, Johanna Ramirez-Romero, Jose Maria Villa-Gonzalez, Josu Goikoetxea, Ander Barrena
Adversarial Attack Partial Ranking LLM Reasoning Spoken Argumentation Scoring Property Robust Evaluation Medical Reasoning LLM Explanation

September 25, 2024

Proof of Thought : Neurosymbolic Program Synthesis allows Robust and Interpretable Reasoning
Debargha Ganguly, Srinivasan Iyengar, Vipin Chaudhary, Shivkumar Kalyanaraman
Thought Reasoning LLM Reasoning Formal Verification Multimodal Reasoning Partial Proof Theorem Provers Interpretable Knowledge Neurosymbolic Programming

LLM Reasoning

Papers

What Do Learning Dynamics Reveal About Generalization in LLM Reasoning?

Kwai-STaR: Transform LLMs into State-Transition Reasoners

Thought Space Explorer: Navigating and Expanding Thought Space for Large Language Model Reasoning

ReasoningRec: Bridging Personalized Recommendations and Human-Interpretable Explanations through LLM Reasoning

Flow-DPO: Improving LLM Mathematical Reasoning through Online Multi-Agent Learning

Language Model Non-myopic Generation for Reasoning and Planning

On Designing Effective RL Reward at Training Time for LLM Reasoning

Unconstrained Model Merging for Enhanced LLM Reasoning

Enhancing LLM Trading Performance with Fact-Subjectivity Aware Reasoning

Expanding Search Space with Diverse Prompting Agents: An Efficient Sampling Approach for LLM Mathematical Reasoning

Aerial Vision-and-Language Navigation via Semantic-Topo-Metric Representation Guided LLM Reasoning

Rewarding Progress: Scaling Automated Process Verifiers for LLM Reasoning

Automatic Curriculum Expert Iteration for Reliable LLM Reasoning

Improving LLM Reasoning through Scaling Inference Computation with Collaborative Verification

GenSim2: Scaling Robot Data Generation with Multi-modal and Reasoning LLMs

Not All LLM Reasoners Are Created Equal

VinePPO: Unlocking RL Potential For LLM Reasoning Through Refined Credit Assignment

AHP-Powered LLM Reasoning for Multi-Criteria Evaluation of Open-Ended Responses

Ranking Over Scoring: Towards Reliable and Robust Automated Evaluation of LLM-Generated Medical Explanatory Arguments

Proof of Thought : Neurosymbolic Program Synthesis allows Robust and Interpretable Reasoning