Counterfactual Regret Minimization

Counterfactual Regret Minimization (CFR) is a family of algorithms designed to solve large-scale imperfect-information games by iteratively minimizing regret, a measure of how poorly an agent performed compared to alternative actions. Current research focuses on improving CFR's efficiency through techniques like GPU acceleration, optimistic online mirror descent variants for faster convergence, and integrating it with other methods such as Boltzmann Q-learning or large language models for enhanced performance in complex games like poker and Mahjong. These advancements are significant because they enable the solution of increasingly complex games, pushing the boundaries of artificial intelligence and offering potential applications in areas like negotiation, resource management, and security.

Papers

August 27, 2024

GPU-Accelerated Counterfactual Regret Minimization
Juho Kim
Practical Algorithm Sparse Matrix Imperfect Information Game Regret Dynamic Counterfactual Regret Minimization

April 22, 2024

Minimizing Weighted Counterfactual Regret with Optimistic Online Mirror Descent
Hang Xu, Kai Li, Bingyun Liu, Haobo Fu, Qiang Fu, Junliang Xing, Jian Cheng
Online Mirror Descent Counterfactual Regret Regret Matching Counterfactual Regret Minimization

February 19, 2024

Easy as ABCs: Unifying Boltzmann Q-Learning and Counterfactual Regret Minimization
Luca D'Amico-Wong, Hugh Zhang, Marc Lanctot, David C. Parkes
Reinforcement Learning Markov Decision Process Multi Agent Q Learning Counterfactual Regret Minimization

January 4, 2024

PokerGPT: An End-to-End Lightweight Solver for Multi-Player Texas Hold'em via Large Language Model
Chenghao Huang, Yanbo Cao, Yinlong Wen, Tao Zhou, Yanru Zhang
Large Language Model Imperfect Information Game Poker Hand Fast Solver Counterfactual Regret Minimization

September 4, 2023

Accelerating Nash Equilibrium Convergence in Monte Carlo Settings Through Counterfactual Value Based Fictitious Play
Ju Qi, Falin Hei, Ting Feng, Dengbing Yi, Zhemei Fang, Yunfeng Luo
Counterfactual Regret Regret Matching Counterfactual Regret Minimization Incomplete Information Game

July 22, 2023

CFR-p: Counterfactual Regret Minimization with Hierarchical Policy Abstraction, and its Application to Two-player Mahjong
Shiheng Wang
Application Proficiency Imperfect Information Game Poker Hand Counterfactual Regret Minimization Incomplete Information Game Policy Architecture

May 27, 2023

Hierarchical Deep Counterfactual Regret Minimization
Jiayu Chen, Tian Lan, Vaneet Aggarwal
Imperfect Information Game Bayesian Regret Counterfactual Regret Minimization

June 19, 2022

The Power of Regularization in Solving Extensive-Form Games
Mingyang Liu, Asuman Ozdaglar, Tiancheng Yu, Kaiqing Zhang
Real Power Video Game Convergence Guarantee Mirror Descent Extensive Form Game Solving Non Rectangular Counterfactual Regret Minimization

June 8, 2022

ESCHER: Eschewing Importance Sampling in Games by Computing a History Value Function to Estimate Regret
Stephen McAleer, Gabriele Farina, Marc Lanctot, Tuomas Sandholm
Nash Equilibrium Value Function Video Game Model Free Importance Sampling Digital Computing Approximate Nash Equilibrium Counterfactual Regret Minimization Static Regret Fictitious Self Play

May 24, 2022

Efficient Deviation Types and Learning for Hindsight Rationality in Extensive-Form Games: Corrections
Dustin Morrill, Ryan D'Orazio, Marc Lanctot, James R. Wright, Michael Bowling, Amy R. Greenwald
LeArning Abstract Video Game Language Correction Regret Minimization Hindsight Instruction Least Absolute Deviation Counterfactual Regret Minimization Regret Dynamic

February 3, 2022

Near-Optimal Learning of Extensive-Form Games with Imperfect Information
Yu Bai, Chi Jin, Song Mei, Tiancheng Yu
Video Game Bandit Feedback General Sum Game Counterfactual Regret Minimization Coarse Correlated Equilibrium Information Extensive Form Game

Counterfactual Regret Minimization

Papers

GPU-Accelerated Counterfactual Regret Minimization

Minimizing Weighted Counterfactual Regret with Optimistic Online Mirror Descent

Easy as ABCs: Unifying Boltzmann Q-Learning and Counterfactual Regret Minimization

PokerGPT: An End-to-End Lightweight Solver for Multi-Player Texas Hold'em via Large Language Model

Accelerating Nash Equilibrium Convergence in Monte Carlo Settings Through Counterfactual Value Based Fictitious Play

CFR-p: Counterfactual Regret Minimization with Hierarchical Policy Abstraction, and its Application to Two-player Mahjong

Hierarchical Deep Counterfactual Regret Minimization

The Power of Regularization in Solving Extensive-Form Games

ESCHER: Eschewing Importance Sampling in Games by Computing a History Value Function to Estimate Regret

Efficient Deviation Types and Learning for Hindsight Rationality in Extensive-Form Games: Corrections

Near-Optimal Learning of Extensive-Form Games with Imperfect Information