Atari Benchmark

The Atari benchmark, using the Arcade Learning Environment (ALE), assesses the capabilities of deep reinforcement learning (RL) agents across diverse Atari 2600 games. Current research focuses on improving sample efficiency and addressing limitations in existing algorithms, such as variance in value estimation and the exploration-exploitation dilemma, often employing ensemble methods and advanced planning techniques like Monte Carlo Tree Search. These efforts aim to push RL agents towards achieving truly superhuman performance, measured against human world records, thereby advancing the field's understanding of general-purpose intelligence and providing valuable insights for broader RL applications.

Papers

May 9, 2023

Learnable Behavior Control: Breaking Atari Human World Records via Sample-Efficient Behavior Selection
Jiajun Fan, Yuzheng Zhuang, Yuecheng Liu, Jianye Hao, Bin Wang, Jiangcheng Zhu, Hao Wang, Shu-Tao Xia
Deep Reinforcement Learning Behavior Space Behavior Selection Atari Benchmark

October 12, 2022

Efficient Offline Policy Optimization with a Learned Model
Zichen Liu, Siyi Li, Wee Sun Lee, Shuicheng Yan, Zhongwen Xu
Monte Carlo Tree Search Offline Policy Learned Model Offline Policy Learning Atari Benchmark

September 16, 2022

Reducing Variance in Temporal-Difference Value Estimation via Ensemble of Deep Networks
Litian Liang, Yaosheng Xu, Stephen McAleer, Dailin Hu, Alexander Ihler, Pieter Abbeel, Roy Fox
Deep Network Diverse Ensemble Variance Reduction Temporal Difference Learning Temporal Difference Variance Estimation Atari Benchmark

December 8, 2021

A Review for Deep Reinforcement Learning in Atari:Benchmarks, Challenges, and Solutions
Jiajun Fan
Reinforcement Learning Deep Reinforcement Learning New Benchmark Technical Challenge Solution Path Learning Environment ATARI Game Atari Benchmark

Atari Benchmark

Papers

Learnable Behavior Control: Breaking Atari Human World Records via Sample-Efficient Behavior Selection

Efficient Offline Policy Optimization with a Learned Model

Reducing Variance in Temporal-Difference Value Estimation via Ensemble of Deep Networks

A Review for Deep Reinforcement Learning in Atari:Benchmarks, Challenges, and Solutions