ML Research Benchmark [2410.22553]