First-order Policy Optimization for Robust Policy Evaluation [2307.15890]