Hybrid Value Estimation for Off-policy Evaluation and Offline Reinforcement Learning [2206.02000]