A Note on Target Q-learning For Solving Finite MDPs with A Generative Oracle [2203.11489]