Stochastic Policy Gradient - Latest AI Research Papers