GROOT: Corrective Reward Optimization for Generative Sequential Labeling [2209.14694]