Prior Constraints-based Reward Model Training for Aligning Large Language Models [2404.00978]