大模型避免复读重复惩罚参数