新芒xAI 4月21日消息,OpenAI 最新 o3 推理模型被曝存在严重缺陷,幻觉率高达 33%,是 o1 模型的两倍。尽管 o3 在编码任务中性能提升,但其编造信息的问题显著增加。
分析指出,o3 模型幻觉率飙升与强化学习训练方法有关。强化学习虽然提升了特定领域性能,但也放大了模型生成虚假信息倾向,且丢弃“思维链”机制导致信息损失和编造解释。
过度优化是 o3 模型问题的关键。性能提升是以牺牲语言表达的可靠性和准确性为代价的,这引发了对其成熟度和潜在误用风险的担忧,并凸显了人工智能模型中奖励黑客问题的普遍性。