—— AI头条 ——

OpenAI新模型基准测试争议

7天前 Ai138
1 0

第三方评测显示,OpenAI o3模型在数学推理测试中正确率仅10%,远低于官方宣称的25%,暴露模型评估透明度问题。这引发了对OpenAI模型评估准确性的质疑。