4B小模型数学推理首超Claude 4，700步RL训练逼近235B性能 | 港大&字节Seed&复旦 - AI工具导航AI工具导航

4B小模型数学推理首超Claude 4，700步RL训练逼近235B性能 | 港大&字节Seed&复旦

链接直达 ">手机查看

内容由AI协助整理，请仔细甄别

相关导航