AI Chat
AI Drawing
AI Img Proc
AI Video
AI Audio
AI Coding
AI Office
AI Design
AI Writing
AI Reading
AI Detection
Prompts
Frameworks
AI Models
AI Learning
AI Directory
AI快讯
♥
English
中文
English
量子位
4B小模型数学推理首超Claude 4,700步RL训练逼近235B性能 | 港大&字节Seed&复旦
Direct Link
">
View on Mobile
Content assisted by AI. Please review carefully.
Related Navigation
后生可畏!何恺明团队新成果发布,共一清华姚班大二在读
精准锁定「硬骨头」:难样本筛选破局SFT依赖,GRPO-only斩获感知推理双最优
突破Agent长程推理效率瓶颈!MIT&NUS联合推出强化学习新训练方法
多模态大模型学会反思和复盘,上交&上海AI Lab破解多模态复杂推理
AI打假AI,拿下SOTA丨厦大&腾讯优图
4B小模型数学推理首超Claude 4,700步RL训练逼近235B性能 | 港大&字节Seed&复旦