AI Chat
AI Drawing
AI Img Proc
AI Video
AI Audio
AI Coding
AI Office
AI Design
AI Writing
AI Reading
AI Detection
Prompts
Frameworks
AI Models
AI Learning
AI Directory
AI快讯
♥
English
中文
English
量子位
4B小模型数学推理首超Claude 4,700步RL训练逼近235B性能 | 港大&字节Seed&复旦
Direct Link
">
View on Mobile
Content assisted by AI. Please review carefully.
Related Navigation
4B小模型数学推理首超Claude 4,700步RL训练逼近235B性能 | 港大&字节Seed&复旦
超越DeepSeek-R1,数学形式化准确率飙升至84% | 字节&南大开源
突破Agent长程推理效率瓶颈!MIT&NUS联合推出强化学习新训练方法
超越DeepSeek-R1,数学形式化准确率飙升至84% | 字节&南大开源
1.5B刷新数学代码SOTA!快手&清华精细化Token管理,LLM推理能力飙升
手术刀式去噪突破LLM能力上限,从头预训练模型下游任务平均提高7.2% | 中科院&阿里