AI Chat
AI Drawing
AI Img Proc
AI Video
AI Audio
AI Coding
AI Office
AI Design
AI Writing
AI Reading
AI Detection
Prompts
Frameworks
AI Models
AI Learning
AI Directory
AI快讯
♥
English
中文
English
量子位
缺数据也能拿SOTA?清华&上海AI Lab破解机器人RL两大瓶颈
Direct Link
">
View on Mobile
Content assisted by AI. Please review carefully.
Related Navigation
超越DeepSeek-R1,数学形式化准确率飙升至84% | 字节&南大开源
什么是真正好用的推理模型?阶跃Step 3:开源的,多模态的,低成本的,国产芯片适配的
可灵2.5 Turbo太凶残:30%成本暴降+效果飞跃,生成体操动作可去参赛
突破Agent长程推理效率瓶颈!MIT&NUS联合推出强化学习新训练方法
字节&MAP重塑大模型推理算法优化重点,强化学习重在高效探索助力LLM提升上限
4B小模型数学推理首超Claude 4,700步RL训练逼近235B性能 | 港大&字节Seed&复旦