AI Chat
AI Drawing
AI Img Proc
AI Video
AI Audio
AI Coding
AI Office
AI Design
AI Writing
AI Reading
AI Detection
Prompts
Frameworks
AI Models
AI Learning
AI Directory
AI快讯
♥
English
中文
English
量子位
突破Agent长程推理效率瓶颈!MIT&NUS联合推出强化学习新训练方法
Direct Link
">
View on Mobile
Content assisted by AI. Please review carefully.
Related Navigation
机器人需求驱动导航新SOTA,成功率提升15%!浙大&vivo联手打造
Kimi K2官方技术报告出炉:采用384个专家,训练不靠刷题靠“用自己的话再讲一遍”
大模型越反思越错,原来是长链推理通过自我说服加重幻觉 | 北邮
AI打假AI,拿下SOTA丨厦大&腾讯优图
超越DeepSeek-R1,数学形式化准确率飙升至84% | 字节&南大开源
字节&MAP重塑大模型推理算法优化重点,强化学习重在高效探索助力LLM提升上限