AI Chat
AI Drawing
AI Img Proc
AI Video
AI Audio
AI Coding
AI Office
AI Design
AI Writing
AI Reading
AI Detection
Prompts
Frameworks
AI Models
AI Learning
AI Directory
AI快讯
♥
English
中文
English
量子位
突破Agent长程推理效率瓶颈!MIT&NUS联合推出强化学习新训练方法
Direct Link
">
View on Mobile
Content assisted by AI. Please review carefully.
Related Navigation
3D生成补上物理短板!首个系统性标注物理3D数据集上线,还有一个端到端框架
突破Agent长程推理效率瓶颈!MIT&NUS联合推出强化学习新训练方法
多模态模型学会“按需搜索”,少搜30%还更准!字节&NTU新研究优化多模态模型搜索策略
空间智能卡脖子难题被杭州攻克!难倒GPT-5后,六小龙企业出手了
4B小模型数学推理首超Claude 4,700步RL训练逼近235B性能 | 港大&字节Seed&复旦
字节&MAP重塑大模型推理算法优化重点,强化学习重在高效探索助力LLM提升上限