新浪财经

百度代运营

滚动播报 2026-04-25 17:41:52

(来源:上观新闻)

--- 三🥦、"薄控制🛍🇳🇺、厚状态":🇯🇲🙍一套听起来奇怪🕳但非常有😐🤺效的工🇫🇲作方式🇵🇾⚰ 研究团🥖🛃队用一句话概括了🥚✏AI科学家的🇻🇮🎭设计核心:🗯"薄控制,🖥9️⃣厚状态"🍵。在几个对比方🚟法中,直接在目标🐰🚡环境里用强🍖🕦化学习🤤👩‍🎤训练的模型(GR🛡PO on T🇲🇹arge🇧🇴t)能达到🙌👾37.🖕🇹🇩8%,一种使用通🚨用合成🌉🛋环境训练的方法🆘(AWM🐕)能达到38.4🇷🇸🤫%,而一🐯🇧🇦种通过优化系统提🇨🇬示词来🏃‍♀️✌植入能力描述🤲的方法(🚴🤩GEPA)能达🇩🇿到39.6🔅%😂👼。

在Too🌁lSa✌ndBo🔶x上,系统识🤯Ⓜ别出了两种🦛关键能力薄弱点🇵🇳😴。一位机器学习方向🏤👍的博士生,拿到一🇧🇩❕篇论文后,♓需要先读懂它,再♏🦖搭建运行环境,接🖐👬着动手写代码🍲🇦🇺,然后跑🧠🧹实验、🇧🇹☝看结果、发现问题🇱🇹☄、修改🏊代码、再跑…🐣…这个循环🕤🇦🇽往往持续👣⛹️‍♀️好几天,中👜间任何一步出了岔🐃子,都可能前功尽🥇🆕弃👕🦄。