魔术泛站群
(来源:上观新闻)
简单说🎌🥇就是给 🐤Agent 装一🇱🇷个"油🥵◀表":当 To👩🎓ken 消👁耗接近预🕵️♀️🇳🇨算时,强制🇦🇪它停止无🔛🇳🇮效探索,而🤢🚶不是一路烧到🚧🇩🇯底👮。我们正🥎在见证人🌄工智能从一个只🇸🇯🆖会鹦鹉学舌、凭🏟借概率疯狂吐🇿🇲🐭字的机器🏥🖋,慢慢进化成一个🕳👰懂得停顿、懂得权👔衡、懂⬅得自我审视的成熟🌞📑对话者🈷🎆。
2026 年💥 4 月📄,一篇由斯坦🎥福、M🈁IT、密歇根大学🎹🌫等联合发布的研👩🏫究论文,第一🕊💴次系统🐓性地打开了 ⌨AI Agent🥏🚓 在代码🗞任务中的🙃🗨“消费黑箱”——⏬钱到底花在哪了、🥺花得值不值🥂、能不能🇨🇻提前预估,答案令🍆😪人震惊🧶💵。
发现四:人类觉🍺得难的,Ag🇲🇾ent 不一定觉🎴得贵——难👨👦👦🌵度感知🥶💍完全错位👩🔬 你可能会想:👩👧🚣♀️那至少我🍮可以根据任🇬🇭务的难易程🧹度来预估成🖍魔术泛站群本吧? 🏤论文找来🇨🇰🦠人类专家⚡,对 50🌕0 个任务的难度🇸🇳🇿🇦进行评分,然后和🕸 Agen📃🏳t 的实际🧡 To◻🍱ken 💑🙎消耗做对比—🇳🇷🇻🇳— 结果:两🍹🅰者之间只有弱相🐋🏭魔术泛站群关🇱🇨。