地蜘蛛
(来源:上观新闻)
除了能力本身,💧Herme🧱s的使🇸🇪用门槛尚未🕡明显下降📋🌲。行业普遍在用“🇱🇨🌋糖水数据”💈🤡训练模型,然后奇⬜🦸♂️怪为什么一🎾🗜到真实环🧗♀️境就失🐏效⛹️♀️。方法论🤹♂️🇸🇻听起来很优雅🎡。研究提出了一个名💌为TRACE的🍄系统,🍩🚖全称是"🚀Turn🐌ing Re🥃💠curr🇵🇳💮ent 🔲☸Agent🦠🧞♀️ failur🏠es int🐰🌆o Capa🇹🇹💅bili🎒🇦🇶ty-targ🔰🏥ete🇨🇭📜d t🕳rain🐓🥭ing🇨🇭😭 En🐜vir🕍onments🌥",中👩🎤🇨🇴文可以理解为"把👨👩👦👦⚾反复出现的🇸🇸⚪失败转化🔂🤸♀️为针对性训练环🚇境"💭。
图1展示了一个具🙋🇻🇳体案例:在"侮💍辱性言🥘🇦🇬论检测"这一任务🔭上,AI科🙇♀️🌬学家在23小时内🌉自主完成了🇸🇰地蜘蛛74轮🌮实验,将模✡型的验证集AUC🙏🍅(一种衡量分类🇲🇺模型好坏的指💥🍟标,越接近1🚴♀️☯越好)从0.☹903提升到了0😜🚱.982,🥃期间经历了18次🥟🇾🇪"找到更好方案并👠保留"的关键🇯🇴节点,同时也🗒📣经历了🇷🇺🧞♀️大量"尝试无效果🧞♀️◾而丢弃🏜🇸🇯"的探索过程,🚱全程无需人工🎻🍹干预🧲😎。