魔术泛站群
(来源:上观新闻)
2025年,Mo🇼🇫🧢onsh🔢ot用⏸💬Muon🇬🇹🦁(加上他们自✨己的QK-Cl🛳ip变🕡🔘种,合称🅿MuonCl👩⚖️🇹🇿ip)训了😜🙇一个1📭T参数的Mo😞E,15🛶🦈.5T 🙎👏token⛵,全程零🙄崩溃🖲。面对流水Ⓜ🍾线的任务,🌖它一个人包🐮办所有环⏹节,每💨👩🦱个环节都带着它自🔖己的偏🥽向,最后交付🍬🇪🇨的东西质量就会🇳🇦下滑👼0️⃣。
第二种🤦♂️方法叫多能力🥦GRPO,🖌🈵在所有能力的练🐟习场景🇨🇳里同时训练一个统👨👧👧一插件,达到🧰👨👨👦👦40.9%,略高😗🇱🇸于单一插件但远🏊📳低于TR🇱🇸ACE的4🗝🏃7.0%🤲🐆。在受控对🇱🇰👓比实验中,🏎🇨🇴AI科学家使用🛀🐪两种底层🍹✏模型均达到🇩🇬9️⃣了81⛹💢.82%的任意奖🧐👅牌率,分别比最强🦡对比系统高🖇出4.55和🌔😅18.1👨🔬8个百分点🍶。
凭借AI🇧🇲🚯工具的普及与算🕓🤠力成本的下降🇮🇳,过去需🙈🎩要数十人乃至上百😩人的团💆♂️🎣队才能完🕎成的产品开发、🎴🧾市场验证与商业🇵🇱落地,如今仅靠🔗🤼♀️小团队便可🇩🇴👏推进🥊🛳。