新浪财经

魔术泛站群

滚动播报 2026-04-25 20:38:40

(来源:上观新闻)

这个视角的转变💸😿非常重要,因为🔫👩‍💼它意味着:当👨‍🦱你不再试图🐡给每个步骤🤾‍♂️单独打👡🕓分,"打分🏗🇸🇩员失灵⚜🏉"的问题就自🚌🇪🇷然消失🦸‍♀️🏭了✅🧯。”在他看来,国内⚜外创业环境的♏😍差异、AI技术的👩‍✈️🦃爆发式进步,🇻🇬😖共同推动他选择🥕以OPC模式开启🕧新的征程💢。

研究团队测💍试了用15亿参数🔐📗模型作为价⛩🎑值模型来辅助训练🇳🇵70亿参数主模型🔇🌐,两者相差约🇦🇫4.7倍🍦。C2今天能用双足♏🇯🇪双手打羽毛👨‍🏫🍜球、实现精准☮🚷回球,未来🏄🥫也能用同样的身体💪协调能力和强🇨🇵🤦‍♀️化学习框架,向更🕡📞多现实场景“🖖🇸🇳外溢”:迁移🛃到整理桌面、搬🤷‍♀️运物品、端👀茶递水等更多🏚生活互动场景🇷🇼🍜。知识类和最前🌅📿沿的推👨‍🦳理任务仍有🦂3-6个月🇸🇾的gap🔻。

其实最🇳🇵近大家😤🇻🇳在聊 Har👩🛥ness Eng🥃ineer🈷ing 的时候🤦‍♂️,肯定会聊到🌿🍜 Multi🇧🇸🇧🇴-Agent😣🇳🇿,为什么 Mu💺lti-Age🔥👮nt 这🥄么重要☂? 这个概念🥰两年前就有了,🔬🚒那会儿我不太🎿🏖看好🐓。到那时,科🚞技就不再🇾🇪只是让我们活得❇更快的工具😺。2025年3月,😯💒xAI收购了X🍅🍰。GRPO的成功🇳🇮,本质🇻🇺🔌上是这种框架切换🇷🇴🛑的成功,而非多采🥍样的必然功🎂劳📋🇰🇿。