龙少泛站

滚动播报 2026-04-25 21:08:54

（来源：上观新闻）

V4-🇱🇸Flash🌵-Max只激🗺活13B参数，🇰🇭推理任务🇯🇪上能打💍👱平GPT-5😕🇲🇹.2和Ge↘📩mini-🚣🇭🇹3.0-P💔🚶ro，代码和数学😈🧙‍♂️甚至超过K🌖2.6-👟Thinki🏊🦓ng🕧🕔。我们认为这♒✈是由于 LLM☀ 的预训练和🇨🇺🔛后训练中都存🧜‍♂️在大量软件代码😯造成的🇿🇼🦓。SimpleQA🔡-Verif☪🛬ied上V4-🐶Pro-Max🐂拿到5☕💝7.9，K2.😤🇧🇿6是36🕥.9，GLM-5🇸🇳🏢.1是38.1⭐🇨🇺。

同样都是伪人，👨‍⚕️如今集齐😀108📷✳个AI艺人，👡可比小时候集齐🌮🥠108张水💈龙少泛站浒卡轻松🥎多了👪🏚。HLE上V🎟4-Pr🆑🌇o-Max 37🇲🇴.7，Gem🏮🤢ini-3.1-🇦🇨📢Pro 📭44.4🈹，Cla👺🔲ude-👻Opus🇦🇨✡-4.6-🇭🇰Max🍅📥 40.0🏑👩‍👦‍👦。其中最难以🐻被模仿的两🇵🇰🦐点是：首😣先，在近2000👨🃏所院校及光伏⏳🧞‍♀️电站等👨‍👨‍👧‍👦🔯场景积累的真🙀实、海量🌰操作数据所形🍃成的“滚雪👳‍♀️💘球”效应；其次🗞🇸🇴，核心零部件（💓如峰值👶扭矩600Nm🦄的一体化关节🐣🏟）的低成本🇷🇪🏰量产能👜*️⃣力👩‍🏫。