龙少泛站
(来源:上观新闻)
V4-🇱🇸Flash🌵-Max只激🗺活13B参数,🇰🇭推理任务🇯🇪上能打💍👱平GPT-5😕🇲🇹.2和Ge↘📩mini-🚣🇭🇹3.0-P💔🚶ro,代码和数学😈🧙♂️甚至超过K🌖2.6-👟Thinki🏊🦓ng🕧🕔。我们认为这♒✈是由于 LLM☀ 的预训练和🇨🇺🔛后训练中都存🧜♂️在大量软件代码😯造成的🇿🇼🦓。SimpleQA🔡-Verif☪🛬ied上V4-🐶Pro-Max🐂拿到5☕💝7.9,K2.😤🇧🇿6是36🕥.9,GLM-5🇸🇳🏢.1是38.1⭐🇨🇺。
同样都是伪人,👨⚕️如今集齐😀108📷✳个AI艺人,👡可比小时候集齐🌮🥠108张水💈龙少泛站浒卡轻松🥎多了👪🏚。HLE上V🎟4-Pr🆑🌇o-Max 37🇲🇴.7,Gem🏮🤢ini-3.1-🇦🇨📢Pro 📭44.4🈹,Cla👺🔲ude-👻Opus🇦🇨✡-4.6-🇭🇰Max🍅📥 40.0🏑👩👦👦。其中最难以🐻被模仿的两🇵🇰🦐点是:首😣先,在近2000👨🃏所院校及光伏⏳🧞♀️电站等👨👨👧👦🔯场景积累的真🙀实、海量🌰操作数据所形🍃成的“滚雪👳♀️💘球”效应;其次🗞🇸🇴,核心零部件(💓如峰值👶扭矩600Nm🦄的一体化关节🐣🏟)的低成本🇷🇪🏰量产能👜*️⃣力👩🏫。