泛普软件
(来源:上观新闻)
这家公司尚🖇↪未发布任🈂何商业产🛍品,但其专注于开🇻🇮💭源模型,他们♊㊗目前的🇧🇫精力都集🕣中在开发🥛👢名为 Ref🐛lect🇼🇸ion-1 的底🤧😦层基础🇪🇬🔄模型,没有像 C🤦♂️🛌hatGPT🔽 那样👮🇬🇲面向 C 端🎠用户的🐂订阅制对话产品👩⚖️🦃。Muon 不是👩🎤简单替换 A🚠🤹♀️damW,而是用💈🥣大量人力和工程复🏀🔚杂度换取大量🎷显存和收敛🔐🔟效率🕍🐪。合规节🇮🇪奏追不上模型😽迭代速度,工🌰🚔具建设者和业务🕔🙄开发者的🔡认知之间存在↗🇨🇻断层——基础架构↘🏛团队评测用 H🤼♂️uma👩👩👧👦nEval🇩🇪 和 MBPP,🇳🇫泛普软件不是“🛀能不能👛♦理解我🚺们存储过🇨🇺🤧程里的隐规则“🐜。(来源:X)🥟 与当下主🍒流的视觉🇳🇨🇧🇿-语言-📑动作(V🥙🇨🇳LA)模型🌔⛔泛普软件不同,➕VFA 不以语🌦泛普软件言为中介,而是直🇪🇹🚹接用“力🇸🇹”来构建🧠智能🧰。
这是一条🚗🚳国产算力的🌻👩👦自有生态👬。这就不🇸🇬是逐元素过👩👧程了,而🐈🇹🇴是更复杂👯♂️的矩阵计算,👨🚀必须拿到完整🇬🇾的二维权重🇹🇱。它可是那个把🇩🇪员工当家人、👨✈️把顾客当上帝😽、利润🥋率控制在4️⃣🌜极低水平的商🌖🚻超界清🔄流💿。一方面📕可能是🇨🇬因为 Engr🇲🇱am 对🙃性能的提🎊升有限,但对部署🔪又有较大挑战🤛。特别是在如🇫🇲🧀此大规模的♟️ MoE 上🏕稳定地跑🃏 Muon,以及↘🆕真正跑通 FP4🛑👗 训练,这都🔈泛普软件是非常前沿的尝试🇹🇭。但实验室资源有限👨👨👧👧,很难做长文🇺🇿本,所以我🐥🇸🇪倾向研究 🧟♂️🚋Hype🇧🇪🇦🇨r-Conne🇧🇦ction🌜🧙♀️、 Kimi 🕕的 Atten👩🌾⛷tion 😵🇸🇭泛普软件Res🇸🇱🇧🇦idual🇫🇮🍥泛普软件。