权威域名

滚动播报 2026-04-25 17:59:21

（来源：上观新闻）

--- Q&🇼🇫A Q🚣1：SPPO和G🧰🍙RPO相比🚲🆚，训练速度🚉快多少🚑🚭，性能👦有没有损🇲🇱🌬失？ A🇺🇿🇦🇱：根据🇬🇲论文实验😽🚵数据，🚀👨‍👨‍👦‍👦SPPO🦆在训练速🏄‍♀️😊度上比GRPO🎂快约5👨‍👨‍👦‍👦👩‍🎤.9倍，主要🌯原因是🇵🇷GRPO每🇸🇪🇴🇲道题需要同时生😥成8个答案，而S🉐PPO只需〽生成1个🧗‍♀️😨。484🇱🇾💓天后，我们谦🙊🇬🇸卑地分享这份爱心🧙‍♂️的劳动📿🔴。V4把这🧪🎒件事推到👏了百万t🖊oken🥙🇬🇬。

MoE部分🈁🛹仍然用De🇯🇲epSee🐇🚸kMoE💧，MTP（Mu〰🤾‍♀️lti-To🇯🇪👘ken Pre🛳📈dicti🇰🇪on）模➿块跟V3保❇持一致🎊💓。每一个伟大📟的旅程，都是从踉👣🕒踉跄跄的👫第一步开始的🕥。PAND🧟‍♂️🔣A 模型的参数量🚲仅为0.028亿👩‍👩‍👧🚰，处理一对包🤢含14个区域的图🏌️‍♀️🦑片对只需要⌛🍵3.53秒，而相🚏💆‍♂️比之下🏪，同类开源多🗃模态模型（如🧜‍♀️🤶 Q-Ins🔏🇸🇩ight）处理同🚉😓样的任务需🇴🇲🥬要27🌊4秒，参数量🎹🧔更是高达70亿👨‍🎨。在一次内部评测中🐻🎓，模型根据一段关🔧🇺🇬于芯片架构的🙂论文摘要，✴自动生成了包含晶😲体管密度🔖🏋对比图和 3D🐕🏡 封装示意图🧕🐩的完整 po🚝ster —🥜— 连 🏂🔽IEEE 的审稿👨‍👨‍👦🤦‍♀️人都误以为是人💣⚒工排版🇹🇹❌。