scm

滚动播报 2026-04-25 17:14:38

（来源：上观新闻）

在ToolSan☦dBox上🏓，系统识🇨🇵⚙别出了🏋️‍♀️两种关🥌🇬🇱键能力薄弱点🇪🇨🔟。凭借AI工具的🧰普及与算力成本🆎🔝的下降，过去🛀需要数十🧛‍♀️人乃至🎐♑上百人的🇦🇩团队才能完🐉⤴成的产品开发、💊🇦🇷scm市场验🇨🇰🇬🇹证与商业落地🇭🇲，如今仅靠小团队🔍便可推进🚻。听起来很😘合理，但问题🛫出在AI推🇹🇷🌛理的特殊性🥐scm上🇬🇧。“这是一个非🥐线性设计👽📕空间，因此计算🔘🍢量增长🇫🇴非常迅速，👱🥭scm”他说🇽🇰。从V2的ML⛩A开始，每一🏋代都在删KV 🚻♍cache、删激🙆‍♂️活参数、📝删注意🚃力计算量🐬🧖‍♀️。整个过程没🗑scm有"中🇵🇾间步骤"💏的概念➿，只有"🇧🇳整体行动"和"最🎁✋终结果"🍢的对应关✂系👩‍👧‍👦。

它的思路🤹‍♂️😕是直接扔掉🔟那个不靠🇪🇺🔰谱的打分🧐员，改用一种"横🍬🇧🇬向比较"的方👎scm式：对同一道👨‍👨‍👧‍👦题，让AI同🍴🇦🇹时生成一批答案🇰🇬👩‍👧‍👧（通常是8个），🆗然后以🥶这批答案的平均得🔛⚡分作为基准🚣，那些比平均水平🧂📆好的答案就得到👩‍⚖️🦌奖励，差的🛫就受到惩罚📉🧗‍♂️。参数量高达270📊亿的 G🌳emin🇳🇨🏓i 2.5 Pr👨‍🦰🔻o（谷👨‍👩‍👧‍👦歌旗下最先进的商♊业大模型之一👩‍⚕️📕）只有22%的准🇸🇹😰确率，而🚁随机猜测的准🇨🇩🦔确率是20%——🧨🦀也就是说，Gem🥬ini 2👖.5 P🏵ro 在这项任务🤣🇬🇧上的表现几乎👮‍♀️🇲🇨与瞎猜无异📢🔭。