scm
(来源:上观新闻)
在ToolSan☦dBox上🏓,系统识🇨🇵⚙别出了🏋️♀️两种关🥌🇬🇱键能力薄弱点🇪🇨🔟。凭借AI工具的🧰普及与算力成本🆎🔝的下降,过去🛀需要数十🧛♀️人乃至🎐♑上百人的🇦🇩团队才能完🐉⤴成的产品开发、💊🇦🇷scm市场验🇨🇰🇬🇹证与商业落地🇭🇲,如今仅靠小团队🔍便可推进🚻。听起来很😘合理,但问题🛫出在AI推🇹🇷🌛理的特殊性🥐scm上🇬🇧。“这是一个非🥐线性设计👽📕空间,因此计算🔘🍢量增长🇫🇴非常迅速,👱🥭scm”他说🇽🇰。从V2的ML⛩A开始,每一🏋代都在删KV 🚻♍cache、删激🙆♂️活参数、📝删注意🚃力计算量🐬🧖♀️。整个过程没🗑scm有"中🇵🇾间步骤"💏的概念➿,只有"🇧🇳整体行动"和"最🎁✋终结果"🍢的对应关✂系👩👧👦。
它的思路🤹♂️😕是直接扔掉🔟那个不靠🇪🇺🔰谱的打分🧐员,改用一种"横🍬🇧🇬向比较"的方👎scm式:对同一道👨👨👧👦题,让AI同🍴🇦🇹时生成一批答案🇰🇬👩👧👧(通常是8个),🆗然后以🥶这批答案的平均得🔛⚡分作为基准🚣,那些比平均水平🧂📆好的答案就得到👩⚖️🦌奖励,差的🛫就受到惩罚📉🧗♂️。参数量高达270📊亿的 G🌳emin🇳🇨🏓i 2.5 Pr👨🦰🔻o(谷👨👩👧👦歌旗下最先进的商♊业大模型之一👩⚕️📕)只有22%的准🇸🇹😰确率,而🚁随机猜测的准🇨🇩🦔确率是20%——🧨🦀也就是说,Gem🥬ini 2👖.5 P🏵ro 在这项任务🤣🇬🇧上的表现几乎👮♀️🇲🇨与瞎猜无异📢🔭。