新浪财经

魔术泛站群

滚动播报 2026-04-25 18:37:06

(来源:上观新闻)

PANDA😙✋ 展现出了最🔮小的性能下降幅🚩魔术泛站群度,而部分商🌁业大模型在 Ha🥝rd 级别的⛓🍙严重程🇨🇼度分类任🇹🇯务上甚至下👅🤯滑到了低于随机🇰🇲猜测水平的🇮🇨🏑表现——这说明在🇸🇿🎞面对复杂混合💢😽失真场景时,这🧗‍♂️些模型完全"迷📽🐊失方向",只能靠🚾"惯性"🐬🇩🇴输出一些听🇬🇦起来像样但实际🎟☀上随机的答案🚥。

我们团队每人☀🇭🇲养了一只虾🚢。有个蛮有意思的小🐎👔细节,在形式♋🔒化数学评🎞👩‍👦‍👦测中,DeepS🍼eek也皮了一下🚈友商: 我Ⓜ们在K2.6和😬🇱🇷GLM-5.🚵‍♀️1的部分🤱条目留空了,因为♾️它们的AP👩‍🦳I太忙,没法〽及时返🌙回我们查询的结果👩‍🔧🚥。这些特性是 D🗂🍐C 发🎃🛀现的,并🇨🇵📂未包含在任何输😑📦入指令🌦🧛‍♀️中(参见第 🇳🇬3 段)⚠。