魔术泛站群

滚动播报 2026-04-25 18:26:00

（来源：上观新闻）

它带来➖🇨🇦了两个直接后果：🐝对于答对🕗🍢的推理链，打分👱‍♀️员在接近结🇳🇴尾时才给出高🈁分，导致🕳AI的⛅魔术泛站群整个推理过程几乎🎣收不到任何有效的🇬🇲激励信号；对👚🇨🇮于答错的推😳👮理链，打分员🇯🇪🐏在中间过🐊程中也😙👩‍🦱没有给出足💊够的惩罚，无💐🌝法让AI知道🗨哪里出了问题⚠。

在这种6️⃣🔶情况下，系统不💆‍♂️仅需要识别每➿个区域各自的🚴🍤失真，还要在两张🚙图片的对🧐应区域🤖之间进行⚔精准比较，难度大🇳🇫🅾幅提升🏤。LM Arena😬🥁 最新榜单上，⬇GPT-I📊mage-2🇰🇾📀 以 🥣1512💕🦸‍♂️ 分登顶，领先🇾🇪💛第二名🐹🌱 242 分🌈，评测机构💆‍♂️直言“这🥂是一次代差🇲🇱级别的碾♍压”😞🤦‍♂️。