谷歌工具

滚动播报 2026-04-25 19:27:56

（来源：上观新闻）

研究团🧟‍♀️队将AI科学家与🦀非层级🏕化的简单代🏄👐理（在Pap🌠🐔erBench上🐒对应BasicA😌🍙gent🇻🇺，在MLE-Be🎪🔭nch Li👨‍🔬te上对应🧖‍♀️AIDE）进行比➿较，发🔭🤔现即使是去掉文📣件即通道机制的📉"残缺版🍶🇩🇯"AI🤐🔆科学家，在Pap🚱🇲🇲erB📑🇬🇾ench上仍比📝BasicAg🐰ent高出4.🇬🇼🐷74分，♏在MLE☹-Bench🇸🇻 Li🕚🥧te上的"高🧛‍♀️于中位😚数率"🇮🇨和任意奖🇹🇬🌐牌率也分别👙🐯高出22🏊‍♀️🦗.73和9.0♏🚨9个百分点🐣🃏。攻击者甚💝🔚至不需要📜直接攻击Ag🇮🇲📐ent💷本身，只需要在A🎻gent能接🎒触到的数据中埋🛡下种子，可能📚是一封恶⌨🏟意邮件🇬🇫🤨、一个含隐藏指令😱🇬🇺的网页、一份被🌝投毒的文档，A🍰🌟gent就可🚆🚯能主动从中学习到🔠🐡危险行为📁。

1M MRCR🖇🕒上V4优于🍪Gem🇪🇨🌶ini但明显不如📣Cla🔕🗝ude🕴。而WALL😉😺-B所采用的世界🐸统一模型（W😼🥾UM），则是🙅🙀一次彻底的重📑构🦄🎀。默认采用4层，🚎🐵研究团👩‍💻队还测试了2😈层和6层的版本✳。” —— 🛩某 4⚰👪A 广📱告公司创💙🏓意总监 🕍💐双面镜像：⚾速度翻倍，🇨🇮🐐但思考力才👨‍🎓🤱是护城⏮🖋河 GP🇸🇷T-Imag👨‍⚖️e-2 🥂在价格上🇧🇲甚至比前代🛠👄更低（输出价格从😨😪 $3🥈🍕2 降至 $🇯🇵谷歌工具30 每百万 t☠oken），且生🇩🇲成速度快了一倍（🐓🍧即时模式♾️下约 3👨‍👨‍👧‍👦🏍 秒）👇。