新浪财经

魔术泛站群

滚动播报 2026-04-26 21:40:51

(来源:上观新闻)

该测试模拟了金融🙄🇨🇱分析师、市场经💼理、软件工程师🏟🇬🇺等多种白领职业的🐧日常工作,要🤪求模型完成信息整🥒合、分析推🇺🇲理、决策建♏议与报告生☪成等综合性任务🥚。按当时估值计⏺🇮🇩算,Glob🐳alst🍖🔗ar市值从75🇹🇳🍱亿美元涨💫至115.7亿🙋美元,苹果两💈🔨年小赚5🍩🚜0%🇹🇩。AI设计的🥰小分子药物在I🇬🇶I期临床失败率高🛡🏊达80%🇲🇫,远超🎧📖传统药物的5🤛🔇7%🇲🇹🐽。在一项覆盖44🚣‍♀️7️⃣个职业的G0️⃣DPval测🐽🔄试中,🧪GPT⚡-5.🧜‍♀️5取得了84.9🏂🏃‍♀️%的得分,👨‍🔧📄不仅超过了83🦉.0%的真实👨‍🏫🛅职场人员水平🍂,也高于🍛Claude O🤬pus🧶🛥 4.7📷的80.3%🇪🇺🔴和Gemi🦞ni 3.1🥤💛 Pro的67🔱👕.3%🔹。认为只要告诉📐😶其他人这🔘👩‍👩‍👦个伟大🚡🏛魔术泛站群的想法,他们自然🇹🇯就能去把它实💨现↘。

Googl🍥⬅e De📦epMi🌼🥰nd 一🎑年多前就👨‍👨‍👧在内部搞这个🚤,让模🕴型自己决定下🛏🏐一步跑什🌿👋么实验,🦢跑完自🏄‍♀️己评估🛀🌊哪条路更有📄🐼前途,然🚶后沿着那条💗路走下去,这就🏗🇨🇺是模型在👩‍⚕️训练自己的下一🚩🧖‍♀️代👩‍👩‍👦。花店老板🦑 内卷赚钱少 🧸还可能🥊🇷🇺背黑锅🥩🇹🇨 “不接🚇转单没生意🤑,接了转单🇸🇰不赚钱,稍有不🦂🤵慎还赔本🇮🇷。Myt🇵🇭hos p🚞💢rev🕵iew 对我们这🇷🇴📪些工程师来说💢🧻魔术泛站群,是一🇧🇲个明显👝🇱🇺的跃迁,相🧖‍♂️比过去几代🇰🇷模型,它的提🌋🇵🇦升是那种“断层🍑📿式”的❄🦹‍♀️。许多经销😌🧻商和分销商🍑🗣开始排队(与🎦我们合作),🇹🇫我们从🎅此步入正🦸‍♂️轨,迅速发⛱展起来🚆。晚点专栏作者🥘丨五源资👨‍🦰🇧🇸本合伙🛌人 孟醒 202💯6 年🍕 3 月 2🏕🔸4 日早上,我⤵🦆坐在 🍍YC W🌚〰26 🌝batch De👨‍👨‍👦‍👦🚜mo Day👞🍡 的观众席里,听🆑🇱🇮到第五家👢公司上台路演🐦🥁的时候,决定不👨‍👩‍👦‍👦再做笔记了⛅🇰🇵。