蜘蛛
(来源:上观新闻)
AI每生成一个🍽词,系统就有一个🇲🇳"打分员"(🚢技术上🍌💷称为Critic❓,批评家)在旁边🐳估算:按照现在🔎🇬🇩这个走势,最终能🍣答对的概🥄率是多👨👩👧少?然后根据这🈳📊个概率,奖励或惩⭕🐥罚刚才的每一步操🚑作🇭🇹。换言之,👍🤸♂️每完成🎈🤷♂️一次任🚈🎹务,H🎲ermes🕙👩👩👦会从执行过程总🇺🇳🇧🇲结并保存一个个💄Skill,👩🎤▶下次遇到相似的⛰⛅问题时,它可🎂以直接加载这些技🇨🇱🕊能,并🔔⛰在任务中持续完🏄🤠善迭代🇯🇴。打分员必须把这🏩🐞个唯一的结果,沿🇺🇿着几千🦹♀️🌬步的推🏩理链条,一路💇♂️往回分配功🇳🇦🎗劳或责任😑👩👩👦👦。
2020 年🐼🥨,研究人员💯➰对 GP♌🏭T-2 模型进行🕓👐了微调,使其能够😡🧟♂️设计逻辑💔电路片段;🇧🇱202⛸🇲🇽3 年,研究人员🇬🇳使用GPT💇-4 帮🎵助设计了一个🕵️♀️具有新🧨🤟型指令集🗣的 8 ❄位处理器;到🇰🇮🇹🇱 2024 年,🥨各种 L🇺🇦🧚♂️LM 可🏃♀️🇪🇷以设计和测试具有🇲🇫🇲🇲基本功能的芯片,📟例如掷骰子(尽🤞管这些芯片通常存❤🧂在缺陷)🦂。一些特斯拉🇧🇿👁投资者表👟🛂示反对👨👦,因为xAI和👨🎤😐特斯拉🦹♂️🧣都在开🚓发AI🧗♂️🔶产品🦴😸。比如,一🧿道题预估答对🥨💓率为0.3(很🚵♀️☁难),🍈但AI答🤔🕝对了,那🇱🇷么优势信号就是💪🍲1-0.3👥=0.7,说明这🛢次表现远超预期🥥🙈,需要🇸🇸大力强化😂这个推理策略🥌🥏。