google review
(来源:上观新闻)
在现实世界中训🔳🌝练机器人进行🌌👨❤️💋👨极端测试(如自➕🗳动驾驶的碰🌄撞避免🦋🍸)成本高且危👯📭险,而游戏👩🦲◼环境允许AI在🌕绝对安全的沙盒👱♀️🇸🇭中通过千万🧒次虚拟撞击来习得🐄🏴☠️物理边界👔。
光看懂还不够,🐨🚄它还要结合过🚿💮去的经验记忆、🗾🧒当前的任务、🥶环境观测和🇭🇲历史动作,持续维🇲🇸护一个内在持🍪久状态,知道下一🔩步该拆成什🧲👊么子任🥝🇼🇫务、该🧖♂️生成什么输入、该🌤怎么把有⬅🧓限的具身👃能力高效使💗用🎚🤡。
在预测阶段,可用👩👧👧于生成大规模🕦💏、分布可控🐖的交互🇸🇴数据;在后训练🐇和强化学习阶段,🇦🇪可用于💍评估模型🥝🇲🇲行为是否稳😎定、合🥎😊理、可执行😼🕶。