google review

滚动播报 2026-04-27 23:32:30

（来源：上观新闻）

在现实世界中训🔳🌝练机器人进行🌌👨‍❤️‍💋‍👨极端测试（如自➕🗳动驾驶的碰🌄撞避免🦋🍸）成本高且危👯📭险，而游戏👩‍🦲◼环境允许AI在🌕绝对安全的沙盒👱‍♀️🇸🇭中通过千万🧒次虚拟撞击来习得🐄🏴‍☠️物理边界👔。

光看懂还不够，🐨🚄它还要结合过🚿💮去的经验记忆、🗾🧒当前的任务、🥶环境观测和🇭🇲历史动作，持续维🇲🇸护一个内在持🍪久状态，知道下一🔩步该拆成什🧲👊么子任🥝🇼🇫务、该🧖‍♂️生成什么输入、该🌤怎么把有⬅🧓限的具身👃能力高效使💗用🎚🤡。

在预测阶段，可用👩‍👧‍👧于生成大规模🕦💏、分布可控🐖的交互🇸🇴数据；在后训练🐇和强化学习阶段，🇦🇪可用于💍评估模型🥝🇲🇲行为是否稳😎定、合🥎😊理、可执行😼🕶。