蜘蛛
(来源:上观新闻)
它们可🅾能只用一☺🉐次,可🔟⬆能只有十🇭🇺🇸🇱几个人需要,可能👗🇦🇨根本没有哪个🍰🇨🇼App能覆⚽🧘♂️盖😷。具体来🍶说,他们✨让VLM🔂读取每一个数据🇻🇦🀄样本,提⛵🌬取出模💇♂️型对这个样🇻🇳本的内部理解表示👨👨👧👦🌭(可以理解为模🏀💭型对这段👄🔓内容的"印📸象"),然后用一👭种叫做最🚩大均值差🇰🇳🙌异(MM🍲🇵🇫D)的工具🌻来量化不同🥎数据集之间的分🌆布距离——距离🕢越大,💔说明两组数据的"📉世界观"🇦🇿🌍差异越大🐾。最终筛选出的1🧤20万样本中,📛🤕LAION-4🇲🇨🔕00M贡🐵献了最大的绝对🇨🇦数量(占比32.🇹🇰🏉0%)🍚蜘蛛,但这不👨🦲是因为LAIO⛄🛠N整体上与机器人🎛🇲🇽数据接近,🇳🇵而是因为这个数🧁据集总体规模极🎥🙉大,哪怕只有很🦈小比例的样本够格☢,绝对数量🖤🥋依然可观🇦🇷。
Anthrop🔢📨ic 没有公🦃开释出这个模🚯☃型,只允许部🎁分安全研究人🇬🇭员提前访🇹🇩🚖问,以便修补👠👛 Mytho🇦🇿💥s 发💜🎠现的漏洞🕧。它打开项目,读了🔔🍀 20 👨🦰🌏个文件,🇸🇲🌬改了改,🚘跑了一下🇻🇬👩👧测试,没过,🇳🇺😛又改,又跑🈹,还是🧸没过……来回折腾🤼♀️了十几轮,终于🧷🚴♀️——还是没修好🇳🇷。