领会推广网
(来源:上观新闻)
”加兰说😖🎴。SimpleQA🇰🇬🇰🇲-Ver👨👩👦👦ified上🚴♀️🇨🇽V4-🔃🕑Pro-🥪Max拿到57♻👢.9,K2.🌴6是36.9🔯🐮,GLM-5🍰.1是38.1🇬🇲。参数量🇲🇵🕳高达27🐹0亿的 Ge👈👋min📚i 2.5😗👽 Pro(谷歌旗🦙♑下最先👨💼进的商业大模型📚之一)只有22%🕊🖐的准确率👩🦰🎀,而随机猜🌕🇵🇭测的准确率是20🦖📼领会推广网%——也➡就是说,Ge👩🎓mini 🎂🇰🇾2.5 Pro☢ 在这项🛅任务上的表现🇨🇿几乎与瞎猜无异🤰🙅。
正是为了解🧾🇿🇼决这个问⌛题,华💟🥺为技术(加拿🌉大)的研究🦅⏸团队提出了一🕤🇬🇱个全新的思路:🇵🇲🚺与其让👩❤️💋👩🇵🇦AI笼统评🕉价整张图,🏁🇵🇾不如教它🚑像真正的专家🚘🐏一样,先把图像拆🥞解成一个🔴个有意义🌃🇱🇰的区域,再📓针对每🎗个区域进🈚🛒行细致的质量分🥽析,最🔛🦖后通过一张结构化🍬的"关系♦🍾图谱"把所♊有信息整合起来🦔❤。