新浪财经

泛目录最新技术

滚动播报 2026-04-26 00:04:09

(来源:上观新闻)

在DeepS💜🈸eek ✏V4发🧞‍♂️🇳🇮布前,我们与十👨‍👩‍👧🇵🇬余位AI行业人🐢士,围绕“D💷eepSe🥅🇪🇹ek改变了中国A🇨🇮I行业什么?🐛”展开对话💘🈴。不过,该技术仍💙👁面临两大挑战🇩🇴:一是压💄👟降问题(例如双层♈💊平行四边形翅柱冷🇨🇩板的压🔀降可达2🎠🧿259🇬🇬🍱0.7Pa),二🐗⚗是动态响应存🇮🇲🥊在延迟🍙🐛。“为什么不能🔈🎂让两者兼得?”🇳🇫抱着这份思考,肖💚龙组建🇹🇨🛢了一支由60、🇸🇾70后资🇮🇱深老鞋匠组成的匠⛅🎀人团队,🅿🥇潜心钻🎓🙍‍♂️研工艺改🇺🇬良🌄。

动手之🏕😲前先动脑🗼,开干之前⚔📩我先让 C🧜‍♀️🕗laude🧱🧩 Code 🇩🇴🍓帮我调研了一圈国🚅🇵🇼内的桌面级 🆓🏨2C 办📏🤽‍♀️公 Age🈺🏴󠁧󠁢󠁷󠁬󠁳󠁿nt 产品🎸🇻🇨。V4 Pr🕛o没有逐条复述材🇨🇿料,而是抓住🍴📓了“Agent的🧖‍♀️✴竞争不只🦉😹是模型参🇹🇬🇬🇱数,而是模型🦜如何稳定接入外🦸‍♂️部系统”这一主线🥧,将结🇸🇾构化输出理解为“😇让模型说出机器能👷直接读懂的话”🐡🍨,将MCP理🇰🇲🚀解为“让模型应用☔更容易接外部工具◀的标准接💍👨‍❤️‍💋‍👨口”🧱。

V4的做法是把注🇸🇨👚泛目录最新技术意力拆成两🏃‍♀️🙎‍♂️种,交替叠🛬用: 一种是🧣💸CSA5️⃣(压缩🕍稀疏注意力)👩‍👦‍👦,先把每若干t🇦🇨oken的K⏩V缓存合并成摘要🆔,再让每个que🇨🇺ry只在这些摘🛢🇧🇪要里挑选最相关🌾的top-🧚‍♀️🎞k条去🇸🇪算注意力——相🛥当于既压缩了“要⛺💃看的内容”,又💙🌙只挑“值😍得看的”去▶算; 另一种是H♎👮‍♀️CA(高压缩🍆👡注意力📖🚷),用📚🍹更激进的压缩率把💔⏱更长区🌜📊间的toke✅☸n合并为一条,🏴‍☠️⚜但保持稠🚴‍♀️💄密注意力🎑。