快乐彩正版app下载官网

快乐彩正版app下载官网

你的位置:快乐彩正版app下载官网 > 和大小 >

快乐彩app 北大团队校正DeepSeek着重力, 速率快四倍还不丢精度

点击次数:141 发布日期:2026-04-13

快乐彩app 北大团队校正DeepSeek着重力, 速率快四倍还不丢精度

就在大家皆急头白脸地恭候DeepSeek-V4的本事,冷不防一篇新论文引起了网友们的着重——

淡薄新稀少着重力机制HISA(分层索引稀少着重力),冲破64K凹凸文的索引瓶颈,比拟DeepSeek正在用的DSA(DeepSeekSparseAttention)提速2-4倍。

不仅作念到了大幅提速,而且险些不丢精度、即插即用无谓再行磨砺

论文平直在DeepSeek-V3.2和GLM-5上替换索引器,无需微调。

况兼在找要津信息、长文身手路等任务上,精度皆和原身手险些捏平。

两步排斥凹凸文索引瓶颈

这篇论文想处理的问题很明确:给大模子的稀少着重力机制换个更高效的“检索器”。

现存主流的DSA等token级稀少着重力,中枢即是通过只谋略要津token的着重力,裁减了中枢谋略资本。

但这个磋磨有个致命粉饰问题:要挑出关系字符,得靠一个“索引器”——它需要把每个待查字符,和前边通盘字符挨个打分,再选分数最高的。

文本长度L越长,这个打分的责任量是L的正常级增长。比如长度翻倍,责任量就会翻4倍。

到超长文本时,这个索引器的正常级资本,反而成了拖慢速率的元凶,以至反而比信得过的着重力谋略还耗时。

基于此,盘考团队运行想考一个问题:能否在不改革最终稀少着重力限制的前提下,裁减索引器的搜索资本?

于是,他们淡薄了HISA(分层索引稀少着重力),中枢想路也很肤浅:

既然挨个打分太费时辰,那就先按块筛掉大部分无关内容,再在剩下的小块里紧密选。

在功能逻辑上驱散对原有模块的等价替换,无需修改后续着重力谋略逻辑,颠倒于“换了个更高效的筛子,开云体育(中国)官方网站筛出来的东西险些没变”。

具体就两步,全程复用原模子的打分轨则,零学习资本:

块级粗过滤

这一步能免却绝大部单干作量。

块内精挑字符

只在第一步选出来的m个块里,用原索引器的轨则给单个字符打分,再挑出最终需要的k个关系字符。

还加了个小优化:文本的第一个块和终末一个块必选,保证开始的配景信息、扫尾的最新凹凸文不被误筛,也能处理文本拼接的范畴问题。

HISA的要津上风在于:复杂度骤降,还能“无缝替换”

HISA把原索引器每一层O(L²)的算力资本,降到了O(L²/B+L×m×B)(B是块大小、m是选的块数)

文本越长、块选得越精确,提速成果越赫然。

更紧迫的是它的工程友好性

输出和原索引器十足一致,下流的着重力谋略模块无谓改;

无谓再行磨砺模子、无谓搬动KV缓存结构,平直替换原索引器就行;

漫笔本时会自动“退化”成原身手,只须超长文本时才触发分层筛选,快乐彩全程自妥当。

实测提速超猛,精度险些没丢

论文在DeepSeek-V3.2、GLM-5两大主流大模子上作念了全面测试,限制很亮眼:

速率上,在64K长度的文本下,HISA比原DSA索引器最高提速3.75倍,通例修复也能提速2倍多。

凹凸文长度越长,HISA的提速成果越显贵,十足契合超长凹凸文(128K/1M)的施行欺骗需求。

精度上,HISA也险些十足保留原DSA的精度,且显贵优于纯块稀少身手。

论文进行了“大海捞针”测试,该测试琢磨在超长无关文本中,精确检索指定位置要津信息的身手。

限制HISA和DSA险些相通准,在通盘长度和插入深度下,检索精度均接近DSA的近乎满分。

长文身手路(LongBench基准)上,HISA的分数也和DSA基本捏平。

以至在部分场景,比如合成检索、少样本学习等对token筛选精度条目高的任务中,HISA作念到了小幅反超。

而在超参数测试中,不同块大小、选块数目下,HISA阐扬皆很安靖,分数均与DSA高度接近,无显贵性能各异

这也阐述HISA对超参数的礼聘不解锐,鲁棒性强,工程落地时无需紧密调参。

不外现时HISA还有小过错,作家也淡薄了后续翻新想路:

第一,现时块是固定大小的,若一个块里混了无关和关系内容,块的“全体标签”会不准。

曩昔不错搞自妥当块、重复块,或换更好的块特征谋略神色。

第二,现时仅仅推理时平直用,曩昔不错把块筛选和模子一说念磨砺,让筛选更精确。

第三,现时只测了索引器的速率,曩昔整合到好意思满的大模子管事框架里,测端到端的蒙眬量和延长。

团队配景

这篇论文出自北京大学的张牧涵团队。

张牧涵,北京大学东说念主工智能盘考院的Tanure-track助理讲解和博士生导师。

归国前曾在FacebookAI(现为MetaAI)担任盘考员,从事大领域图学习系统和问题的盘考。

其GoogleScholar总援用量跨越13000次,其中两篇一作著作援用量永诀达到3100+和2400+次,通顺多年入选Elsevier全球前2%顶尖科学家(生存影响力榜单)

YufeiXu(徐宇飞)和FanxuMeng(孟繁续)为论文的共合并作快乐彩app。

ag真人app官方网站入口