技术进展

SubQ发布首款亚二次复杂度大模型

Heooo 05月06日21时02分 1 阅读

「AI公司Subquadratic推出SubQ模型,采用线性复杂度架构,上下文窗口达1200万token,性能与成本显著优化。」

Transformer架构在过去十年定义了AI发展的方向,从ChatGPT到各类前沿大语言模型,其核心机制——自注意力——为语言理解和推理提供了强大支撑。然而,这一架构也带来了一个根本性限制:计算量与上下文长度呈二次方关系。随着输入长度增加,模型需要将每个token与其他所有token进行比较,导致计算量急剧膨胀。这种特性不仅推高了系统成本,还限制了模型在长文本场景下的实际表现。当上下文过长时,模型在识别关键信息方面的一致性下降,使得长输入往往无法带来预期的效果提升。


为了应对这一瓶颈,行业普遍采用变通方案。检索增强生成(RAG)系统通过搜索引擎筛选少量相关结果再输入模型,而非直接处理完整语料。检索管线、文本分块策略、提示工程等技巧成为主流实践。但这些方法并未改变底层扩展行为的本质。构建需要处理数百万token的系统仍然脆弱、昂贵且复杂。开发者与投资者将大量时间和资金投入这些权宜之计,而非解决核心问题。


如今,一家名为Subquadratic的AI公司推出了突破性解决方案。该公司发布的首款模型SubQ 1M-Preview,是首个完全基于亚二次复杂度架构的大语言模型。在这一架构中,计算量随上下文长度线性增长,而非二次方增长。这意味着,模型可以支持显著更大的上下文窗口,同时保持高精度。SubQ在“大海捞针”测试和精确复制测试中均达到行业领先水平,推理速度更快,成本大幅降低。传统上,实现亚二次复杂度往往要以牺牲准确性为代价,而降低成本通常意味着性能下降。SubQ则同时优化了这些方面,实现了数量级的提升,使得百万级token的上下文窗口成为实用现实。


Subquadratic公司CEO Justin Dangel表示,SubQ的研究成果已支持1200万token的上下文。与前沿模型相比,SubQ的注意力计算量减少了近1000倍。这一成果源于对模型架构的根本性重新设计,而非增量改进。


即日起,SubQ通过多种方式提供早期访问。首先是API,面向开发者与企业团队,提供完整上下文处理能力。其次是SubQ Code,一款基于SubQ构建的编程助手,通过命令行界面运行。SubQ Code能将整个代码库加载到单一上下文窗口中,使开发者能够一次性完成跨整个仓库的规划、执行与审查,无需多智能体系统的协调开销。第三是SubQ Search,一款长上下文搜索工具,能以聊天机器人的速度提供深度研究能力。所有产品即日起开放私有测试版申请。


SubQ的推出标志着大语言模型领域的重要进展。线性复杂度架构的实用化,有望重塑从代码开发、文档分析到科学研究等多个领域的应用模式。当模型能够高效处理海量上下文,许多现有工作流将迎来根本性变革。开发者无需再为上下文长度妥协,企业可以构建更复杂的AI应用,而研究机构则能探索此前因计算限制而无法触及的问题。Subquadratic公司正通过这一系列产品,将亚二次复杂度的理论优势转化为实际可用工具,为AI行业开辟新的可能性。

# SubQ # 亚二次复杂度 # 大语言模型 # 上下文窗口 # 线性计算

来源:Heooo AI工具导航

📰

资讯不存在

该资讯可能已被删除或不存在

返回资讯列表