SubQ发布首款亚二次复杂度大模型

Transformer架构在过去十年定义了AI发展的方向，从ChatGPT到各类前沿大语言模型，其核心机制——自注意力——为语言理解和推理提供了强大支撑。然而，这一架构也带来了一个根本性限制：计算量与上下文长度呈二次方关系。随着输入长度增加，模型需要将每个token与其他所有token进行比较，导致计算量急剧膨胀。这种特性不仅推高了系统成本，还限制了模型在长文本场景下的实际表现。当上下文过长时，模型在识别关键信息方面的一致性下降，使得长输入往往无法带来预期的效果提升。

为了应对这一瓶颈，行业普遍采用变通方案。检索增强生成（RAG）系统通过搜索引擎筛选少量相关结果再输入模型，而非直接处理完整语料。检索管线、文本分块策略、提示工程等技巧成为主流实践。但这些方法并未改变底层扩展行为的本质。构建需要处理数百万token的系统仍然脆弱、昂贵且复杂。开发者与投资者将大量时间和资金投入这些权宜之计，而非解决核心问题。

如今，一家名为Subquadratic的AI公司推出了突破性解决方案。该公司发布的首款模型SubQ 1M-Preview，是首个完全基于亚二次复杂度架构的大语言模型。在这一架构中，计算量随上下文长度线性增长，而非二次方增长。这意味着，模型可以支持显著更大的上下文窗口，同时保持高精度。SubQ在“大海捞针”测试和精确复制测试中均达到行业领先水平，推理速度更快，成本大幅降低。传统上，实现亚二次复杂度往往要以牺牲准确性为代价，而降低成本通常意味着性能下降。SubQ则同时优化了这些方面，实现了数量级的提升，使得百万级token的上下文窗口成为实用现实。

Subquadratic公司CEO Justin Dangel表示，SubQ的研究成果已支持1200万token的上下文。与前沿模型相比，SubQ的注意力计算量减少了近1000倍。这一成果源于对模型架构的根本性重新设计，而非增量改进。

即日起，SubQ通过多种方式提供早期访问。首先是API，面向开发者与企业团队，提供完整上下文处理能力。其次是SubQ Code，一款基于SubQ构建的编程助手，通过命令行界面运行。SubQ Code能将整个代码库加载到单一上下文窗口中，使开发者能够一次性完成跨整个仓库的规划、执行与审查，无需多智能体系统的协调开销。第三是SubQ Search，一款长上下文搜索工具，能以聊天机器人的速度提供深度研究能力。所有产品即日起开放私有测试版申请。

SubQ的推出标志着大语言模型领域的重要进展。线性复杂度架构的实用化，有望重塑从代码开发、文档分析到科学研究等多个领域的应用模式。当模型能够高效处理海量上下文，许多现有工作流将迎来根本性变革。开发者无需再为上下文长度妥协，企业可以构建更复杂的AI应用，而研究机构则能探索此前因计算限制而无法触及的问题。Subquadratic公司正通过这一系列产品，将亚二次复杂度的理论优势转化为实际可用工具，为AI行业开辟新的可能性。

SubQ发布首款亚二次复杂度大模型

相关资讯

空管路径规划算法兼顾可解释性与效率

学习何时停止：推理模型早期退出机制的成本感知研究

动态表示编辑框架引导LLM走向真理

Auto-FL-Research：联邦学习算法的智能搜索框架

有限道德：AI道德计算的新框架