AI内存瓶颈催生新芯片方案,XCENA获1.35亿美元融资
商业动态

AI内存瓶颈催生新芯片方案,XCENA获1.35亿美元融资

Heooo 05月29日20时33分 5 阅读

「针对AI推理中内存访问效率低下的痛点,初创公司XCENA推出近内存计算芯片MX1,获1.35亿美元B轮融资,估值达5.7亿美元。」

在AI算力需求持续飙升的背景下,一家名为XCENA的芯片初创公司提出了一个截然不同的观点:AI真正的瓶颈并非计算能力,而是内存。这家成立仅四年的公司刚刚完成了1.35亿美元的B轮融资,估值达到5.7亿美元,累计融资额达到1.85亿美元。

XCENA的核心产品MX1芯片旨在解决AI推理过程中的一个结构性效率问题。当用户向ChatGPT等大语言模型发出请求时,数据需要在CPU、GPU和内存之间反复穿梭——信息从内存出发,经过CPU预处理,再传输到GPU进行大规模矩阵运算,最后返回。这个过程每生成一个token就要重复一次,导致大量时间和功耗浪费在数据搬移上。

“CPU和GPU在几十年来不断进化,但内存几乎没有改变。XCENA想要改变这一点。”XCENA CEO Jin Kim在接受TechCrunch采访时表示。他与CTO Dohun Kim、CPO Harry Juhyun Kim共同于2022年创立了这家公司,三人均为三星和SK海力士的资深人士——这两家内存巨头正是为英伟达GPU供应HBM(高带宽内存)的核心厂商。

AI内存瓶颈催生新芯片方案,XCENA获1.35亿美元融资

MX1芯片通过CXL(Compute Express Link)协议与CPU连接,本质上是在处理器和内存之间建立了一条专用快车道。它直接在内存模块内部处理数据,无需数据离开内存即可完成部分计算任务。Kim解释说:“GPU擅长矩阵乘法——这是AI模型训练背后的重型数学运算。但大量周边数据编排工作,包括预处理、KV缓存管理(存储对话上下文以避免模型重复处理)和数据缓存,仍然依赖CPU。我们的芯片直接在内存模块内部处理这些任务。”

这种“计算向数据靠近”而非“数据向计算靠近”的设计理念,带来了显著的效率提升。XCENA声称,原本需要10台服务器完成的工作,现在可能只需要1台。如果这一方案能够规模化落地,对AI基础设施成本的影响将是巨大的,这也解释了为何投资者对该项目表现出浓厚兴趣。

值得注意的是,市场时机对XCENA极为有利。自去年下半年以来,内存需求大幅攀升。本月,三星、SK海力士和美光这三家主导全球内存芯片市场的公司首次同时突破万亿美元市值。“内存价格和相关股票的近期上涨表明,AI基础设施正在向以内存为中心的架构转变。”Kim补充道。

AI内存瓶颈催生新芯片方案,XCENA获1.35亿美元融资

Kim强调,公司的核心信念是“推理不仅是计算问题,更是内存扩展问题”。目前,XCENA正在与多家全球内存供应商进行早期洽谈,理想客户群体是那些在AI推理上投入巨额资金的大型云服务商(hyperscalers)。虽然Kim拒绝透露具体合作方名称,但考虑到其创始团队在三星和SK海力士的深厚背景,市场对其商业化前景持乐观态度。

随着AI模型规模持续增长,内存瓶颈问题日益凸显。XCENA的解决方案能否真正改变AI基础设施的架构格局,还有待市场和时间的检验。但至少从资本市场的反应来看,投资者愿意为这个“内存先行”的赌注买单。

# AI芯片 # 内存计算 # XCENA # CXL # 融资

来源:Heooo AI工具导航