新创企获900万美元融资构建高可靠AI系统

大型语言模型（LLM）的幻觉问题一直是AI应用落地的关键瓶颈。尽管最先进的模型也在不断进化，但事实性错误仍难以根除。近日，一家名为Probably的初创公司宣布获得900万美元种子轮融资，由知名风投Andreessen Horowitz领投，试图通过一种更严谨的工程方法来解决这一顽疾。

Probably的创始人Peter Elias表示，公司的核心目标是防止幻觉和简单事实错误到达用户端，最终实现确定性系统中常见的99.99%准确率。这一目标在AI领域极具挑战性，因为LLM的统计本质使其天然存在不确定性。Elias指出，要达到这种精度，必须重新思考AI工程中的许多基本假设。

Probably创始人Peter Elias

Probably的首款产品是一个数据科学工具，能够从复杂数据集中快速生成答案。每个结果都附带引用和审计追踪，这已成为AI工具的一种常见实践。但真正让该产品与众不同的是其背后的“数据科学机甲套装”（data science mech suit）——一个精心设计的约束系统。LLM的初步回答会经过一个确定性验证器系统的检查，任何与数据集不匹配的结果都会被驳回。更重要的是，LLM本身已经针对该验证器进行了训练，整个系统被优化以提供快速且准确的答案。

“我们从中学到的是，约束工程做得越好，模型就可以越弱，”Elias解释道。“如果你能充分细化上下文，模型就不需要花费太多精力去做正确的事。这本质上是一个减少歧义的练习。”这种思路使得Probably的数据科学工具能够运行在显著更小的AI模型上。Elias透露，当前版本运行的模型“比前沿模型弱四个等级”，这意味着它可以部署在本地硬件上（例如台式电脑，而非数据中心），从而大幅降低与AI使用相关的Token成本。

在Token成本不断上升、许多客户重新评估AI预算的当下，这一理念尤为受欢迎。Elias认为，同样的引擎可以扩展到会计、医疗等“任何对精度敏感的用例”。他补充道：“我认为大型AI实验室甚至没有尝试这样做，这很有趣。他们没有动力去做，因为他们从用户反复修正模型的过程中获利。”Probably的融资与产品路线，为AI行业提供了一条不同于“更大模型”的可靠路径。