新创企获900万美元融资构建高可靠AI系统
「AI初创公司Probably获900万美元种子轮融资,通过“数据科学机甲套装”技术,将LLM准确率提升至99.99%,并显著降低模型规模和运行成本。」
大型语言模型(LLM)的幻觉问题一直是AI应用落地的关键瓶颈。尽管最先进的模型也在不断进化,但事实性错误仍难以根除。近日,一家名为Probably的初创公司宣布获得900万美元种子轮融资,由知名风投Andreessen Horowitz领投,试图通过一种更严谨的工程方法来解决这一顽疾。
Probably的创始人Peter Elias表示,公司的核心目标是防止幻觉和简单事实错误到达用户端,最终实现确定性系统中常见的99.99%准确率。这一目标在AI领域极具挑战性,因为LLM的统计本质使其天然存在不确定性。Elias指出,要达到这种精度,必须重新思考AI工程中的许多基本假设。
Probably的首款产品是一个数据科学工具,能够从复杂数据集中快速生成答案。每个结果都附带引用和审计追踪,这已成为AI工具的一种常见实践。但真正让该产品与众不同的是其背后的“数据科学机甲套装”(data science mech suit)——一个精心设计的约束系统。LLM的初步回答会经过一个确定性验证器系统的检查,任何与数据集不匹配的结果都会被驳回。更重要的是,LLM本身已经针对该验证器进行了训练,整个系统被优化以提供快速且准确的答案。
“我们从中学到的是,约束工程做得越好,模型就可以越弱,”Elias解释道。“如果你能充分细化上下文,模型就不需要花费太多精力去做正确的事。这本质上是一个减少歧义的练习。”这种思路使得Probably的数据科学工具能够运行在显著更小的AI模型上。Elias透露,当前版本运行的模型“比前沿模型弱四个等级”,这意味着它可以部署在本地硬件上(例如台式电脑,而非数据中心),从而大幅降低与AI使用相关的Token成本。
在Token成本不断上升、许多客户重新评估AI预算的当下,这一理念尤为受欢迎。Elias认为,同样的引擎可以扩展到会计、医疗等“任何对精度敏感的用例”。他补充道:“我认为大型AI实验室甚至没有尝试这样做,这很有趣。他们没有动力去做,因为他们从用户反复修正模型的过程中获利。”Probably的融资与产品路线,为AI行业提供了一条不同于“更大模型”的可靠路径。
来源:Heooo AI工具导航