AI模型竞技场Arena年收入破亿
「源自UC Berkeley的AI模型众包评测平台Arena,在推出商业服务仅8个月后,年化收入达到1亿美元,成为AI评测领域的新标杆。」
Arena,这个由UC Berkeley研究项目孵化而来的AI模型众包评测平台,在推出商业服务仅八个月后,便实现了年化收入1亿美元的里程碑。这一数字不仅标志着其商业模式的快速验证,也反映出AI行业对模型性能评测与后训练优化服务的巨大需求。
Arena最初于2023年作为UC Berkeley的研究项目启动,其核心产品是一个基于众包的AI模型性能排行榜。用户可以在其网站上输入提示词,系统会将其发送给两个不同的AI模型,然后用户投票选出表现更好的那个。这种简单而有效的机制已经积累了超过1000万次用户评估,使其成为业内广泛引用的模型性能参考标准。
尽管其公开的模型排行榜一直免费向公众开放,Arena在去年9月推出了商业服务“AI Evaluations”,为模型实验室和企业提供来自其社区的深度性能分析。这一服务迅速获得了市场认可,推动公司收入快速增长。联合创始人兼CEO Anastasios Angelopoulos表示:“很多人甚至不知道我们的业务在赚钱;人们仍然把我们看作一个开源项目。”他强调,公司收入来自客户对“消费”的付费,而非传统的订阅制。
Arena的快速增长并非孤例。整个AI后训练优化市场正在经历爆发式增长。据The Information报道,另一家AI训练数据平台Handshake的AI训练年化收入自1月以来几乎翻倍,从5.5亿美元增至近10亿美元。Mercor的年化收入也从去年9月的5亿美元攀升至今年年初的10亿美元以上。这些数据表明,随着AI模型竞争进入白热化阶段,模型开发商对后训练阶段精细调优的需求正在急剧上升。
Arena的独特之处在于其众包评测模式。与传统的基于基准测试或人工标注的评测方式不同,Arena通过真实用户对模型输出的直接比较,提供了更贴近实际应用场景的性能评估。其评测范围涵盖文本、编码、视觉、图像生成等任务,并通过最近推出的“Agent Mode”支持复杂的长时间运行工作流。这种多维度的评测能力,使其成为模型开发商在模型发布前进行性能验证的重要工具。
尽管Arena没有直接的竞争对手——另一家众包模型评测初创公司Yupp已于3月关闭——但Angelopoulos表示,公司正在与Mercor、Surge和Scale AI等人工标注初创公司争夺同一块市场。这些公司都帮助模型制造商在后训练阶段优化其AI,而Arena凭借其社区驱动的评测数据,提供了一种差异化的解决方案。
Arena的融资历程也反映了市场对其前景的看好。今年1月,公司宣布完成1.5亿美元A轮融资,投后估值达17亿美元,当时其年化收入为3000万美元。如今,这一数字已增长超过三倍。公司累计融资总额达到2.5亿美元,投资者包括Felicis、Andreessen Horowitz、The House Fund、LDVP和Kleiner Perkins等知名机构。
Arena由UC Berkeley的博士后研究员Anastasios Angelopoulos和Wei-Lin Chiang共同创立,Chiang担任CTO。另一位联合创始人是著名的UC Berkeley教授、Databricks联合创始人Ion Stoica,他在项目公司化之前担任顾问,并于2025年4月正式加入。这一学术背景为Arena的技术深度和社区信任度提供了坚实的基础。
来源:Heooo AI工具导航