AI模型竞技场Arena年收入破亿

Arena，这个由UC Berkeley研究项目孵化而来的AI模型众包评测平台，在推出商业服务仅八个月后，便实现了年化收入1亿美元的里程碑。这一数字不仅标志着其商业模式的快速验证，也反映出AI行业对模型性能评测与后训练优化服务的巨大需求。

Arena最初于2023年作为UC Berkeley的研究项目启动，其核心产品是一个基于众包的AI模型性能排行榜。用户可以在其网站上输入提示词，系统会将其发送给两个不同的AI模型，然后用户投票选出表现更好的那个。这种简单而有效的机制已经积累了超过1000万次用户评估，使其成为业内广泛引用的模型性能参考标准。

Arena平台界面

尽管其公开的模型排行榜一直免费向公众开放，Arena在去年9月推出了商业服务“AI Evaluations”，为模型实验室和企业提供来自其社区的深度性能分析。这一服务迅速获得了市场认可，推动公司收入快速增长。联合创始人兼CEO Anastasios Angelopoulos表示：“很多人甚至不知道我们的业务在赚钱；人们仍然把我们看作一个开源项目。”他强调，公司收入来自客户对“消费”的付费，而非传统的订阅制。

Arena的快速增长并非孤例。整个AI后训练优化市场正在经历爆发式增长。据The Information报道，另一家AI训练数据平台Handshake的AI训练年化收入自1月以来几乎翻倍，从5.5亿美元增至近10亿美元。Mercor的年化收入也从去年9月的5亿美元攀升至今年年初的10亿美元以上。这些数据表明，随着AI模型竞争进入白热化阶段，模型开发商对后训练阶段精细调优的需求正在急剧上升。

Arena的独特之处在于其众包评测模式。与传统的基于基准测试或人工标注的评测方式不同，Arena通过真实用户对模型输出的直接比较，提供了更贴近实际应用场景的性能评估。其评测范围涵盖文本、编码、视觉、图像生成等任务，并通过最近推出的“Agent Mode”支持复杂的长时间运行工作流。这种多维度的评测能力，使其成为模型开发商在模型发布前进行性能验证的重要工具。

Arena模型排行榜

尽管Arena没有直接的竞争对手——另一家众包模型评测初创公司Yupp已于3月关闭——但Angelopoulos表示，公司正在与Mercor、Surge和Scale AI等人工标注初创公司争夺同一块市场。这些公司都帮助模型制造商在后训练阶段优化其AI，而Arena凭借其社区驱动的评测数据，提供了一种差异化的解决方案。

Arena的融资历程也反映了市场对其前景的看好。今年1月，公司宣布完成1.5亿美元A轮融资，投后估值达17亿美元，当时其年化收入为3000万美元。如今，这一数字已增长超过三倍。公司累计融资总额达到2.5亿美元，投资者包括Felicis、Andreessen Horowitz、The House Fund、LDVP和Kleiner Perkins等知名机构。

Arena由UC Berkeley的博士后研究员Anastasios Angelopoulos和Wei-Lin Chiang共同创立，Chiang担任CTO。另一位联合创始人是著名的UC Berkeley教授、Databricks联合创始人Ion Stoica，他在项目公司化之前担任顾问，并于2025年4月正式加入。这一学术背景为Arena的技术深度和社区信任度提供了坚实的基础。

AI模型竞技场Arena年收入破亿

相关资讯

创业者用AI辅助决策对抗癌症

豆包视频模型Seedance2.5亮相，支持30秒生成

Fika Jobs获400万美元打造AI视频招聘平台

OpenAI发布首款自研AI推理芯片Jalapeño

企业紧急限制员工AI预算滥用