动态工作空间扩展提升语料库直接交互性能

在人工智能领域，智能体在大型语料库中进行检索和推理时，通常依赖基于检索器的接口（如BM25或ColBERT）来发现相关候选文档。这些接口虽然能够有效对文档进行排序，但仅以排名结果或受限的文档视图形式呈现证据，限制了智能体重新组织材料以及跨文档验证约束的能力。为突破这一局限，直接语料库交互（Direct Corpus Interaction，简称DCI）方法应运而生，通过暴露可执行的shell操作，支持灵活的搜索、过滤、比较和验证。然而，随着语料库规模的增长，全语料库终端命令的执行变得缓慢且不稳定，导致性能下降和效率损失。

针对这一问题，来自学术界的研究团队提出了Dr-DCI（Retriever-Steered DCI）框架。该框架将检索视为一种智能体可调用的动作，用于扩展本地工作空间。智能体不再直接操作整个语料库，而是动态地将相关文档拉入一个不断演进的工作空间中，并在此空间内执行DCI操作。这种设计巧妙结合了检索器的召回能力与DCI的精确性：检索确保了探索的可扩展性，而DCI则保留了局部操作所需的精度，从而有效提升了证据解析的效果。

实验结果表明，Dr-DCI在不同规模的数据集上均表现出色。在Browsecomp-Plus基准测试中，Dr-DCI达到了71.2%的准确率，相比原始的DCI及其消融变体提升了最多8.3个百分点，同时减少了工具使用次数、运行时间和预估成本。当采用保留工作空间的上下文重置策略时，准确率进一步提升至73.3%。在语料库规模扩展实验中，Dr-DCI在10万到1000万文档的范围内依然保持有效，而原始DCI变得不稳定，BM25的性能则显著下降。此外，Dr-DCI在2000万文档级别的Wiki-18问答场景中也展现了良好的可扩展性，在六个基准测试中平均得分达到63.0，超越了基于检索和基于训练的搜索智能体基线。

消融分析进一步揭示了Dr-DCI性能提升的关键因素：排名预览和跨文档DCI操作是贡献最大的两个组件。排名预览允许智能体在扩展工作空间之前快速浏览检索结果，从而做出更明智的决策；而跨文档DCI则使智能体能够同时对比和验证多个文档中的信息，这对于需要综合多个证据的复杂推理任务至关重要。这些发现为未来设计更高效、更可靠的智能体搜索系统提供了重要指导。

Dr-DCI的提出不仅解决了DCI方法在大规模语料库中的扩展性问题，也为智能体搜索领域开辟了新的研究方向。通过将检索与直接交互有机融合，Dr-DCI在保持高精度的同时实现了高效的计算资源利用，有望在知识密集型任务、科学文献分析、法律文档审查等实际应用场景中发挥重要作用。研究团队已在arXiv上公开了论文的PDF和HTML版本，供学术界和工业界进一步探索与复现。