昨日 阿里巴巴在 Github 等平台正式开源了其全新研发的大模型搜索引擎 ZeroSearch。这款搜索引擎以强化学习框架为基础,能够在无需与真实搜索引擎交互的情况下,激发大模型的搜索能力。
ZeroSearch 的核心技术是利用大模型在大规模预训练过程中积累的丰富知识,将其转化为一个高效的检索模块。该模块能够根据用户输入的搜索查询生成相关的内容,同时具有动态控制生成内容质量的功能,这是传统搜索引擎所不具备的优势。
研究团队在多个知名问答数据集上进行了评测,包括 NQ、TriviaQA、PopQA 和 HotpotQA 等。测试结果显示,使用 ZeroSearch 后,一个70亿参数的监督微调模型,其搜索能力达到了33.06,而140亿参数的模型则进一步提升至33.97,超越了谷歌搜索的32.47。这一成就表明,ZeroSearch 在搜索性能上有了显著提升。