阿里开源创新大模型ZeroSearch 无需外部搜索引擎而自学检索 阿里巴巴近日开源了一种创新大模型 ZeroSearch ,在训练过程中无需调用任何外部搜索引擎即可掌握信息检索能力。新模型表现堪比甚至超越依赖真实搜索引擎训练的模型,而且更节约训练成本。 在涵盖七个问答数据集的对比测试中,该模型 7B 参数的检索模块便能达到与 Google 搜索相当的水平,而 14B 参数版本则表现更佳。更令人瞩目的是其成本优势:若通过 SerpAPI 调用 Google 搜索执行 64,000 次查询,训练费用约为 586.70 美元;而在 4 块 NVIDIA A100 GPU 上运行 14B 参数的模拟 LLM,仅需约 70.80 美元,成本削减高达 88%。 目前,ZeroSearch 已在 Qwen-2.5、LLaMA-3.2 等多个主流模型家族中完成验证。研究团队已将全部代码、数据集及预训练模型开源至 GitHub 和 Hugging Face。 | ☘️

  1. 转载请保留原文链接谢谢!
  2. 本站所有资源文章出自互联网收集整理,本站不参与制作,如果侵犯了您的合法权益,请联系本站我们会及时删除。
  3. 本站发布资源来源于互联网,可能存在水印或者引流等信息,请用户擦亮眼睛自行鉴别,做一个有主见和判断力的用户。
  4. 本站资源仅供研究、学习交流之用,若使用商业用途,请购买正版授权,否则产生的一切后果将由下载用户自行承担。
  5. 联系方式:936787576@qq.com