2023年11月13日

搜索场景

大模型在搜索场景中的作用,是把“检索文档”升级为“理解意图、检索证据、组织答案并保留可跳转来源”的组合式系统。

知识库大模型应用场景applicationsearch

搜索场景

先说结论

大模型在搜索场景中的作用,是把“检索文档”升级为“理解意图、检索证据、组织答案并保留可跳转来源”的组合式系统。

核心子场景

  • 语义搜索:支持自然语言、多跳问题和同义表达。
  • 查询理解:做意图识别、改写、拆解和补全。
  • 结果摘要:从多来源结果生成 overview 或答案卡片。
  • 探索式搜索:支持复杂主题调研、比较、规划和决策。
  • 个性化搜索:结合历史行为、权限和企业上下文。

典型技术栈 / 实现模式

  • 关键词召回 + 向量检索 + rerank 的混合架构。
  • Query rewrite / decomposition / rerank。
  • RAG with citations:先检索,后归纳,并保留出处。
  • Search-augmented generation:大模型与搜索系统深度耦合。
  • 结果页通常呈现为 overview + inline links + source cards。

设计时真正要权衡什么

  • 直接答案 vs 导流网页:搜索必须兼顾“回答问题”和“连接 Web”。
  • 召回广度 vs 结果精度:复杂查询需要广召回,但摘要更容易犯错。
  • 延迟 vs 多跳推理:搜索产品对响应时间非常敏感。
  • 中立排序 vs 个性化:个性化提升满意度,但会放大偏见和信息茧房。
  • 开放互联网 vs 企业内网:企业搜索更强调权限与时效。

容易踩的坑

  • 错误归纳网页内容,导致 AI Overview 式幻觉。
  • 高置信错误回答压制了用户继续点源站的机会。
  • 对新近信息、地方性信息和争议信息表现不稳。
  • 给出答案却不给证据来源。
  • 将 SEO 噪声或低质页面当作高质量来源。

工程落地时我会怎么做

  • 默认采用“关键词 + 向量 + rerank”的混合检索。
  • 事实密集问题优先返回带 citation 的答案。
  • 对 YMYL、新闻、时效信息做更严格的 query routing。
  • 区分事实问答、比较推荐和探索研究三种搜索模式。
  • 监控 hallucination rate、source coverage、click-through to source 和 answer abandonment。
  • 建立失败案例回放集,覆盖长尾查询和对抗性查询。

如果要对外讲,可以怎么概括

“搜索场景里,LLM 不应该替代检索系统,而应该站在检索系统之上做查询理解、结果组织和来源归纳。核心不是‘答得像不像’,而是‘来源够不够、归纳准不准、用户还能不能继续查证’。所以搜索里的大模型系统设计重点是 citations、query routing 和失败回放。”

最后记几条

  1. 搜索里的 LLM 是检索增强层,不是纯生成替代品。
  2. 混合检索通常比单一路径更稳。
  3. 高风险问题必须优先保留来源。
  4. 搜索产品要同时优化答案质量和回源体验。
  5. 长尾查询和时效信息最容易暴露系统短板。

参考资料

延伸阅读