知识检索
最新更新:2025-04-07

知识检索

知识库是智能体的私有知识合集,知识检索节点可以基于用户输入查询指定的知识库,召回最匹配(相似度最高)的知识块,并将匹配结果以列表形式返回。

节点配置

image.png

  • 检索范围:定义需要查询的知识库的范围。支持选择多个知识库作为知识检索的范围。你需要现在工作流的知识库内添加需要使用的知识。

  • Query:检索的查询词。系统将使用 Query 到检索范围的知识库内检索相关性最高的知识块。

  • 最小相似度:定义召回的知识块的最小相似度,小于该值的知识块将不会被召回。

  • 最大召回数:定义召回的知识块的最大数量,按相似度排序优先召回。

  • 检索方式:

    • 语义:像人类一样去理解词与词、句与句之间的关系。推荐在需要理解语义关联度和跨语言查询的场景使用。

    • 关键词:基于关键词进行全文检索。推荐在知识包含专有名词、术语、缩写词等场景时使用。

    • 混合:结合全文检索和语义检索的优势,并对结果进行综合排序召回相关的内容片段。

  • 重排:根据相关性或质量对检索到的文档切片进行重新排序,以提高生成答案的准确性和相关性,适用于追求回答高精度和高相关性的场景,例如智能客服、专业技术答疑等场景。未开启结果重排时,节点输出的是向量检索的结果,根据匹配度从大到小排序;开启结果重排后,系统会将 Embedding 的召回结果交由 Rerank 模型进行质量和相关性判断,对结果重新排序,将与输入问题最相关的文档排在前面。

节点输出

image.png

输出参数固定为一个名为 outputList 的数组,其中包含多条召回结果(知识块),默认根据匹配度和相关性由高到低排序。列表项的内容如下:

  • 文档 ID:知识块所属的文档的 ID。

  • 文档名称:知识库所属的文档的名称。

  • 知识块 ID:知识块的 ID。

  • 知识块内容:知识块的内容。

  • 相似度:知识块与 Query 的相似度。