文档
最新更新:2024-02-20
文档
添加
类型
您可以添加多种类型的文档,使之成为 Bot 的知识。
- 文件:支持 .doc/.docx/.pdf/.md/.txt 等多种格式。
- 表格:支持 .xls/.xlsx/.csv 格式。
- URL:提供网站的 URL,系统将爬取网页内容作为 Bot 知识。
- TXT:直接在线输入内容作为知识。
- Q&A:以「Q&A(问答对,即一问一答)」为结构的知识类型。
切片
不同的文档类型,提供了不同的切片方式。您可以在页面中预览切片效果。
若您对切片不了解,建议使用系统默认值。
对于文件、URL、TXT 类型,可以选择两种不同的切片方式:
- 按 Token 数:基于设定的 Token 数进行切片。例如,设定为「1000」,则为文档按每 1000 Token 生成一个切片。
- 按标识符:基于选定的标识符进行切片。例如,设定为「\n」,即换行符,则为文档按每次换行,生成一个切片。
对于表格类型,可以选择多行行作为表头。系统将会基于「表头+行」的方式,对表格数据进行切片。
对于 Q&A 类型,则不需要选择切片方式,系统将自动将每个 Q&A 作为一个切片。
从其他 Bot 复制
您可以从同组织内的其他 Bot,复制它的文档到当前 Bot,成为该 Bot 的知识文档。
编辑
对于已经添加的文档,可在线进行二次编辑。
表格类型的文档,暂不支持在线编辑。
URL 更新
对于 URL 类型,可以进行更新,以获取网页最新的内容作为知识。
若 Bot 内的 URL 文档太多,您也可以设置「定时更新」。Bot 会根据您设置的时间,定时为您全量更新所有 URL 文档内容。
您可以选择按天、按周或按月,定时更新您的 URL 文档。