添加数据
最新更新:2024-09-20

添加数据

在数据表创建完成后,您可以为该数据表添加数据。添加的数据可以是结构化数据,也可以是非结构化数据。可以根据企业的数据类型,选择不同的添加方式。 数据表字段值列表

非结构化数据

GPTBots 支持通过 LLM 对非结构化数据(如 PDF、Word、Excel、TXT 等)文档进行实体抽取,将结构化数据导入数据库,实现数据的快速入库和管理。具体的添加方式如下:

  1. 点击「添加数据」按钮,进入数据添加页面。
  2. 选择「本地文档」或「Google drive」方式,选择需要导入的非结构化数据文件,支持的文件类型包括 PDF、Word、Excel、TXT 等。每个文件的tokens 上限为 10K,超出部分的内容将被截断处理。 非结构化数据上传
  3. 点击「下一步」进入文档实体抽取页面,展示「识别服务、数据抽取方式和抽取字段名称」等信息。 非结构化数据进行实体抽取
    • 识别服务:当上传的知识文档存在 PDF 格式时,可选择使用 「普通识别或高级识别」对 PDF 文件进行解析。两者的区别在于,普通识别服务的解析速度更快,不消耗积分。而高级识别服务的解析质量较高速度较慢,消耗更多积分。
    • 数据抽取方式:GPTBots 支持两种数据抽取方式,“每份文档只抽取一条数据”是指每份文档只抽取1条该数据表的字段值,“每份文档抽取多条数据”是指每份文档可抽取多条该数据表的字段值。
    • 抽取字段名称:此处显示该数据表的所有字段名称,是要抽取的对象字段。
  4. 点击「保存」按钮,即可完成数据的添加工作,所提交的文档开始进入任务队列,等待处理完成即可将抽取到的数据添加到数据表中。在「当前任务」中可以查看任务的状态进度、和积分消耗情况。 数据实体抽取任务

结构化数据

模板导入

当数据表的字段创建完成后,您可以通过模板导入的方式,快速将结构化数据添加到数据库中。具体的添加方式如下:

  1. 在数据表页面点击「添加数据」按钮,进入数据添加页面。
  2. 选择「模板导入」方式,可下载模板.csv文件按照格式填充数据后,可以选择模板 CVS 文件进行上传。 数据表模板下载与上传
  3. 点击「下一步」进入数据导入页面,点击「保存」按钮,即可完成数据的添加工作。
  4. 模板文件中数据解析和导入任务完成后,您可以在数据表页面查看添加的数据。

API 添加

当数据表的字段创建完成后,您可以通过 API 接口的方式,将结构化数据添加到数据库中。

即将支持...