概述
GPTBots 为了满足客户对不同业务场景的不同需求,提供了多种不同的 LLM 和专业模型,以满足不同的业务场景。这些模型具备不同的能力(文本/图片/语音/文件的识别与生成)和特点,不同模型不同能力的服务定价也不相同。 GPTBots 的提供的模型服务类型如下:
- LLMs:支持多个厂商多个版本的 LLM 模型,如:OpenAI、Claude、Gemini、ChatGLM、llama 等主流商业/开源模型。
- Embedding 模型:支持多个 Embedding 模型,如:OpenAI、BGE、BCE 等主流商业/开源模型,但在 SaaS 版本中为了更好的提供服务,仅支持 1 个 Embedding 模型,但支持多个向量维度并存。
- Rerank 模型:支持多个 rerank 模型,如:Jina 、BGE、BCE 等主流商业/开源模型。
- Audio 模型:支持多个音频模型,如:OpenAI、Minimax 等主流商业/开源模型。
术语定义
GPTBots 为了便于企业用户便于管理和使用模型服务,从模型品牌和模型版本的视角,将模型各服务进行了抽象,定义了以下概念:模型厂商
:开发大模型的公司的名称,如:OpenAI、Anthropic、MistralAI、Ali、ZhiPu、Tencent 等。
模型名称
:大模型的品牌名称,如:GPT、Claude、Gemini、ChatGLM、llama 等。
模型版本
:大模型不同能力象限的版本,如:GPT-4o、 GPT-o1-mini、 Gemini-1.5-pro 等。部署方式
:由模型原厂商提供的模型 API 服务是官方部署,由三方算力平台商提供的模型 API 服务是开放部署。
API协议
:运行大模型的算力服务平台协议规范,如:运行 GPT 的 OpenAI,运行 Claude 的 Amazon Bedrock、运行 Llama 的 together.ai,以及相当通用的 OpenAI 协议标准.API KEY
: 泛指调用模型服务 API 时的鉴权配置,模型服务商通常会针对不同的 API KEY 进行频率限制和独立计费。
模型服务配置
GPTBots 提供了 2 种配置模型服务的方式,分别为:使用 平台 KEY 配置模型服务和使用 自有 KEY 配置模型服务,企业可以根据自己的需求选择适合自己的方式。
企业用户在配置模型服务时,GPTBots 支持为指定的「模型品牌/模型版本」同时配置多个模型 API 协议,同时配置多个 API KEY,在调用模型服务时,GPTBots 会自动轮询调用不同的 API KEY,以达到模型服务的高可用和高并发的效果。
使用平台 KEY 调用模型服务
企业无需在各模型服务厂商注册账号和购买服务,可直接使用GPTBots的 平台 KEY 调用模型服务。企业可以在「GPTBots平台-组织-用量」查看模型调用服务的tokens详细数据,在 GPTBots 消耗相应的积分,具体价格明细可查看服务定价
使用自有 KEY 调用模型服务
企业可将各模型服务厂商已注册和开通的自有KEY托管在 GPTBots 平台,企业自行向各模型服务商支付相关费用。企业可以在「GPTBots平台-组织-用量」查看模型调用服务所消耗的tokens数据,在 GPTBots 消耗少量通道服务使用积分,具体价格明细可查看服务定价。
模型服务列表
GPTBots 会持续增加适用于企业业务场景的模型服务,若企业需要使用的模型服务不在列表中,联系我们,我们将对模型继续评估测试后提供支持。当前支持的模型服务及其能力列表如下:
LLMs
OpenAI GPT系列模型: GPT 是 OpenAI 开发的大语言模型系列,包括 GPT-3.5、GPT-4o 和 GPT-o1 等。
模型厂商/品牌 | 模型版本 | 上下文上限 | 生成上限 | 插件 | 输入图片 | 输入音频 | 输入文件 | 输出文本 | 输出音频 |
---|---|---|---|---|---|---|---|---|---|
OpenAI/GPT | GPT-4o | 128k | 8k | ✓ | ✓ | ✗ | ✗ | ✓ | ✗ |
OpenAI/GPT | GPT-4o-audio | 128k | 8k | ✓ | ✓ | ✓ | ✗ | ✓ | ✓ |
OpenAI/GPT | GPT-4o-mini | 128k | 8k | ✓ | ✓ | ✗ | ✗ | ✓ | ✗ |
OpenAI/GPT | GPT-o1 | 128k | 8k | ✗ | ✓ | ✗ | ✗ | ✓ | ✗ |
OpenAI/GPT | GPT-o1-mini | 128k | 8k | ✗ | ✓ | ✗ | ✗ | ✓ | ✗ |
OpenAI/GPT | GPT-3.5-turbo | 16k | 4k | ✓ | ✗ | ✗ | ✗ | ✓ | ✗ |
Anthropic Claude系列模型: Claude 是 Anthropic 开发的大语言模型系列,包括 Opus、Sonnet、Haiku 等版本。
模型厂商/品牌 | 模型版本 | 上下文上限 | 生成上限 | 插件 | 输入图片 | 输入音频 | 输入文件 | 输出文本 | 输出音频 |
---|---|---|---|---|---|---|---|---|---|
Anthropic/Claude | Claude-3-opus | 200k | 4k | ✓ | ✓ | ✗ | ✗ | ✓ | ✗ |
Anthropic/Claude | Claude-3.5-sonnet | 200k | 8k | ✓ | ✓ | ✗ | ✓ | ✓ | ✗ |
Anthropic/Claude | Claude-3.5-haiku | 200k | 8k | ✓ | ✓ | ✗ | ✗ | ✓ | ✗ |
Google Gemini系列模型: Gemini 是 Google 开发的大语言模型系列,包括 Pro、 flash等版本。
模型厂商/品牌 | 模型版本 | 上下文上限 | 生成上限 | 插件 | 输入图片 | 输入音频 | 输入文件 | 输出文本 | 输出音频 |
---|---|---|---|---|---|---|---|---|---|
Google/Gemini | Gemini-1.5-pro | 1M | 8k | ✓ | ✓ | ✓ | ✓ | ✓ | ✗ |
Google/Gemini | Gemini-1.5-flash | 1M | 8k | ✓ | ✓ | ✓ | ✓ | ✓ | ✗ |