概述
最新更新:2024-12-02

概述

GPTBots 为了满足客户对不同业务场景的不同需求,提供了多种不同的 LLM 和专业模型,以满足不同的业务场景。这些模型具备不同的能力(文本/图片/语音/文件的识别与生成)和特点,不同模型不同能力的服务定价也不相同。 GPTBots 的提供的模型服务类型如下:

  • LLMs:支持多个厂商多个版本的 LLM 模型,如:OpenAI、Claude、Gemini、ChatGLM、llama 等主流商业/开源模型。
  • Embedding 模型:支持多个 Embedding 模型,如:OpenAI、BGE、BCE 等主流商业/开源模型,但在 SaaS 版本中为了更好的提供服务,仅支持 1 个 Embedding 模型,但支持多个向量维度并存。
  • Rerank 模型:支持多个 rerank 模型,如:Jina 、BGE、BCE 等主流商业/开源模型。
  • Audio 模型:支持多个音频模型,如:OpenAI、Minimax 等主流商业/开源模型。

术语定义

GPTBots 为了便于企业用户便于管理和使用模型服务,从模型品牌和模型版本的视角,将模型各服务进行了抽象,定义了以下概念:
模型厂商:开发大模型的公司的名称,如:OpenAI、Anthropic、MistralAI、Ali、ZhiPu、Tencent 等。 模型名称:大模型的品牌名称,如:GPT、Claude、Gemini、ChatGLM、llama 等。 模型版本:大模型不同能力象限的版本,如:GPT-4o、 GPT-o1-mini、 Gemini-1.5-pro 等。
部署方式:由模型原厂商提供的模型 API 服务是官方部署,由三方算力平台商提供的模型 API 服务是开放部署API协议:运行大模型的算力服务平台协议规范,如:运行 GPT 的 OpenAI,运行 Claude 的 Amazon Bedrock、运行 Llama 的 together.ai,以及相当通用的 OpenAI 协议标准.
API KEY: 泛指调用模型服务 API 时的鉴权配置,模型服务商通常会针对不同的 API KEY 进行频率限制和独立计费。

模型服务配置

GPTBots 提供了 2 种配置模型服务的方式,分别为:使用 平台 KEY 配置模型服务和使用 自有 KEY 配置模型服务,企业可以根据自己的需求选择适合自己的方式。
企业用户在配置模型服务时,GPTBots 支持为指定的「模型品牌/模型版本」同时配置多个模型 API 协议,同时配置多个 API KEY,在调用模型服务时,GPTBots 会自动轮询调用不同的 API KEY,以达到模型服务的高可用和高并发的效果。 alt text

使用平台 KEY 调用模型服务

企业无需在各模型服务厂商注册账号和购买服务,可直接使用GPTBots的 平台 KEY 调用模型服务。企业可以在「GPTBots平台-组织-用量」查看模型调用服务的tokens详细数据,在 GPTBots 消耗相应的积分,具体价格明细可查看服务定价

使用自有 KEY 调用模型服务

企业可将各模型服务厂商已注册和开通的自有KEY托管在 GPTBots 平台,企业自行向各模型服务商支付相关费用。企业可以在「GPTBots平台-组织-用量」查看模型调用服务所消耗的tokens数据,在 GPTBots 消耗少量通道服务使用积分,具体价格明细可查看服务定价。

模型服务列表

GPTBots 会持续增加适用于企业业务场景的模型服务,若企业需要使用的模型服务不在列表中,联系我们,我们将对模型继续评估测试后提供支持。当前支持的模型服务及其能力列表如下:

LLMs

OpenAI GPT系列模型: GPT 是 OpenAI 开发的大语言模型系列,包括 GPT-3.5、GPT-4o 和 GPT-o1 等。

模型厂商/品牌 模型版本 上下文上限 生成上限 插件 输入图片 输入音频 输入文件 输出文本 输出音频
OpenAI/GPT GPT-4o 128k 8k
OpenAI/GPT GPT-4o-audio 128k 8k
OpenAI/GPT GPT-4o-mini 128k 8k
OpenAI/GPT GPT-o1 128k 8k
OpenAI/GPT GPT-o1-mini 128k 8k
OpenAI/GPT GPT-3.5-turbo 16k 4k

Anthropic Claude系列模型: Claude 是 Anthropic 开发的大语言模型系列,包括 Opus、Sonnet、Haiku 等版本。

模型厂商/品牌 模型版本 上下文上限 生成上限 插件 输入图片 输入音频 输入文件 输出文本 输出音频
Anthropic/Claude Claude-3-opus 200k 4k
Anthropic/Claude Claude-3.5-sonnet 200k 8k
Anthropic/Claude Claude-3.5-haiku 200k 8k

Google Gemini系列模型: Gemini 是 Google 开发的大语言模型系列,包括 Pro、 flash等版本。

模型厂商/品牌 模型版本 上下文上限 生成上限 插件 输入图片 输入音频 输入文件 输出文本 输出音频
Google/Gemini Gemini-1.5-pro 1M 8k
Google/Gemini Gemini-1.5-flash 1M 8k