音频大模型(Audio LLM)
最新更新:2025-04-07
音频大模型(Audio LLM)
与大模型(LLM)节点不同的是,音频大模型支持声音输入和声音输出。对于输出的声音,支持设定音色。
节点配置
大模型(LLM):同“大模型(LLM)”。仅可以选择音频大模型(Audio LLM)。
音频输入:输入的音频。仅可以选择“文件-音频”类变量使用。
声音:定义输出的声音的音色。
其他配置项(AI创作力(温度)、最大相应长度、系统提示词、用户提示词、记忆、工具、数据表)请参阅大模型。
节点输出
该节点固定输出以下三个字段:
text:LLM 的输出内容的文本。
audio:LLM 生成的音频文件,为 URL 形式。
transcript:音频文件的转录文本。