音频大模型(Audio LLM)
最新更新:2025-04-07

音频大模型(Audio LLM)

与大模型(LLM)节点不同的是,音频大模型支持声音输入和声音输出。对于输出的声音,支持设定音色。

节点配置

image.png

  • 大模型(LLM):同“大模型(LLM)”。仅可以选择音频大模型(Audio LLM)。

  • 音频输入:输入的音频。仅可以选择“文件-音频”类变量使用。

  • 声音:定义输出的声音的音色。

  • 其他配置项(AI创作力(温度)最大相应长度系统提示词用户提示词记忆工具数据表)请参阅大模型

节点输出

image.png

该节点固定输出以下三个字段:

  • text:LLM 的输出内容的文本。

  • audio:LLM 生成的音频文件,为 URL 形式。

  • transcript:音频文件的转录文本。