audio

Seed Audio 1.0

字节跳动 Seed Audio 1.0。提示词驱动的语音和声景生成:描述对话、旁白或氛围,Seed Audio 将呈现富有表现力的音频。可选择用单张参考图像或最多三个参考音频片段进行引导(二者不能同时使用)。重复使用自己克隆的声音以保持说话人一致。支持英文和中文,每个片段最长两分钟,按实际输出时长计费。

每次生成 1 点额度

尝试 Seed Audio 1.0

正在使用以下工具生成Seed Audio 1.0每次生成 1 点

使用 Seed Audio 1.0 创建

功能

  • 提示词驱动的场景
  • 图像或音频引导
  • 英文和中文
  • 重复使用克隆声音
  • 速度、音量和音调控制
  • 最长 2 分钟

规格

语言
英文、中文
最长时长
2 分钟
引导方式
图像或参考音频
输入
提示词+可选图像/参考音频
输出
MP3 音频

输入要求

Prompt*
textarea
Voice(可选)
select
Speed(可选)
slider
Volume(可选)
slider
Pitch(可选)
slider

价格

1 点额度
~$0.03+ 每次生成

相关模型

常见问题

Seed Audio 1.0 需要多少成本?

Seed Audio 1.0每次生成需要1个积分(约$0.03+)。你每天获得10个免费积分来尝试。

我可以商业使用 Seed Audio 1.0 的输出内容吗?

是的,在 Arteza 上使用 Seed Audio 1.0 生成的所有内容都附带商业许可证。

Seed Audio 1.0 输出什么文件格式?

高质量 PNG 图像,分辨率为您选择的尺寸。