avatar

Wan 2.2 S2V

使用 Wan 2.2 语音转视频功能,用语音轨道为静止照片制作动画。输出将跟随您的音频,以自然的语音驱动动作呈现,分辨率可达 480p、580p 或 720p。

每次生成 3 点额度

尝试 Wan 2.2 S2V

正在使用以下工具生成Wan 2.2 S2V每次生成 3 点

使用 Wan 2.2 S2V 创建

功能

  • 照片加音频输入
  • 语音驱动动作
  • 480p / 580p / 720p
  • 音频长度输出

规格

分辨率
480p / 580p / 720p
输入
照片、音频和提示词
音频限制
7.5秒
输出
MP4 视频

输入要求

Source Photo*
image upload
Front-facing photo to animate
Audio File*
audio upload
Speech audio to drive the motion (max 7.5s)
Scene Description*
textarea
Resolution(可选)
select

价格

起价 3 点额度
~$0.50-$3.00 每次生成

相关模型

常见问题

Wan 2.2 S2V 需要多少成本?

Wan 2.2 S2V每次生成需要3个积分(约$0.50-$3.00)。你每天获得10个免费积分来尝试。

我可以商业使用 Wan 2.2 S2V 的输出内容吗?

是的,在 Arteza 上使用 Wan 2.2 S2V 生成的所有内容都附带商业许可证。

Wan 2.2 S2V 输出什么文件格式?

带有唇音同步音频的 MP4 视频文件。