avatar新機能
Wan 2.2 S2V
Wan 2.2 Speech-to-Videoを使用して、静止画を音声トラックでアニメーション化します。出力は480p、580p、または720pで、自然な音声駆動モーションであなたの音声に従います。
Wan 2.2 S2Vを試す
生成中:Wan 2.2 S2V生成あたり3c
Wan 2.2 S2Vで作成
機能
- 写真と音声の入力
- 音声駆動モーション
- 480p / 580p / 720p
- 音声長出力
仕様
- 解像度
- 480p / 580p / 720p
- 入力
- 写真、音声、プロンプト
- 音声制限
- 7.5秒
- 出力
- MP4動画
入力要件
Source Photo*
image upload
Front-facing photo to animate
Audio File*
audio upload
Speech audio to drive the motion (max 7.5s)
Scene Description*
textarea
Resolution(オプション)
select
関連モデル
OmniHuman v1.5
写真とオーディオからトーキングアバター
2クレジットから · $0.32-$9.60
Kling Avatar v2
あらゆるキャラクターに対応した多機能リップシンク
2クレジットから · $0.23-$13.80
SadTalker
写真 + オーディオからの予算向けアバター
5クレジット · $1.00
Sync-3 Lipsync
4Kリップシンク対応のビデオダビング
2クレジットから · $0.27-$16.01
Hunyuan Avatar
トーキングおよびシンギング、最大120秒
Fabric 1.0
写真+オーディオ会話アバター
1クレジットから · $0.16/s+
Infini Talk
オーディオドリブン会話アバター
4クレジットから · $0.40/s+
よくある質問
Wan 2.2 S2Vの費用はいくらですか?
Wan 2.2 S2Vは生成1回3クレジット(約$0.50-$3.00)。毎日10クレジット無料で試せます。
Wan 2.2 S2Vの出力を商業利用できますか?
はい、ArtezaでWan 2.2 S2Vを使用して生成されたすべてのコンテンツには商用ライセンスが付属します。
Wan 2.2 S2Vはどのファイル形式で出力されますか?
音声同期されたMP4ビデオファイル。