Wan2.1 AI

Wan2.1は、Alibabaのオープンソースビデオ生成基盤モデルで、VBenchベンチマークで86.22%のスコアを獲得し、トップを走っています。テキストからビデオ、画像からビデオへのタスクに特化し、中国語/英語のテキスト効果、物理シミュレーション、無限の長さの生成を備えたシネマティックな1080Pシーケンスを生成します。ハリウッド級のモーションコントロールを実現する3D Causal VAEとDiTアーキテクチャを搭載しています。

クリエイティブワークフロー

産業アプリケーション

広告キャンペーン生成

ダイナミックな字幕とパーティクルエフェクトを備えたブランド整合型のビデオを制作します。

ショートビデオ作成

自メディアクリエイターが作品を制作するのに適しています。

映画プリビジュアライゼーション

プロフェッショナルなカメラムーブメントを備えたストーリーボードを生成します。

コア機能

技術的優位性

中国を代表するオープンソースビデオAIとして、Wan2.1は以下の方法でビジュアルストーリーテリングを再定義します:

時間的一貫性
3D Causal VAEは3000以上のフレームをエンコードし、98%のモーションコヒーレンスを実現
多言語サポート
ネイティブ中国語テキスト効果 + 12言語ローカライゼーション
ハードウェア効率
RTX 4090での480P生成に8.2GBのVRAMを必要とします
オープンエコシステム
Apache 2.0ライセンスで14B/1.3Bモデルバリアントを提供

よくある質問

Wan2.1とは何ですか?

Wan2.1(Tongyi Wanxiang 2.1)は、Alibaba Cloudのオープンソースビデオ生成基盤モデルで、Apache 2.0ライセンスの下でリリースされています。テキストからビデオ(T2V)および画像からビデオ(I2V)生成に特化し、3D Causal VAEやDiffusion Transformer(DiT)などの先進的なアーキテクチャを活用して、高品質で時間的に一貫性のあるビデオを生成し、シネマティックなエフェクトとリアルな物理シミュレーションを実現します。

商用利用は許可されていますか?

はい。Apache 2.0ライセンスの下、Wan2.1で生成されたビデオは、広告や映画などで帰属表示なしに収益化できます。

最小ハードウェア要件は?

1.3Bモデルは8GB GPU(例:RTX 3060)で480Pを生成可能;14Bモデルは720P生成に80GB VRAMを必要とします。

最大ビデオ長は?

時間的チャンキングと因果的注意メカニズムにより、無限の長さの1080P生成が可能です。

中国語独自の機能は?

書道アニメーションと詩の可視化をサポートする初のモデルです。