This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
Character.AIはTalkingMachinesを使ったリアルタイムAIビデオ技術を発表しました。
レベッカ・モエン
2025年07月04日 04:27
Character.AIはTalkingMachinesを紹介します。これは、インタラクティブで音声駆動のキャラクターアニメーションのために先進的な拡散モデルを利用したリアルタイムAIビデオ生成の画期的な技術です。
Character.AIは、TalkingMachinesという革新的な自己回帰拡散モデルの発表により、リアルタイムビデオ生成において大きな進展を遂げたと発表しました。この新しい技術により、キャラクターがさまざまなスタイルやジャンルでリアルタイムに会話できるインタラクティブな音声駆動型FaceTimeスタイルのビデオを作成することが可能になります。これはCharacter.AI Blogによって報告されました。
ビデオ生成の革命
TalkingMachinesは、Character.AIの以前の作業であるAvatarFXを基に構築されています。このプラットフォームでのビデオ生成を支えるもので、新しいモデルは没入型のリアルタイムAI駆動のビジュアルインタラクションとアニメーションキャラクターの舞台を整えます。画像と音声信号だけを利用することで、このモデルは動的なビデオコンテンツを生成でき、エンターテインメントやインタラクティブメディアの新たな可能性を開きます。
トーキングマシンの背後にある技術
このモデルは、非対称知識蒸留として知られる手法を利用して、Diffusion Transformer (DiT) アーキテクチャを活用しています。このアプローチは、高品質の双方向ビデオモデルを高速のリアルタイム生成器に変換します。主な特徴は次のとおりです:
未来への影響
このブレークスルーは顔のアニメーションを超えて、インタラクティブな視聴覚AIキャラクターへの道を開きます。フォトリアリスティックからアニメ、3Dアバターに至るまで、幅広いスタイルをサポートしており、自然な会話とリスニングのフェーズでストリーミングを向上させる準備が整っています。この技術は、ロールプレイ、ストーリーテリング、インタラクティブなワールドビルディングの基盤を築きます。
AI能力の進化
Character.AIの研究は、リアルタイム生成、効率的な蒸留、高いスケーラビリティを含むいくつかの進展を示しており、わずか2つのGPUで動作することが可能です。このシステムは、シームレスなキャラクターダイアログを可能にするマルチスピーカーインタラクションもサポートしています。
今後の展望
まだ製品の発売ではありませんが、この開発はCharacter.AIのロードマップにおける重要なマイルストーンです。同社は、この技術をプラットフォームに統合するために取り組んでおり、FaceTimeのような体験やキャラクターストリーミング、ビジュアルワールドビルディングを可能にすることを目指しています。最終的な目標は、没入型の視覚音響キャラクターの創造と相互作用を民主化することです。
Character.AIは、150万以上のキュレーションされたビデオクリップと三段階のトレーニングパイプラインを活用して、トレーニングインフラとシステム設計に大きく投資しています。このアプローチは、AI技術における最前線の研究の精度と目的を示しています。
画像出典:Shutterstock