2024-07-05 00:00

商湯推可控人物視頻大模型 Vimi僅需一張相生成片長達1分鐘

世界人工智能大會（WAIC 2024）昨天開幕，商湯（00020）在會上推出可控人物視頻生成大模型Vimi，只需要一張任意風格的照片，便能生成和目標動作一致的人物類短片，且時長可長達1分鐘，畫面效果不會隨着時間變化而降低品質或失真。Vimi已經在商湯的官網開放預約。 Vimi是基於商湯「日日新大模型」的能力，一張照片即可生成人物視頻，並支持多種驅動方式，可通過已有人物影片、動畫、聲音、文字等多種元素進行驅動。支援聊天唱跳等互動場景商湯表示，讓照片中的人物動起來已非新鮮事，但目前市面上的產品實際應用仍存在挑戰，例如人物動作或表情動作無法精準控制、效果不穩定、時長限制在3至4秒等。公司稱，與 ...

（節錄）全文共892字

商湯推可控人物視頻大模型 Vimi僅需一張相 生成片長達1分鐘

商湯推可控人物視頻大模型 Vimi僅需一張相生成片長達1分鐘