📰 重點摘要

印度 AI 新創 Avataar AI 推出了一款名為 Varya 的影片生成模型,專為印度文化語境設計,能識別當地節慶、服飾、食物與建築等細節。Avataar AI 是印度政府「India AI Mission」十二家獲選新創之一,該計畫總規模約 12 億美元,以補貼 GPU 算力換取模型公開釋出。

Varya 並非從零訓練,而是以阿里巴巴開源的 Wan 2.2 影片生成模型為基礎,透過知識蒸餾技術將其壓縮,步驟從原本的 50 步縮減至僅 4 步,速度提升 10 倍、成本大幅下降。具體數字相當驚人:使用 NVIDIA H200 GPU 生成一段 5 秒 720p 影片,Varya 僅需 45 秒,而原版 Wan 2.2 需要 1,230 秒。

定價是 Varya 最引人注目的地方。Avataar AI 計畫在託管服務上以每秒影片收費 ₹0.48(約 0.005 美元)的價格對外提供,相較於 Veo、Kling、Luma、Runway 等主流模型普遍收取每秒 0.1 美元以上,價差高達約 20 倍。Peak XV 董事總經理 Rajan Anandan 指出,印度是影片優先市場,但現有 AI 影片模型對大規模普及來說過於昂貴,必須大幅降低成本才能觸及學生、教師、中小微企業及公共服務。

Varya 將以開放權重模型形式發布在印度政府的 AI Kosh 平台,並附帶訓練資料,開發者可自行部署或修改。目前任何人皆可透過文字或參考圖片在官網直接試用。


💬 JudyAI Lab 觀點

Varya同時做到「20倍成本差距」與「在地文化識別」,這在AI影片生成市場幾乎還沒有先例,值得我們仔細拆解它的技術路徑與商業邏輯。

Varya最關鍵的啟示不在產品本身,而在它的開發策略:不從零訓練新模型,而是以阿里巴巴開源的Wan 2.2為基礎,透過知識蒸餾把推理步驟從50步壓縮至4步,速度提升10倍、成本大幅下降。這個路徑說明一件事——在地化不等於重建一切,找到對的開源基礎加上定向強化,可以同時跨越技術門檻與成本門檻。印度政府「India AI Mission」以補貼算力換取模型開放的機制,也提供了一個可觀察的政策框架:用公共資源撬動在地AI基礎設施,而非讓定價權集中在少數商業平臺手裡。對AI builder來說,這個邏輯遠比「做出酷炫功能」更務實——市場進入的關鍵往往是成本結構,不是技術本身。

建議直接去Varya官網試生成一段影片,再對比自己目前使用的影片工具每秒費用——這個數字差距,會讓你重新校準「AI影片生成的成本基準線」到底在哪裡。


📅 原文資訊


🔗 延伸閱讀