Yevideo 靈感
Alibaba ATH · Happy Horse 1.0
Happy Horse 1.0:文生、圖生皆強的新一代 AI 視頻模型
Happy Horse 1.0 由阿里巴巴 ATH 團隊研發,是 2026 年 AI 視頻領域最受關注的新模型之一:文生視頻(Text-to-Video)與圖生視頻(Image-to-Video)在 Artificial Analysis Video Arena 公開評測中表現亮眼——無音頻類別下,文生與圖生均位居前列,帶音頻類別同樣保持第一梯隊。除生成能力外,它還支持多圖參考引導、對已有片段的視頻編輯、原生 1080p 與多鏡頭敘事,併兼顧音頻輸出與多語言創作。在 Yevideo,你可以用同一套工作臺,把 Happy Horse 1.0 的四條鏈路從試創意一直做到可展示的 1080p 樣片。
人物表情細膩真實:眼神、嘴角與情緒都「演」得出來
很多 AI 視頻一到近景就露餡:表情僵硬、眼神發直、情緒像貼上去的。Happy Horse 1.0 在文生視頻裏對人物面部刻畫更下功夫——微表情、視線方向、嘴角弧度與眉間張力能在動態中保持連貫,更接近真人表演而非「會動的假臉」。寫提示時不妨點明情緒層次(剋制、驚訝、苦笑、壓抑後的釋放)和鏡頭距離(特寫抓眼神、中景看肢體),Happy Horse 1.0 更容易把人物拍得細膩、可信,適合對白戲、情緒短片與需要「看得懂臉」的廣告鏡頭。
- 適合人物特寫、對白戲、情緒向劇情與需要「看得懂臉」的品牌片
- 提示詞寫清情緒與神態(眼神、嘴角、呼吸感),比只寫「很好看」更有效
運動流暢、觀感真實,更貼近真實世界的物理規律
Happy Horse 1.0 圖生視頻的重點不在「隨便動起來」,而在動得順、動得像:人物轉身、邁步、揮手時,肢體銜接更連貫,少出現卡頓、跳幀或關節「折返」;物體下落、碰撞、液體潑濺、布料飄動等,也更尊重重力、慣性與接觸關係,減少違背常識的穿幫。Happy Horse 1.0 會在保留原圖氣質的前提下,把動作落實得更自然。
- 運動流暢:時序連貫,複雜動作少僵硬、少「一幀一卡」的割裂感
- 物理可信:重力、慣性、碰撞與接觸更合理,液體、布料、剛體少飄、少穿模
- 仍保留參考圖氣質:構圖與主體輪廓站得住,文字側重「怎麼動」而非重複畫面描述
藉助 Happy Horse 1.0,讓圖生視頻創作煥發生機
Happy Horse 1.0 圖生視頻會把靜態視覺轉化爲可播放的動態內容,同時讓原圖在成片裏保持核心地位:構圖、氣質與主體輪廓站得住,目標是「讓畫面活起來」,而不是被模型替換成另一張圖。人物肖像、產品特寫或風格化海報一旦加入合理的運動與鏡頭,就更容易抓住注意力——尤其適合需要保留原始視覺、又希望內容更適配視頻優先投放的創作者。在 Yevideo 上傳首幀即可開跑,配合 720p / 1080p 與多種畫幅,把已有主視覺快速擴展成可展示的動態樣片。
- 原圖仍是主角:動的是畫面與鏡頭,不是「換臉」或「換產品」
- 適合人物肖像、電商主圖、品牌 KV 與 IP 定妝等已有強視覺的素材
- 提示詞側重運動方向、幅度與節奏,避免重複畫面裏已經寫明的信息
多圖參考 + 多語言:用 character1/2… 精細控角色,面向全球受衆
當一張圖不足以表達 IP 設定或品牌手冊時,Happy Horse 1.0 支持上傳 1–9 張參考圖,並在提示詞中用 character1、character2 等指代對應角色,讓成片更貼近期望的人設、服裝與場景走向。參考圖順序即角色編號,建議用 720p 以上、短邊 ≥400px 的清晰素材。與此同時,Happy Horse 1.0 面向多語言創作場景:中文、英文等提示均可驅動生成,適合跨境廣告、多地區版本短視頻與國際化產品演示——同一套視覺邏輯,換語言即可快速出不同市場版本。
- 多圖參考適合 IP 短片、系列廣告、需要統一世界觀的項目
- 提示詞可中英混寫,關鍵是主體與動作指代一致
- 需要更強可控性時,優先用參考圖鎖外觀,文字寫運動與鏡頭
文生視頻:從文字概念到可播放鏡頭
無需參考圖,直接用提示詞生成 3–15 秒動態視頻。Happy Horse 1.0 文生視頻適合故事敘述、視覺構思、營銷策劃與短視頻——當創意還停在文字階段,這是把概念「演」出來最快的方式。支持 720p / 1080p 與多種畫幅,並可配合音頻相關能力(視工作臺選項而定)。
- 提示詞寫清:誰 / 在哪 / 做什麼 / 什麼氛圍 / 鏡頭怎麼動
- 公開競技場文生(無音頻)表現處於頭部,適合比稿與方向驗證
- 先用短時長、低分辨率試氣質,滿意再升 1080p
圖生視頻:一張首幀圖,生成連貫動態
上傳單張首幀圖(JPEG / PNG / WebP),Happy Horse 1.0 在保持原圖氣質的前提下補全運動。公開競技場圖生(無音頻)同樣表現亮眼,適合角色動畫、產品展示與風格化場景——核心訴求是「動起來」,而不是「變成另一張圖」。
- 僅需 1 張首幀圖;主體突出、邊緣乾淨更易成功
- 文字描述運動方向、幅度與節奏,避免與畫面信息重複
- 分辨率 720p / 1080p,時長 3–15 秒可調
多圖參考生視頻:1–9 張圖引導角色與風格
上傳 1–9 張參考圖,在提示詞中用 character1、character2… 對應數組順序,精確控制多角色同框、服裝與場景元素。當目標是讓視頻更貼品牌手冊、分鏡板或 IP 設定時,Happy Horse 1.0 多圖參考比單圖模式更可控,成片與原素材一致性更高。
- 參考圖順序 = character 編號,提示詞中指代要一致
- 建議清晰大圖,避免模糊、強壓縮的小圖
- 複雜互動先寫清主次,再逐步加強運動
視頻編輯:在已有片段上改,而不是從零生成
上傳 3–60 秒參考視頻,用自然語言描述修改意圖——換背景、調光線、局部替換、風格微調等。Happy Horse 1.0 視頻編輯適合在保持整體結構的前提下修細節、做 A/B 版本或延長創意,可選 0–5 張參考圖輔助,並支持 auto / origin 等音頻策略。
- 參考視頻:長邊 ≤2160px,短邊 ≥320px,幀率 >8fps
- 一次聚焦一類修改(光線 / 背景 / 主體),成功率更高
- 需要保留原聲時選擇 origin,需要模型處理音頻選 auto
Happy Horse 1.0 更適合哪些創作場景?
如果你需要的不只是「能動的圖」,而是結構完整、物理可信、能拿去做提案或發佈的 1080p 視頻,Happy Horse 1.0 的四條鏈路會更對口——文生驗證創意、圖生激活主視覺、多圖參考鎖角色、視頻編輯修成片。
.png)
靈感在腦子裏,鏡頭卻拍不出來
Happy Horse 1.0 文生視頻適合把分鏡、情緒與運鏡先「演」一遍:公開競技場文生表現突出,能快速判斷故事是否成立,再決定是否投入實拍或三維。
常見問題
Happy Horse 1.0 是什麼?和阿里巴巴有什麼關係?
Happy Horse 1.0 是由阿里巴巴 ATH(Alibaba ATH)團隊研發的 AI 視頻生成模型,覆蓋文生視頻、圖生視頻、多圖參考與視頻編輯等能力。Yevideo 通過接口接入該模型,供你在瀏覽器工作臺直接體驗,無需自行部署 API。
爲什麼說 Happy Horse 1.0 在文生、圖生上很強?
在 Artificial Analysis Video Arena 等公開評測中,Happy Horse 1.0 在文生視頻、圖生視頻(無音頻)類別表現處於頭部,帶音頻類別也保持第一梯隊,說明其在提示詞驅動與圖像驅動兩條主鏈路上都具備競爭力。實際效果仍取決於提示質量、參考圖與鏡頭複雜度,建議用工作臺先短片段驗證。
Happy Horse 1.0 支持音頻和多語言嗎?
模型支持帶音頻的相關能力(具體以工作臺選項爲準);視頻編輯鏈路可選擇 auto / origin 等音頻策略。提示詞支持多語言輸入,中文、英文等均可使用,適合跨境內容與多地區版本短視頻。
和 Seedance 2.0、Veo 3.1 相比該怎麼選?
沒有「萬能最強」,只有更貼合任務。Happy Horse 1.0 在公開競技場文生/圖生(無音頻)表現突出,且強調運動穩定、物理合理與 1080p 多鏡頭;若你更看重某條廠商的原生音頻工作流或已有固定管線,可並行試生成對比。常見做法:同一分鏡用 Happy Horse 1.0 與備選模型各跑一版,按成片氣質與成本選型。
四種模式分別適合什麼場景?
文生視頻:從靈感/腳本起步;圖生視頻:主視覺已定、要補運動;多圖參考:IP、品牌或分鏡需要多張圖鎖定角色與風格;視頻編輯:已有成片要改細節或做變體。四條鏈路在 Yevideo 側邊欄與模式切換中均可直達。
在 Yevideo 使用 Happy Horse 1.0 如何計費?
按模型、分辨率與輸出秒數等綜合計價,生成前頁面會顯示預估積分。建議先用 720p、較短時長試方向,滿意後再升 1080p 或加長,控制試錯成本。
.webp)
.webp)
.webp)
.webp)
.png)
.png)
.png)