電影級視頻畫面表現

產品特寫更像真實廣告片

眼神與神態細膩自然真實

精美的動畫視頻製作

Yevideo 靈感

Alibaba ATH · Happy Horse 1.0

Happy Horse 1.0：文生、圖生皆強的新一代 AI 視頻模型

Happy Horse 1.0 由阿里巴巴 ATH 團隊研發，是 2026 年 AI 視頻領域最受關注的新模型之一：文生視頻（Text-to-Video）與圖生視頻（Image-to-Video）在 Artificial Analysis Video Arena 公開評測中表現亮眼——無音頻類別下，文生與圖生均位居前列，帶音頻類別同樣保持第一梯隊。除生成能力外，它還支持多圖參考引導、對已有片段的視頻編輯、原生 1080p 與多鏡頭敘事，併兼顧音頻輸出與多語言創作。在 Yevideo，你可以用同一套工作臺，把 Happy Horse 1.0 的四條鏈路從試創意一直做到可展示的 1080p 樣片。

人物表情細膩真實：眼神、嘴角與情緒都「演」得出來

很多 AI 視頻一到近景就露餡：表情僵硬、眼神發直、情緒像貼上去的。Happy Horse 1.0 在文生視頻裏對人物面部刻畫更下功夫——微表情、視線方向、嘴角弧度與眉間張力能在動態中保持連貫，更接近真人表演而非「會動的假臉」。寫提示時不妨點明情緒層次（剋制、驚訝、苦笑、壓抑後的釋放）和鏡頭距離（特寫抓眼神、中景看肢體），Happy Horse 1.0 更容易把人物拍得細膩、可信，適合對白戲、情緒短片與需要「看得懂臉」的廣告鏡頭。

適合人物特寫、對白戲、情緒向劇情與需要「看得懂臉」的品牌片
提示詞寫清情緒與神態（眼神、嘴角、呼吸感），比只寫「很好看」更有效

運動流暢、觀感真實，更貼近真實世界的物理規律

Happy Horse 1.0 圖生視頻的重點不在「隨便動起來」，而在動得順、動得像：人物轉身、邁步、揮手時，肢體銜接更連貫，少出現卡頓、跳幀或關節「折返」；物體下落、碰撞、液體潑濺、布料飄動等，也更尊重重力、慣性與接觸關係，減少違背常識的穿幫。Happy Horse 1.0 會在保留原圖氣質的前提下，把動作落實得更自然。

運動流暢：時序連貫，複雜動作少僵硬、少「一幀一卡」的割裂感
物理可信：重力、慣性、碰撞與接觸更合理，液體、布料、剛體少飄、少穿模
仍保留參考圖氣質：構圖與主體輪廓站得住，文字側重「怎麼動」而非重複畫面描述

藉助 Happy Horse 1.0，讓圖生視頻創作煥發生機

Happy Horse 1.0 圖生視頻會把靜態視覺轉化爲可播放的動態內容，同時讓原圖在成片裏保持核心地位：構圖、氣質與主體輪廓站得住，目標是「讓畫面活起來」，而不是被模型替換成另一張圖。人物肖像、產品特寫或風格化海報一旦加入合理的運動與鏡頭，就更容易抓住注意力——尤其適合需要保留原始視覺、又希望內容更適配視頻優先投放的創作者。在 Yevideo 上傳首幀即可開跑，配合 720p / 1080p 與多種畫幅，把已有主視覺快速擴展成可展示的動態樣片。

原圖仍是主角：動的是畫面與鏡頭，不是「換臉」或「換產品」
適合人物肖像、電商主圖、品牌 KV 與 IP 定妝等已有強視覺的素材
提示詞側重運動方向、幅度與節奏，避免重複畫面裏已經寫明的信息

多圖參考 + 多語言：用 character1/2… 精細控角色，面向全球受衆

當一張圖不足以表達 IP 設定或品牌手冊時，Happy Horse 1.0 支持上傳 1–9 張參考圖，並在提示詞中用 character1、character2 等指代對應角色，讓成片更貼近期望的人設、服裝與場景走向。參考圖順序即角色編號，建議用 720p 以上、短邊 ≥400px 的清晰素材。與此同時，Happy Horse 1.0 面向多語言創作場景：中文、英文等提示均可驅動生成，適合跨境廣告、多地區版本短視頻與國際化產品演示——同一套視覺邏輯，換語言即可快速出不同市場版本。

多圖參考適合 IP 短片、系列廣告、需要統一世界觀的項目
提示詞可中英混寫，關鍵是主體與動作指代一致
需要更強可控性時，優先用參考圖鎖外觀，文字寫運動與鏡頭

文生視頻 · Happy Horse 1.0

文生視頻：從文字概念到可播放鏡頭

無需參考圖，直接用提示詞生成 3–15 秒動態視頻。Happy Horse 1.0 文生視頻適合故事敘述、視覺構思、營銷策劃與短視頻——當創意還停在文字階段，這是把概念「演」出來最快的方式。支持 720p / 1080p 與多種畫幅，並可配合音頻相關能力（視工作臺選項而定）。

提示詞寫清：誰 / 在哪 / 做什麼 / 什麼氛圍 / 鏡頭怎麼動
公開競技場文生（無音頻）表現處於頭部，適合比稿與方向驗證
先用短時長、低分辨率試氣質，滿意再升 1080p

圖生視頻 · Happy Horse 1.0

圖生視頻：一張首幀圖，生成連貫動態

上傳單張首幀圖（JPEG / PNG / WebP），Happy Horse 1.0 在保持原圖氣質的前提下補全運動。公開競技場圖生（無音頻）同樣表現亮眼，適合角色動畫、產品展示與風格化場景——核心訴求是「動起來」，而不是「變成另一張圖」。

僅需 1 張首幀圖；主體突出、邊緣乾淨更易成功
文字描述運動方向、幅度與節奏，避免與畫面信息重複
分辨率 720p / 1080p，時長 3–15 秒可調

多圖參考 · Happy Horse 1.0

多圖參考生視頻：1–9 張圖引導角色與風格

上傳 1–9 張參考圖，在提示詞中用 character1、character2… 對應數組順序，精確控制多角色同框、服裝與場景元素。當目標是讓視頻更貼品牌手冊、分鏡板或 IP 設定時，Happy Horse 1.0 多圖參考比單圖模式更可控，成片與原素材一致性更高。

參考圖順序 = character 編號，提示詞中指代要一致
建議清晰大圖，避免模糊、強壓縮的小圖
複雜互動先寫清主次，再逐步加強運動

視頻編輯 · Happy Horse 1.0

視頻編輯：在已有片段上改，而不是從零生成

上傳 3–60 秒參考視頻，用自然語言描述修改意圖——換背景、調光線、局部替換、風格微調等。Happy Horse 1.0 視頻編輯適合在保持整體結構的前提下修細節、做 A/B 版本或延長創意，可選 0–5 張參考圖輔助，並支持 auto / origin 等音頻策略。

參考視頻：長邊 ≤2160px，短邊 ≥320px，幀率 >8fps
一次聚焦一類修改（光線 / 背景 / 主體），成功率更高
需要保留原聲時選擇 origin，需要模型處理音頻選 auto

在 Yevideo 工作臺選擇 Happy Horse 1.0，即可體驗文生、圖生、多圖參考與視頻編輯四條鏈路。

Happy Horse 1.0 更適合哪些創作場景？

如果你需要的不只是「能動的圖」，而是結構完整、物理可信、能拿去做提案或發佈的 1080p 視頻，Happy Horse 1.0 的四條鏈路會更對口——文生驗證創意、圖生激活主視覺、多圖參考鎖角色、視頻編輯修成片。

靈感在腦子裏，鏡頭卻拍不出來

Happy Horse 1.0 文生視頻適合把分鏡、情緒與運鏡先「演」一遍：公開競技場文生表現突出，能快速判斷故事是否成立，再決定是否投入實拍或三維。

常見問題

Happy Horse 1.0 是什麼？和阿里巴巴有什麼關係？

Happy Horse 1.0 是由阿里巴巴 ATH（Alibaba ATH）團隊研發的 AI 視頻生成模型，覆蓋文生視頻、圖生視頻、多圖參考與視頻編輯等能力。Yevideo 通過接口接入該模型，供你在瀏覽器工作臺直接體驗，無需自行部署 API。

爲什麼說 Happy Horse 1.0 在文生、圖生上很強？

在 Artificial Analysis Video Arena 等公開評測中，Happy Horse 1.0 在文生視頻、圖生視頻（無音頻）類別表現處於頭部，帶音頻類別也保持第一梯隊，說明其在提示詞驅動與圖像驅動兩條主鏈路上都具備競爭力。實際效果仍取決於提示質量、參考圖與鏡頭複雜度，建議用工作臺先短片段驗證。

Happy Horse 1.0 支持音頻和多語言嗎？

模型支持帶音頻的相關能力（具體以工作臺選項爲準）；視頻編輯鏈路可選擇 auto / origin 等音頻策略。提示詞支持多語言輸入，中文、英文等均可使用，適合跨境內容與多地區版本短視頻。

和 Seedance 2.0、Veo 3.1 相比該怎麼選？

沒有「萬能最強」，只有更貼合任務。Happy Horse 1.0 在公開競技場文生/圖生（無音頻）表現突出，且強調運動穩定、物理合理與 1080p 多鏡頭；若你更看重某條廠商的原生音頻工作流或已有固定管線，可並行試生成對比。常見做法：同一分鏡用 Happy Horse 1.0 與備選模型各跑一版，按成片氣質與成本選型。

四種模式分別適合什麼場景？

文生視頻：從靈感/腳本起步；圖生視頻：主視覺已定、要補運動；多圖參考：IP、品牌或分鏡需要多張圖鎖定角色與風格；視頻編輯：已有成片要改細節或做變體。四條鏈路在 Yevideo 側邊欄與模式切換中均可直達。

在 Yevideo 使用 Happy Horse 1.0 如何計費？

按模型、分辨率與輸出秒數等綜合計價，生成前頁面會顯示預估積分。建議先用 720p、較短時長試方向，滿意後再升 1080p 或加長，控制試錯成本。

AI 視頻模型

AI 圖片模型