电影级视频画面表现

产品特写更像真实广告片

眼神与神态细腻自然真实

精美的动画视频制作

Yevideo 灵感

Alibaba ATH · Happy Horse 1.0

Happy Horse 1.0：文生、图生皆强的新一代 AI 视频模型

Happy Horse 1.0 由阿里巴巴 ATH 团队研发，是 2026 年 AI 视频领域最受关注的新模型之一：文生视频（Text-to-Video）与图生视频（Image-to-Video）在 Artificial Analysis Video Arena 公开评测中表现亮眼——无音频类别下，文生与图生均位居前列，带音频类别同样保持第一梯队。除生成能力外，它还支持多图参考引导、对已有片段的视频编辑、原生 1080p 与多镜头叙事，并兼顾音频输出与多语言创作。在 Yevideo，你可以用同一套工作台，把 Happy Horse 1.0 的四条链路从试创意一直做到可展示的 1080p 样片。

人物表情细腻真实：眼神、嘴角与情绪都「演」得出来

很多 AI 视频一到近景就露馅：表情僵硬、眼神发直、情绪像贴上去的。Happy Horse 1.0 在文生视频里对人物面部刻画更下功夫——微表情、视线方向、嘴角弧度与眉间张力能在动态中保持连贯，更接近真人表演而非「会动的假脸」。写提示时不妨点明情绪层次（克制、惊讶、苦笑、压抑后的释放）和镜头距离（特写抓眼神、中景看肢体），Happy Horse 1.0 更容易把人物拍得细腻、可信，适合对白戏、情绪短片与需要「看得懂脸」的广告镜头。

适合人物特写、对白戏、情绪向剧情与需要「看得懂脸」的品牌片
提示词写清情绪与神态（眼神、嘴角、呼吸感），比只写「很好看」更有效

运动流畅、观感真实，更贴近真实世界的物理规律

Happy Horse 1.0 图生视频的重点不在「随便动起来」，而在动得顺、动得像：人物转身、迈步、挥手时，肢体衔接更连贯，少出现卡顿、跳帧或关节「折返」；物体下落、碰撞、液体泼溅、布料飘动等，也更尊重重力、惯性与接触关系，减少违背常识的穿帮。Happy Horse 1.0 会在保留原图气质的前提下，把动作落实得更自然。

运动流畅：时序连贯，复杂动作少僵硬、少「一帧一卡」的割裂感
物理可信：重力、惯性、碰撞与接触更合理，液体、布料、刚体少飘、少穿模
仍保留参考图气质：构图与主体轮廓站得住，文字侧重「怎么动」而非重复画面描述

借助 Happy Horse 1.0，让图生视频创作焕发生机

Happy Horse 1.0 图生视频会把静态视觉转化为可播放的动态内容，同时让原图在成片里保持核心地位：构图、气质与主体轮廓站得住，目标是「让画面活起来」，而不是被模型替换成另一张图。人物肖像、产品特写或风格化海报一旦加入合理的运动与镜头，就更容易抓住注意力——尤其适合需要保留原始视觉、又希望内容更适配视频优先投放的创作者。在 Yevideo 上传首帧即可开跑，配合 720p / 1080p 与多种画幅，把已有主视觉快速扩展成可展示的动态样片。

原图仍是主角：动的是画面与镜头，不是「换脸」或「换产品」
适合人物肖像、电商主图、品牌 KV 与 IP 定妆等已有强视觉的素材
提示词侧重运动方向、幅度与节奏，避免重复画面里已经写明的信息

多图参考 + 多语言：用 character1/2… 精细控角色，面向全球受众

当一张图不足以表达 IP 设定或品牌手册时，Happy Horse 1.0 支持上传 1–9 张参考图，并在提示词中用 character1、character2 等指代对应角色，让成片更贴近期望的人设、服装与场景走向。参考图顺序即角色编号，建议用 720p 以上、短边 ≥400px 的清晰素材。与此同时，Happy Horse 1.0 面向多语言创作场景：中文、英文等提示均可驱动生成，适合跨境广告、多地区版本短视频与国际化产品演示——同一套视觉逻辑，换语言即可快速出不同市场版本。

多图参考适合 IP 短片、系列广告、需要统一世界观的项目
提示词可中英混写，关键是主体与动作指代一致
需要更强可控性时，优先用参考图锁外观，文字写运动与镜头

文生视频 · Happy Horse 1.0

文生视频：从文字概念到可播放镜头

无需参考图，直接用提示词生成 3–15 秒动态视频。Happy Horse 1.0 文生视频适合故事叙述、视觉构思、营销策划与短视频——当创意还停在文字阶段，这是把概念「演」出来最快的方式。支持 720p / 1080p 与多种画幅，并可配合音频相关能力（视工作台选项而定）。

提示词写清：谁 / 在哪 / 做什么 / 什么氛围 / 镜头怎么动
公开竞技场文生（无音频）表现处于头部，适合比稿与方向验证
先用短时长、低分辨率试气质，满意再升 1080p

图生视频 · Happy Horse 1.0

图生视频：一张首帧图，生成连贯动态

上传单张首帧图（JPEG / PNG / WebP），Happy Horse 1.0 在保持原图气质的前提下补全运动。公开竞技场图生（无音频）同样表现亮眼，适合角色动画、产品展示与风格化场景——核心诉求是「动起来」，而不是「变成另一张图」。

仅需 1 张首帧图；主体突出、边缘干净更易成功
文字描述运动方向、幅度与节奏，避免与画面信息重复
分辨率 720p / 1080p，时长 3–15 秒可调

多图参考 · Happy Horse 1.0

多图参考生视频：1–9 张图引导角色与风格

上传 1–9 张参考图，在提示词中用 character1、character2… 对应数组顺序，精确控制多角色同框、服装与场景元素。当目标是让视频更贴品牌手册、分镜板或 IP 设定时，Happy Horse 1.0 多图参考比单图模式更可控，成片与原素材一致性更高。

参考图顺序 = character 编号，提示词中指代要一致
建议清晰大图，避免模糊、强压缩的小图
复杂互动先写清主次，再逐步加强运动

视频编辑 · Happy Horse 1.0

视频编辑：在已有片段上改，而不是从零生成

上传 3–60 秒参考视频，用自然语言描述修改意图——换背景、调光线、局部替换、风格微调等。Happy Horse 1.0 视频编辑适合在保持整体结构的前提下修细节、做 A/B 版本或延长创意，可选 0–5 张参考图辅助，并支持 auto / origin 等音频策略。

参考视频：长边 ≤2160px，短边 ≥320px，帧率 >8fps
一次聚焦一类修改（光线 / 背景 / 主体），成功率更高
需要保留原声时选择 origin，需要模型处理音频选 auto

在 Yevideo 工作台选择 Happy Horse 1.0，即可体验文生、图生、多图参考与视频编辑四条链路。

Happy Horse 1.0 更适合哪些创作场景？

如果你需要的不只是「能动的图」，而是结构完整、物理可信、能拿去做提案或发布的 1080p 视频，Happy Horse 1.0 的四条链路会更对口——文生验证创意、图生激活主视觉、多图参考锁角色、视频编辑修成片。

灵感在脑子里，镜头却拍不出来

Happy Horse 1.0 文生视频适合把分镜、情绪与运镜先「演」一遍：公开竞技场文生表现突出，能快速判断故事是否成立，再决定是否投入实拍或三维。

常见问题

Happy Horse 1.0 是什么？和阿里巴巴有什么关系？

Happy Horse 1.0 是由阿里巴巴 ATH（Alibaba ATH）团队研发的 AI 视频生成模型，覆盖文生视频、图生视频、多图参考与视频编辑等能力。Yevideo 通过接口接入该模型，供你在浏览器工作台直接体验，无需自行部署 API。

为什么说 Happy Horse 1.0 在文生、图生上很强？

在 Artificial Analysis Video Arena 等公开评测中，Happy Horse 1.0 在文生视频、图生视频（无音频）类别表现处于头部，带音频类别也保持第一梯队，说明其在提示词驱动与图像驱动两条主链路上都具备竞争力。实际效果仍取决于提示质量、参考图与镜头复杂度，建议用工作台先短片段验证。

Happy Horse 1.0 支持音频和多语言吗？

模型支持带音频的相关能力（具体以工作台选项为准）；视频编辑链路可选择 auto / origin 等音频策略。提示词支持多语言输入，中文、英文等均可使用，适合跨境内容与多地区版本短视频。

和 Seedance 2.0、Veo 3.1 相比该怎么选？

没有「万能最强」，只有更贴合任务。Happy Horse 1.0 在公开竞技场文生/图生（无音频）表现突出，且强调运动稳定、物理合理与 1080p 多镜头；若你更看重某条厂商的原生音频工作流或已有固定管线，可并行试生成对比。常见做法：同一分镜用 Happy Horse 1.0 与备选模型各跑一版，按成片气质与成本选型。

四种模式分别适合什么场景？

文生视频：从灵感/脚本起步；图生视频：主视觉已定、要补运动；多图参考：IP、品牌或分镜需要多张图锁定角色与风格；视频编辑：已有成片要改细节或做变体。四条链路在 Yevideo 侧边栏与模式切换中均可直达。

在 Yevideo 使用 Happy Horse 1.0 如何计费？

按模型、分辨率与输出秒数等综合计价，生成前页面会显示预估积分。建议先用 720p、较短时长试方向，满意后再升 1080p 或加长，控制试错成本。

AI 视频模型

AI 图片模型