首页 > 教程攻略 > 热点新闻 >阿里巴巴视频生成模型升级至HappyHorse 1.1，五大维度能力提升

阿里巴巴视频生成模型升级至HappyHorse 1.1，五大维度能力提升

来源：互联网时间：2026-06-27 20:18:38

阿里巴巴旗下视频生成模型HappyHorse迎来重要版本更新，正式发布1.1版本。此次升级聚焦于动态表现力、主体一致性、指令遵循、视觉质感及音频能力五大核心维度，旨在系统性提升AI视频生成的质量与可控性。

新版本已同步上线HappyHorse官方网站、阿里云百炼平台及千问云服务，供用户直接体验。在基础技术规格上，HappyHorse 1.1保持了与上一版本的一致性，单次可生成时长为3至15秒的视频，支持720p与1080p分辨率，并允许自由宽高比设置。

在动态表现方面，新版本通过优化运动建模与时序一致性算法，显著提升了复杂动作场景的生成质量。

模型解决了此前部分画面动作迟缓、节奏感不足的问题

，使得人物与物体的运动更加流畅自然，视觉张力与力量感得到加强。

主体一致性是多图参考生视频功能的关键。HappyHorse 1.1强化了对多源参考素材的理解与融合能力，在商品细节与品牌元素还原、角色与场景的灵活组合、多分镜理解等方面表现更为精准，确保了生成视频与参考素材间的高度一致性。

模型在指令遵循能力上实现了重要升级。通过强化长上下文语义理解、场景规划及角色关系建模，

，并稳定完成多场景、多角色的连贯镜头编排与叙事演绎。

视觉呈现质量的提升尤为明显。新版本优化了人物细节生成与真实肤质还原，降低了过度锐化、油光感和涂抹感，使皮肤呈现更自然的质感。同时，模型在保留真实面部特征的基础上，避免了细节的过度放大，增强了人物特写镜头的表现力，并对正反打、跟拍等专业镜头语言的理解更为深入。

音频表达能力是此次升级的另一亮点。模型优化了音频理解与生成能力，提升了音画同步的精度。生成视频中的台词表达更加自然，语速、停顿能根据场景动态调整；对背景音乐、环境音效等声音元素的控制也更符合创作意图，减少了无关音效干扰。

伴随新版本发布，官方宣布联合虎鲸文娱集团启动“Horsepower”AI影像大赛。优胜者将获得价值百万的商业订单合作机会，并由著名导演、制片人张纪中等业内专家担任评委，面向海内外AIGC创开放报名。