阿里巴巴视频生成模型升级至HappyHorse 1.1,五大维度能力提升
阿里巴巴旗下视频生成模型HappyHorse迎来重要版本更新,正式发布1.1版本。此次升级聚焦于动态表现力、主体一致性、指令遵循、视觉质感及音频能力五大核心维度,旨在系统性提升AI视频生成的质量与可控性。

新版本已同步上线HappyHorse官方网站、阿里云百炼平台及千问云服务,供用户直接体验。在基础技术规格上,HappyHorse 1.1保持了与上一版本的一致性,单次可生成时长为3至15秒的视频,支持720p与1080p分辨率,并允许自由宽高比设置。
动态表现与主体一致性显著增强
在动态表现方面,新版本通过优化运动建模与时序一致性算法,显著提升了复杂动作场景的生成质量。
模型解决了此前部分画面动作迟缓、节奏感不足的问题
主体一致性是多图参考生视频功能的关键。HappyHorse 1.1强化了对多源参考素材的理解与融合能力,在商品细节与品牌元素还原、角色与场景的灵活组合、多分镜理解等方面表现更为精准,确保了生成视频与参考素材间的高度一致性。
指令理解与视觉质感全面优化
模型在指令遵循能力上实现了重要升级。通过强化长上下文语义理解、场景规划及角色关系建模,
HappyHorse 1.1能够更准确地解析复杂Prompt
视觉呈现质量的提升尤为明显。新版本优化了人物细节生成与真实肤质还原,降低了过度锐化、油光感和涂抹感,使皮肤呈现更自然的质感。同时,模型在保留真实面部特征的基础上,避免了细节的过度放大,增强了人物特写镜头的表现力,并对正反打、跟拍等专业镜头语言的理解更为深入。
音频能力升级与生态活动启动
音频表达能力是此次升级的另一亮点。模型优化了音频理解与生成能力,提升了音画同步的精度。生成视频中的台词表达更加自然,语速、停顿能根据场景动态调整;对背景音乐、环境音效等声音元素的控制也更符合创作意图,减少了无关音效干扰。
伴随新版本发布,官方宣布联合虎鲸文娱集团启动“Horsepower”AI影像大赛。优胜者将获得价值百万的商业订单合作机会,并由著名导演、制片人张纪中等业内专家担任评委,面向海内外AIGC创开放报名。