海螺AI悄悄上线的这个新功能,我愿称为一致性的新王。
早上起床,发现海螺AI视频又悄悄搞了个大动作——上线了一个叫“主体参考”的新功能。官方的描述很简单:Upload a photo, describe the scene - watch your character star in any scene。翻译过来就是:一张照片加一段描述,让角色出演任意场景。这架势,显然剑指“取代”演员这个目标。
人物参考,这个功能大概率会成为AI视频未来的标配。它不仅是解决角色一致性问题的重要一步,更是AI向影视行业真正进军的关键路径。X(原推特)上的老外们已经彻底玩疯了,各种创意案例让人目不暇接。
比如有人用同一张脸,在不同服装、不同场景和不同剧情里进行了测试——效果稳定得惊人。不只是真人,3D角色的表现也相当出色,甚至连动物都能hold住。
目前这个功能应该已经全量推送了,登录海螺AI后,进入AI视频生成页面,模型标签栏里选择【主体参考】(海外版叫【Subject Reference】)。操作流程简单到只剩两步:

第一步:点击【添加参考角色】,会弹出一个角色库。上传图片即可,JPG、PNG都行,只要海螺能识别出人脸。所有上传的角色都会自动保存在角色库里,下次复用直接取用,非常方便。

第二步:在【添加参考角色】下方编写Prompt。强烈建议开启海螺自带的提示词优化功能(点那个笔形的icon),这样生成效果会好很多,对新手特别友好。

传好人脸、写好Prompt,直接点击生成,等着跑出视频即可。有人试了几个好玩的案例,比如给科技圈大佬来了一波“经典皮肤互换”:让库克穿上周老板的红色Polo衫——味道很对;给黄仁勋换上黑色高领——瞬间有了乔布斯当年那股劲儿;再让奥特曼穿上皮衣为英伟达站台……场面一度非常欢乐。
经过大量测试,总结下来核心感受就是:
人脸稳定性和一致性极强,加上无与伦比的情绪表演能力
一、一致性
首先最关键的一点:给谁的照片,生成的视频里就是谁的样子,不会突然变成另一个人。玩过AI视频的都知道,人脸不稳定有多让人崩溃。同一个Prompt,今天生成的是A,明天生成的是B,后天又换了人。尤其是想拍个完整剧情时,前后两个镜头主角的脸对不上,观众直接出戏。有业内人士曾在拍短视频时,光调人脸一致性就折腾了整整三天。而现在,这个痛点被彻底解决了。
比如测试中的一个案例:老人面部的皱纹纹路、神态细节,在转头时依然稳定得不行,几乎不带跑偏。面部彩绘也能完美保持——比如小丑的案例,虽然肢体和杂耍球的动态稍微有点瑕疵,但脸部的复杂妆面和细节几乎没丢。
还有一个很有意思的玩法:只需要一张照片加一个Prompt,就能看到演员“增重”的效果。这种效果在传统电影制作中,得上CG和特效化妆折腾半天,现在写个Prompt的功夫就搞定。
二、连续性
除了人脸稳定,同个视频里的人脸也必须保持连续。不能角色转个头、低个头,就突然变成另一个人。测试让角色连贯展示多个面部角度——转头、抬头、低头——结果令人印象深刻。只用一张照片就能达到这种效果,确实厉害。
再比如一个测试:让角色先戴上墨镜,说话,然后突然摘下来。这个衔接非常丝滑,墨镜遮挡前后的五官细节一点都没变形。
三、表情演出
海螺AI的人物表情细节和真实感,一直被认为是目前所有AI视频模型中做得最好的。这次的S2V模型也继承了情绪表演的优良传统——虽然整体感觉不如T2V和I2V的表现力强,但在同类人脸参考模型里,已经非常出色了。测试中可以看到,同一个角色从喜怒到哀乐,情绪转换非常自然。
有了这个功能,未来拍视频说不定真能省下一大笔演员费。一张照片就能当演员,拍出属于自己的一部“大片”,从此不再只是幻想。X上已经有不少人用自己照片玩起了穿越:科幻片、动作片、文艺片……风格五花八门,堪称“重生之我是好莱坞巨星”。
有人很喜欢电影《瞬息全宇宙》里那段经典剪辑——杨紫琼在不同平行宇宙间快速切换,短短几秒体验十几种人生,非常酷。于是,有人用自己的证件照搞了个“多元宇宙”之旅:在《加勒比海盗》里征服大海,在《哈利·波特》里怼伏地魔,在某部韩剧里当霸总,在《赛博朋克2077》里勇闯夜之城,在《007》里搞定“Mission Impossible”,在《飞驰人生》里挑战自我,甚至在《蝙蝠侠》里守护哥谭市……这感觉,太喜欢了。
当然,海螺AI的人物参考功能并非完美无缺。首先,整体还是需要“抽卡”,大概跑个三四次才能roll出比较好的效果。其次,肢体动作方面:安静状态和小幅度动作都很稳,但舞蹈、蹦跳这类大幅度动作,确实还有进步空间。除此之外的缺点就不多了——瑕不掩瑜。
从2023年到现在,一路看着AI视频从最初的PPT质感,发展到现在逼近真实的效果。曾经崩得不行的“吃面”问题早已被攻克,情绪表演方面海螺已经做得相当出色。舞蹈之类的大动作,可灵1.6也已经把天花板打得很高,越来越稳定。再加上这次的人物参考功能,视频的可控性又上了一个台阶。
AI生成内容的头顶一直有三朵乌云:风格一致性、人物一致性、场景一致性
庄子在《逍遥游》里说鲲鹏,翅膀遮天蔽日,能凌空九万&里。这一次,我们每一个人都是那只鲲鹏。工具已经摆在眼前,只待你脑海里的故事。每个人都可以成为导演,而AI,正等待你的第一声“Action”。