首页 > 教程攻略 > ai教程 >Midjourney V7全新版本正式发布,又一个言出法随的AI生图神器

Midjourney V7全新版本正式发布,又一个言出法随的AI生图神器

来源:互联网 时间:2026-06-12 07:15:19

还记得当年那个「不会PS寸步难行」的时代吗?现在这个曾经被视为职场必修课的技能,似乎已经陷入了「可学可不学」的尴尬境地。

Midjourney V7全新版本正式发布,又一个言出法随的AI生图神器

最新版本的Gemini就能玩出「言出法随」的效果,一句话就能改图,简直成了现象级的存在。GPT-4o的多模态生图功能上线后,生成的吉卜力风格图片更是在一夜之间席卷了整个网络。

面对这些新势力的崛起,老牌AI图像生成巨头Midjourney显然坐不住了,刚刚正式发布了最新版本V7。

我们先来梳理一下新版本的核心要点:

整体图像质量大幅提升,对于文字和图像提示的理解更加精准。身体、手部以及各种物体在细节上的一致性显著增强,人物肤色和面部细节更加自然清晰,材质纹理——比如羽毛、衣物——的质感表现更加精细,光影效果也更为逼真。

它能更好地理解并呈现提示词所描述的完整场景,元素之间的空间关系更加合理,背景与主体的融合度也更高。在视角表现上,低角度和特写等拍摄风格处理得相当专业。

不过,也有不尽如人意之处。氛围感和情感表达略弱一些,缺少了一些戏剧性和神秘感。在某些艺术风格的独特性和创意性上,也稍显不足。

需要特别注意的是,V7是首个默认启用模型个性化的版本。用户必须解锁个性化设置才能使用这个功能,整个过程大约需要5分钟,而且可以随时开关。

坦白说,我个人最关注的还是这个——V7的另一大亮点是「草稿模式」(Draft Mode)。这个模式的成本仅为标准模式的一半,但图像渲染速度却提升了10倍。在网页端使用的时候,提示栏会自动切换为「对话模式」,用户可以直接通过指令调整内容,比如把猫换成猫头鹰,或者把场景改成夜晚,系统会自动调整提示并生成新图像。

更令人兴奋的是,点击「草稿模式」并启用麦克风按钮后,用户还能进入「语音模式」,通过语音指令进行实时创作。如果需要明确运行草稿任务,可以在提示后添加「–draft」参数,这在排列组合或者重复生成等场景下特别好用。

Midjourney官方表示,「草稿模式」是迄今为止迭代创意的最佳方式。当你对草稿图像满意后,可以点击「增强」或「改变」按钮,以完整质量重新渲染。需要留意的是,草稿模式下的图像质量低于标准模式,但行为和美学表现高度一致,非常适合快速验证想法。

V7目前支持两种运行模式:Turbo和Relax。Turbo模式速度更快,但成本是普通V6作业的2倍;草稿模式成本减半。标准速度模式仍在优化中,预计不久后就会推出。

现阶段,放大、编辑和重新纹理功能会回退至V6模型,未来会逐步升级到V7。情绪板和SREF功能已经可用,后续更新将进一步提升性能。Midjourney团队透露,在未来60天内,每隔一到两周就会推出新功能,其中最受期待的就是全新的V7角色和对象引用系统。

话不多说,先来看图

知名博主@nickfloats分享了Midjourney V6和V7版本基于同一提示词生成的图片对比,我们来逐一看看。

Prompt:A young Indian woman with dark hair in an open ponytail and a black jacket stands on a university campus, looking directly at the camera. The image has a 1990s-style movie still aesthetic, with a close-up portrait on a sunny day.

(一位年轻的印度女性,黑色头发扎成松散的马尾,穿着黑色夹克,站在大学校园里,直视镜头。照片呈现出90年代电影剧照风格,背景是阳光明媚的一天,特写的肖像。)

左:V6 右:V7

新版本的光线更加自然,尤其是在人物脸部,肤色更加清晰,细节更加丰富,画面焦点也更加明确——特别是人物的发型部分。但说实话,也因此牺牲了一些氛围和情感的表达。

Prompt:A majestic barn owl perched on an ancient, moss-covered tree branch, surrounded by the misty forest. The scene is bathed in soft light filtering through the dense foliage, creating a magical and ethereal atmosphere. Photorealistic style with attention to detail of the feathers and textures.

(一只威严的仓鸮栖息在一根古老、覆盖着苔藓的树枝上,周围是迷雾缭绕的森林。柔和的光线透过浓密的树叶洒下,营造出一种神秘而飘渺的氛围。画面风格为逼真的写实风格,细致入微地展现了羽毛和树皮的质感。)

左:V6 右:V7

这组猫头鹰的对比图就特别有意思。V7版本的羽毛纹理细腻得令人惊叹,每一根羽毛的层次感和光影效果都处理得恰到好处,显得异常真实。猫头鹰的姿态也更自然,身体略微倾斜,显得更有动态感,眼睛的细节也更生动,传递出一种警惕的神态。

简而言之,鱼和熊掌不可兼得。V7在追求真实感的目标上更胜一筹,而V6则可能在追求画面冲击力和神秘感上更具优势。

Prompt:A person's hand points towards the window of an airplane, which is seen from inside with its wing visible in profile. The sky outside shows a clear horizon at dawn or dusk. In front of them lies a vast expanse of ocean.

(一个人的手指向飞机窗外,窗外的飞机机翼从侧面可见。外面的天空清晰,天际线显示出黎明或黄昏的景象。眼前是广阔的海洋。)

左:V6 右:V7

同样都是从飞机舷窗向外看的情景,一只手指向窗外。V7的进步肉眼可见——通过加入飞机机翼的元素,极大地增加了画面的层次感和真实感,让人更能感受到身处飞机内部的视角。

Prompt:A close-up of broccoli being sautéed in oil, with the vegetable's green florets contrasting against a dark brown sauce. A large spoon is partially visible inside a stainless steel pot filled with caramelized and shiny black glaze on top, against a white…

(一块近距离拍摄的西兰花在油中翻炒,绿意盎然的花椰菜与深棕色的酱汁形成鲜明对比。一只大汤勺部分可见,放在一个不锈钢锅中,锅里覆盖着一层焦糖色的光泽黑色酱汁,背景是白色的…)

左:V6 右:V7

V6虽然通过特写镜头突出了酱汁和勺子,焦点非常明确,注意力很容易被吸引到酱汁的质感和细节上。但如果从提示词的要求出发,新版本展示了整个锅内的西兰花和酱汁的搭配,呈现了一个更完整的烹饪场景,逻辑上更符合实际烹饪过程。

Prompt:Close-up of an anime woman's face with a shocked expression, dark hair, in the anime style. Colorful animation stills, close-up intensity, soft lighting, low-angle camera view, and high detail.

(一位动漫女性的面部特写,表情震惊,黑色头发,呈现动漫风格。色彩丰富的动画画面,特写镜头强烈,柔和的光线,低角度拍摄,细节非常精致。)

左:V6 右:V7

在光影和色彩的处理上,V7也完全符合提示词中的「soft lighting」要求。脸部的高光和阴影过渡更加柔和自然,尤其是眼部和脸颊的光影分布,营造出更立体的效果。

Prompt:A dynamic film still of an epic space battle with sleek starfighters zooming past a massive space station, lasers firing, and a distant planet visible in the backdrop.

(一幅动态的电影画面,展示了一场史诗般的太空战斗,流线型的星际战斗机飞驰而过,巨大的太空站在一旁,激光四射,远处的行星清晰可见,构成了一幅震撼的画面。)

左:V6 右:V7

人像方面,V7在细节的精细度和真实感(服装、皮肤、光影等)上有了明显提升,人物的立体感和与背景的融合度更高。但在情感传递、表情的戏剧性、动态感上,却有些倒退。

以下为三个具体的对比案例:

Prompt:1980s mystery film, low-angle shot of an evil-eyed French Butler sporting a black suit and grasping a candle in the hallway of a creepy Victorian mansion with musty decor. The warm candle glow evokes a spooky sense of mystery

(一张1980年代神秘电影风格的低角度镜头,拍摄了一位邪恶眼神的法国管家,身穿黑色西装,手中握着一支蜡烛,站在一座装饰陈旧、充满霉味的维多利亚式大厦走廊里。温暖的烛光营造出一种阴森神秘的氛围。)

左:V6 右:V7

Prompt:1990s medium-full street style fashion photo shot on Kodak 500T capturing a rugged 50-year-old man with curly gray hair, 5-o'clock shadow, and a stern look walking down the sidewalk on a bright spring morning in Paris. He's wearing …

(一张1990年代中等全身街头风格的照片,使用Kodak 500T胶片拍摄,捕捉到一位五十多岁的男子,他有着卷曲的灰白色头发、胡茬和严肃的表情,正走在巴黎春日明媚的早晨人行道上。他穿着…)

左:V6 右:V7

Prompt:Cinematic, off-center, two-shot, 35mm film still of a 30-year-old french man, curly brown hair and a stained beige polo sweater, reading a book to his adorable 5-year-old daughter, wearing fuzzy pink pajamas, sitting in a cozy corner nook…

(一张电影感的35毫米胶片画面,构图偏离中心,拍摄了一位30岁的法国男子,卷曲的棕色头发,穿着一件弄脏的米色polo衫,正在给他可爱的5岁女儿读书。女儿穿着柔软的粉色睡衣,坐在一个温馨的角落里。)

左:V6 右:V7

下面这张由@tanvitabs用V7生成的图片,则几乎把AI图像生成的常见问题都踩了一遍:凭空多出来的第三只手、T恤和西装着装上的混淆,以及不匹配的面部生成等。

下面是基于同一提示词生成的四张照片,你更喜欢哪个版本?

Prompt:Elegant female model standing by a large window in a sunlit room, soft morninglight casting natural highlights and shadows on her face, wearing a flowing beigedress, relaxed pose, minimal makeup, 85mm lens depth of field, lifestyle fashioneditorial, cinematic tones, airy atmosphere

(一位优雅的女性模特站在阳光洒进的房间大窗旁,柔和的晨光在她的脸上投下自然的高光与阴影,身穿一袭飘逸的米色长裙,姿势放松,妆容简约。使用85mm镜头拍摄,背景有着浅景深,营造出生活方式时尚编辑感,画面呈现电影般的色调,空气感十足。)

过去几年,AI图像生成的主旋律就是追求真实、杜绝「油腻感」。去年,Flux因生成超真实人像而一举破圈,声名大噪。现在,Midjourney V7接过接力棒,以更丰富的细节、更有层次感的光影、更自然的肤质纹理,再次将「真实」推向新的高度。

但追求真实,真的就是一切的终点吗?

最近,随着GPT-4o多模态生图功能的发布,吉卜力风格的图片几乎在一夜之间点燃了网络,也像一阵春风吹进了AI图像生成的世界。技术选择的可能性变多了,创作的玩法也跟着变了。用更通俗的话来说,现在就好比站在厨房里,你是想做一顿踏踏实实的家常菜,还是想整点黑暗料理,全然在你。

相关下载