Krea 2 - Krea AI 推出首个从零训练的基础图像生成模型
来源:互联网
时间:2026-06-28 14:26:13
Krea 2是什么
先简单说几个关键判断——Krea 2是Krea AI推出的第一个从零开始训练的基础图像生成模型,它的定位非常明确:
美学优先
RAW
Turbo
Krea 2的主要功能
- :上传一张或多张参考图,模型能提取里面的视觉风格,然后应用到新生成的图像上。你可以单独调节每张参考图的影响强度,甚至把多种风格混合在一起。
风格迁移(Style Transfer)
- :上传一组共享同一创意方向的图片,Krea 2会理解这组图整体的色调、纹理、氛围和构图意图。哪怕你只给了简单的提示词,它也能输出风格高度一致的结果。
Moodboards(情绪板)
- :四档控制,分别是
创意参数(Creativity)
(严格遵循提示词)、Raw
(接近提示词)、Low
(平衡,也是默认选项)、Medium
(模型会自主添加美学深度、优化构图和视觉丰富度)。High
- :从文本提示词生成高质量图像。RAW模型最高支持1K分辨率,Turbo模型则支持1K到2K分辨率。
文生图(Text-to-Image)
- :配合Krea Edit功能,可以进行区域级的图像编辑、场景重打光、外扩(Outpainting),不需要为了改一个小地方就把整张图重新生成。
图生图 / 图像编辑
- :在RAW基础模型上训练LoRA,然后在Turbo蒸馏模型上运行推理。这个设计兼顾了自定义能力和生成速度。
LoRA 训练与推理
- :直接用自然语言描述图像处理流程,系统会自动帮你组装处理图,省去了手动配置复杂参数的麻烦。
Krea Nodes 工作流
如何使用Krea 2
- :访问krea.ai,在界面里选择Krea 2模型,输入文本提示词,上传风格参考图或Moodboards,调节Creativity参数(Raw/Low/Medium/High),点击生成就行。
网页端直接使用
- :克隆GitHub仓库
本地部署(RAW 模型)
krea-ai/krea-2,运行uv sync安装依赖,下载RAW模型权重并设置OSS_RAW环境变量,然后执行uv run inference.py "提示词" --checkpoint oss_raw --steps 52 --cfg 3.5。最高支持1K分辨率。 - :下载Turbo模型权重并设置
本地部署(Turbo 模型)
OSS_TURBO环境变量,执行uv run inference.py "提示词" --checkpoint oss_turbo --steps 8 --cfg 0.0 --mu 1.15 --width 2048 --height 2048。8步快速出图,支持1K到2K分辨率。 - :把Krea 2模型导入ComfyUI工作流,加载RAW或Turbo模型节点,连接提示词和采样器节点就能进行推理。
ComfyUI 中使用
- :通过Fal等官方合作伙伴的API服务调用Krea 2,可以集成到自己的应用或工作流里。
API 调用
- :可以用Hugging Face Diffusers、Ostris AI toolkit、Kohya(musubi tuner)或者Fal这些工具,在RAW模型上训练LoRA。训练完成后,在Turbo模型上加载LoRA进行快速推理。
LoRA 训练与推理
- :上传一张或多张风格参考图,设置每张图的影响强度,输入提示词,Krea 2会自动把参考风格融合到新图像里。
风格迁移工作流
- :上传一组共享创意方向的图片作为情绪板,输入简单的提示词,Krea 2会基于整体的视觉意图生成风格一致的输出。
Moodboards 创作
Krea 2的官网地址
- :https://github.com/krea-ai/krea-2
GitHub仓库
Krea 2的核心优势
- :Krea 2是“美学优先”设计的模型,在Artificial Analysis评测中位列独立实验室文生图模型第一,输出具有编辑级的视觉品质。
美学质量行业领先
- :同时提供
开源双模型架构
(未蒸馏的基础模型,可塑性极强)和RAW
(8步蒸馏模型,约2秒出图),而且两者权重完全开源。Turbo
- :在RAW上训练LoRA,然后在Turbo上运行推理,兼顾了定制化与生成速度。这个工作流设计可以说非常有想法。
RAW 训练 + Turbo 推理的最佳实践
- :支持上传多张参考图提取并融合视觉风格,还能通过Moodboards理解一组图片的集体创意意图,实现风格一致的批量输出。
极强的风格迁移能力
- :跟其他模型那种“技术上正确但视觉上平淡”的输出相比,Krea 2更像一个有审美品味的创意协作者,生成的结果AI感弱了很多。
去 AI 味
- :四档Creativity调节(Raw/Low/Medium/High),从严格遵循提示词到让模型自主添加美学深度,不同创作需求都能找到合适的档位。
创意参数灵活可控
- :Turbo模型支持1K到2K分辨率输出,而且只需要8步采样就能达到高质量。
高分辨率快速生成
- :官方支持ComfyUI、Fal、SGLang等主流推理平台,同时提供了完整的API和微调工具链。
多平台生态支持
- :配合Krea Edit功能,支持定向修改、重打光、外扩等局部编辑,不用为了改一个局部就把整张图重来一遍。
区域级图像编辑
Krea 2的同类竞品对比
| 对比维度 | Krea 2 |
GPT Image 2 |
Gemini Imagen 3 |
|---|---|---|---|
定位 |
美学优先的创意协作者 | 指令遵循型精确生成器 | 通用型高质量图像模型 |
核心优势 |
视觉美学、风格迁移、创意控制 | 复杂提示词精确遵循、文本渲染 | 照片真实感、干净精致输出 |
提示词遵循 |
中等(偏艺术解读,会自主优化构图) | 极高(逐字翻译,多部分复杂指令最强) | 高(忠实于描述,自然语言理解好) |
美学质量 |
极高(有审美主见,编辑级温暖感) | 好(技术优秀但较冷淡,“正确但冷”) | 高(干净、精致、通用) |
风格迁移 |
极强(核心优势,支持Moodboards和多风格混合) | 好但不够一致,偏polished风格 | 好但较通用,缺乏鲜明个性 |
照片真实感 |
中等(偏风格化,非核心目标) | 极高 | 极高(可以说是三者中最强的) |
文本渲染 |
弱(短词尚可,长文本不稳定) | 极强(标签、UI、包装文字最可靠) | 中等(短文本可用,长文本易出错) |
图像一致性 |
高(风格统一性强) | 极高(复杂场景结构最可靠) | 高(干净准确,偶有多轮差异) |
开源/可定制 |
完全开源 |
闭源(仅API/ChatGPT访问) | 闭源(仅Google平台访问) |
LoRA 微调 |
支持(RAW训练,Turbo推理) | 不支持 | 支持(Vertex AI企业版) |
生成速度 |
Turbo约2秒/8步 | 8~15秒/张 | 标准版较慢,Flash版5~10秒 |
Krea 2的应用场景
- :可以快速探索视觉方向、构建情绪板、生成概念艺术和风格参考。团队在项目早期就能用Krea 2统一审美方向,效率非常高。
创意工作室与概念设计
- :生成风格一致的编辑级或商业级campaign素材,支持品牌视觉调性的批量输出。传统拍摄和后期成本能省下一大笔。
营销与广告
- :制作Lookbook、时尚编辑图像时,能精准控制面料质感、光影氛围和整体美学风格。从概念到成片的迭代周期大幅缩短。
时尚行业
- :进行概念可视化、材质研究和空间构图的快速探索。设计师在方案阶段就能看到多种风格倾向的效果图,决策起来直观多了。
建筑与空间设计
- :用于角色设计、场景概念、世界观构建和道具设计。风格迁移功能可以确保整个项目的视觉统一性,这点对大型项目尤其关键。
游戏开发
- :批量生成风格一致的高质量产品图,支持不同场景、背景和风格的快速切换。商品视觉表现力上去了,转化率自然也跟着受益。
电商与产品展示