AMD开源Lemonade 10.7版首发原生支持NVI
2026年6月11日,AMD主导开发的开源本地AI服务器方案Lemonade迎来了10.7版本。这次更新最让人眼前一亮的是——它终于完整支持NVIDIA GPU的本地AI推理了。具体来说,通过集成Llama.cpp的CUDA后端,Lemonade在Windows和Linux双平台上实现了原生适配,还内置了NVIDIA GPU自动识别功能。这意味着,无论你手里是AMD还是NVIDIA的硬件,都能在本地获得一致的AI运行体验。
回想一下,之前的Lemonade已经全面支持AMD Ryzen AI NPU、Radeon及Instinct系列GPU、x86_64架构CPU,以及Apple Metal GPU,唯独在NVIDIA GPU这块一直缺位。这次更新正好补上了这个关键缺口。不仅如此,Linux平台还同步引入了stable-diffusion.cpp的CUDA后端,同时新增了跨厂商Vulkan扩展支持——一句话,兼容的图形处理器范围又扩大了一圈。
对于开发者来说,这次还带了个实用的新家伙:性能基准测试工具lemonade bench。它可以在Llama.cpp、FastFlowLM、vLLM、Ryzen AI等多个推理后端之间做端到端的大语言模型推理性能对比。以前在不同硬件和框架间横向验证,技术门槛不低,现在有了这个工具,工作量直接降下来了。
除了这些硬核更新,新版本还新增了对LMX-Omni模型的原生支持,并集成了Prometheus实时监控接口。运维人员可以通过它可视化追踪服务状态、采集指标,管理起来方便多了。这些改进加在一起,Lemonade正一步步走向通用型、全场景的本地AI引擎。
还有一个值得注意的细节:这次CUDA后端的整合,其实是社区外部开发者贡献的,经过AMD团队审核后正式合并到了主干分支。这体现了项目开放协作的理念,也说明AMD在构建跨厂商AI生态方面,确实迈出了实质性的一步。
作为完全开源的本地AI基础设施项目,Lemonade一直在GitHub上保持更新。目前10.7版本已经开放下载,开发者可以根据自己的硬件配置灵活选用适配后端,平稳地从云端调用切换到本地部署。如果你手头有NVIDIA卡,现在正是试试的好时机。