首页 > 教程攻略 > ai资讯 >四台Mac Studio干翻云端集群!苹果联手LM Studio本地跑起万亿参数大模型

四台Mac Studio干翻云端集群!苹果联手LM Studio本地跑起万亿参数大模型

来源:互联网 时间:2026-06-22 17:59:35

在刚刚落幕的WWDC2026上,LM Studio与苹果联手搞了个大动作——仅用四台Mac Studio组成的集群,就成功跑起了月之暗面的万亿参数大模型Kimi K2.6。这一成果直接打破了“万亿模型只能靠云端GPU集群”的固有认知,让消费级硬件承载前沿AI算力从概念变成了实实在在的工程现实。

Kimi K2.6总参数规模高达1万亿,采用MoE架构,激活参数320亿,支持长上下文、多模态输入以及智能体任务处理。演示中,四台Mac Studio通过苹果的内存共享和互联技术组成集群,统一内存总量约1.5TB,刚好满足这一巨型模型的推理需求。此前开发者测试显示,在类似配置下Kimi K2.6可达到约28 tokens/s的生成速度,而功耗远低于传统GPU方案。要知道,这个速度对于本地推理来说已经相当可观了。

从iPhone直连本地集群,数据全程不出门

更值得关注的是,演示中还展示了LM Studio的LM Link远程访问功能。用户可以在MacBook Neo笔记本和iPhone上安全地远程连接到Mac Studio集群,与正在运行的模型实时交互,而所有数据和通信始终保持本地化处理,不走云端。这意味着什么?你坐在咖啡厅里,用一部手机就能操控办公室里的集群级AI算力,而且数据全程不上云,隐私风险大幅降低。

LM Link已更新至LM Studio的Mac应用和Locally AI的iOS应用中,支持端到端加密连接。这一设计让用户即使手握轻量设备,也能随时调用集群级的AI算力,同时不必担心隐私泄露问题。配合苹果Thunderbolt 5 RDMA等多设备内存共享技术,整个生态在AI本地化部署方面的技术闭环正在加速成型。可以说,苹果的硬件互联能力正在为本地AI推理铺出一条新路。

这次合作释放了一个清晰信号:本地部署万亿参数大模型不再是遥不可及的实验室概念,而是正在走向开发者案头的工程现实。随着苹果硬件互联能力的持续进化,消费级设备承载大规模AI推理的边界,有望被进一步拓宽。接下来的故事,值得持续关注。

相关阅读

相关下载