苹果Mac用户的福音:本地运行Meta Llama 3的终极指南
如果你正在寻找一条直接在苹果自研芯片Mac上运行Meta Llama 3的捷径,那这篇文章大概率正合你意。这里会手把手拆解步骤,教你如何把这款强大的语言模型请进本地,既保护隐私,又能离线使用。顺便,还会搭建一个类似ChatGPT的交互界面——全都在你自己的电脑上完成。

目标是:流程尽量简化,最终呈现一个带优雅界面的本地运行环境。
你需要准备的工具:Ollama
Ollama 是专为 macOS 设计的 LLM 部署利器,支持 Llama 3、Mistral、Gemma 等主流模型。去官网下载安装包,然后打开终端检查是否就绪:
ollama -v
如果输出版本号,说明安装成功。想深入了解的话,可以翻翻它的 GitHub 仓库(ollama/ollama)。
选择适合的模型
根据 Mac 的内存配置,可以选择基础版 Meta Llama 3 8B(约需4.7 GB内存)或更大号的 Meta Llama 3 70B(约需40 GB内存)。实测下来,在一台64 GB RAM的 M1 Max 上运行 70B 版本,流畅度让人满意。
运行 8B 版本:
ollama run llama3:8b
运行 70B 版本:
ollama run llama3:70b
下载时间取决于网速,耐心等一会儿就好。
搭建用户界面
模型已经在后台待命,现在需要给它配一个看得见摸得着的聊天窗口。推荐使用 OpenWebUI,一个开源的、长得像 ChatGPT 的界面框架。运行它需要 Docker。
执行下面这行命令:
docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main
启动后,打开浏览器访问 http://localhost:3000/,你会看到注册页面。点击注册,创建一个账号——放心,所有数据只保存在本地,不会传到任何服务器。
登录后,一个与 ChatGPT 极其相似的对话界面就出现了。从顶部下拉菜单可以选择你刚刚下载的模型(比如 llama3:8b 或 llama3:70b),之后就可以开始聊天了。
有了这套设置,你的选择远不止 Llama 3——几乎任何主流开源 LLM 都可以轻松接入。
总结
完成以上几步,你的苹果自研芯片 Mac 就成了一台本地大模型工作站,既能跑 Llama 3,也能跑其他开源替代品。希望这篇指南能帮你省下不少折腾的时间。欢迎在评论区聊聊你的体验或遇到的问题。