首页 > 教程攻略 > ai教程 >本地大模型部署笔记：Ollama+Qwen2.5+Win11环境配置实录

本地大模型部署笔记：Ollama+Qwen2.5+Win11环境配置实录

来源：互联网时间：2026-06-08 07:14:31

0、前言

先说几个核心判断：本地部署大模型，Ollama确实是当前最轻量的选择之一，配上Qwen2.5，在Win11上跑起来相当丝滑。而且最诱人的一点——不需要独立显卡也能跑，隐私安全也完全在自己手里。整篇文章会围绕这样几个关键点展开：Ollama怎么装、Modelfile怎么配、ModelScope怎么用、Notebook是什么角色，以及最终怎么通过API调通这个大模型。本地大模型部署笔记：Ollama+Qwen2.5+Win11环境配置实录

通过这次部署，你会清楚： - Ollama 是干什么的，怎么装怎么用； - Modelfile 长什么样，怎么配置； - ModelScope 扮演什么角色； - Notebook 在什么场景下派上用场； - 这些工具怎么组合，部署成功后怎么通过API调用。

1、环境与准备

实践出真知，先亮一下我的实验台配置： - Win11：Windows 11 专业版 25H2 - CPU：Intel(R) Core(TM) i7-8750H CPU @ 2.20GHz (2.21 GHz) - 内存：16.0 GB - 显卡：GTX1050Ti（说实话挺鸡肋的，这次的实践过程中基本没用到它） - Ollama：0.17.7 - 大模型： - qwen2.5-3b-instruct-q4_k_m - qwen2.5-7b-instruct-q4_k_m

前置依赖检查

- PowerShell（Win11自带的就够） - Git（可选，用来下载东西） - Python（只有在用ModelScope CLI时才需要，如果只用浏览器下载，可以不装）

2、核心概念速览

2.1、模型文件名 `qwen2.5-3b-instruct-q4_k_m.gguf` 到底在说什么？

文件名通常长这样：qwen2.5-3b-instruct-q4_k_m.gguf。 instruct 表示这个模型经过了指令微调，适合对话场景；如果是 base 版本，那更适合做续写或者二次微调，直接拿来对话效果不太好。 1）q + 数字：代表每个参数用了多少 bit 来存储。 - 数字越小 = 文件越小 = 速度越快 = 自然会笨一点点； - 数字越大 = 文件越大 = 速度越慢 = 理论上更聪明； - 业界共识：4-bit（q4）是性价比最高的选择，智商损失微乎其微，体积却能直接砍半。 2）k：用了 K-quants 量化技术，比老式的 q4_0 更聪明，压缩效率更高。 3）m/s/l：分别代表 Small（小）、Medium（中）、Large（大）。 - q4_k_s：更小一点，稍微笨一点点； - q4_k_m：标准版，平衡最好，首选； - q4_k_l：更大一点，稍微聪明一点点，但对显存的要求也上去了。

2.2、Modelfile 的基本结构与含义

Modelfile 是 Ollama 的“灵魂配置”，它告诉系统模型从哪来、怎么聊、聊什么风格。基本结构长这样：

FROM 
SYSTEM 
PARAMETER  
TEMPLATE

本地大模型部署笔记：Ollama+Qwen2.5+Win11环境配置实录

0、前言

1、环境与准备

前置依赖检查

2、核心概念速览

2.1、模型文件名 `qwen2.5-3b-instruct-q4_k_m.gguf` 到底在说什么？

2.2、Modelfile 的基本结构与含义

2.3、Notebook 是什么？

2.4、运行大模型的通俗理解

3、实战部署：安装与运行

3.1、安装 Ollama

3.2、方式一：一键拉取（官方推荐）

3.3、方式二：自定义导入（进阶）

1）从 ModelScope 下载 GGUF 文件

2）编写 Modelfile 文件

3）创建模型

4）运行模型

5）示例：Qwen2.5-7B 的配置

4、通过API访问大模型

4.1、启动服务

4.2、PowerShell 中测试接口

4.3、后台运行技巧

5、常用命令速查表

6、附录与参考资料

6.1、文档资料链接

6.2、ModelScope Pip 安装详解

相关阅读

相关下载

本地大模型部署笔记：Ollama+Qwen2.5+Win11环境配置实录

0、前言

1、环境与准备

前置依赖检查

2、核心概念速览

2.1、模型文件名 qwen2.5-3b-instruct-q4_k_m.gguf 到底在说什么？

2.2、Modelfile 的基本结构与含义

2.3、Notebook 是什么？

2.4、运行大模型的通俗理解

3、实战部署：安装与运行

3.1、安装 Ollama

3.2、方式一：一键拉取（官方推荐）

3.3、方式二：自定义导入（进阶）

1）从 ModelScope 下载 GGUF 文件

2）编写 Modelfile 文件

3）创建模型

4）运行模型

5）示例：Qwen2.5-7B 的配置

4、通过API访问大模型

4.1、启动服务

4.2、PowerShell 中测试接口

4.3、后台运行技巧

5、常用命令速查表

6、附录与参考资料

6.1、文档资料链接

6.2、ModelScope Pip 安装详解

相关阅读

相关下载

2.1、模型文件名 `qwen2.5-3b-instruct-q4_k_m.gguf` 到底在说什么？