首页 > 教程攻略 > ai资讯 >1.3B 模型的“降维打击”：MiniCPM-V 4.6 重新定义端侧多模态巅峰

1.3B 模型的“降维打击”：MiniCPM-V 4.6 重新定义端侧多模态巅峰

来源：互联网时间：2026-05-27 16:28:52

5月11日，面壁智能联合清华大学及OpenBMB开源社区，正式发布了新一代端侧多模态大模型——MiniCPM-V4.6。这款模型仅有1.3B参数，堪称“轻量级”，但它却凭借极致的智能密度和出色的跨平台适配能力，成功挑战了更大参数模型的性能极限，为端侧AI的规模化落地按下了加速键。

MiniCPM-V4.6推出了Instruct与Thinking两个版本，在多项核心评测中展现出了远超同量级模型的推理与理解能力。

全球领跑：
在权威的Artificial Analysis（AA）榜单上，MiniCPM-V4.6一举拿下
13分
的高分。这个成绩不仅大幅超越了阿里Qwen3.5-0.8B、谷歌Gemma4-E2B-it等同尺寸竞品，其性能甚至直逼参数更大的Qwen3.5-2B模型，稳稳坐上了1B级别模型的性能头把交椅。
高阶能力：
无论是通用图文理解、复杂的STEM数理推理，还是极具挑战性的文档OCR与视频时序理解任务，模型都表现出了极高的智能水准。特别是在多图像推理与幻觉抑制方面，其Thinking版本的表现尤为亮眼。

为了彻底解决端侧部署的“内存焦虑”，MiniCPM-V4.6在推理速度和资源占用上做了深度优化。

模型之所以能如此“轻装上阵”，其核心秘诀在于面壁智能与清华大学联合研发的

LLaVA-UHD v4

技术。

编码重构：
通过对ViT图像编码器与浅层压缩模块进行重构，成功将图像编码开销降低了
50%
，高分辨率下的浮点运算量也减少了
55.8%
。
混合压缩机制：
创新性地支持4倍与16倍混合Token压缩，让模型可以在“性能优先”和“速度优先”模式间灵活切换。这项技术此前已在快手的推荐大模型OneRec中得到验证，成功支撑了海量的线上流量请求。

MiniCPM-V4.6的全面开源，不仅是技术上的突破，更是生态构建的关键一步。

开发便捷：
模型深度适配了ms-swift、LLaMA-Factory等主流微调框架，开发者仅需一张RTX 4090显卡，就能完成模型的全量微调，极大降低了研发门槛。
全平台兼容：
它支持vLLM、Ollama等主流推理框架，并提供了覆盖iOS、Android、HarmonyOS的测试版本，让AI能力能够无缝触达更多形态的硬件终端。
落地赋能：
目前，该系列模型已在汽车、PC、智能家居及工业检测等多个领域实现落地应用，合作伙伴名单中包括了联想、吉利、上汽大众、小米、OPPO等行业头部企业。

随着MiniCPM-V4.6的全面开源，端侧多模态大模型的落地门槛已被实质性拉平。可以预见，未来AI将不再仅仅依赖于云端庞大的算力集群，而是真正融入每一个智能终端，成为我们个人日常生活中触手可及的“智慧大脑”。