首页 > 教程攻略 > ai资讯 >赋能轻量级Agent！瑞芯微重磅发布RK182X SDK 1.0.4版本

赋能轻量级Agent！瑞芯微重磅发布RK182X SDK 1.0.4版本

来源：互联网时间：2026-06-30 15:03:07

6月12日，瑞芯微放出了一个大动作——正式发布RK182X SDK 1.0.4版本。这个版本的核心目标只有一个：为轻量级Agent全栈赋能，加速端侧AI从概念走向量产。

先说个核心判断：瑞芯微之所以在RK3588之外，还要专门开发RK182X这颗协处理器，根本原因在于传统SoC在端侧跑大模型时，遇到了物理瓶颈。RK182X本身就是一颗内置了多核高算力NPU的AI推理芯片，峰值算力高达20 TOPS。瑞芯微给出的解决方案是：当客户现有产品需要增加AI能力时，通过这颗协处理器与主处理器协同工作，直接满足AI算力的升级需求，从而大大节省时间成本和研发周期。

从实测数据来看，RK182X的能力相当可观。运行Qwen2.5-3B模型时，输出速度突破百Token，是市场对标产品的3倍；运行Qwen3-VL-2B模型时，输出速率也接近百Token。实打实的硬数据摆在这里，效果一目了然。

再来看财报。瑞芯微2026年第一季度财报显示，公司依托RK3588等主力AIoT SoC平台及RK182X协处理器系列，实现营收12.05亿元，同比增长36.22%；净利润3.29亿元，同比增长57.15%；毛利率达到43.04%。增长势头相当强劲。

瑞芯微在财报中特别强调，2026年第一季度，终端市场受存储价格高涨冲击，但AIoT市场依然延续增长态势。端侧AI正在深入千行百业，重塑产品体验的趋势日益显著。财报还重点披露，瑞芯微于2025年7月正式发布协处理器RK182X系列，9月迅速发布SDK，快速导入十几个行业、数百家客户，首批客户已进入产品发布、量产阶段，应用于各产品线的旗舰产品，导入速度超出预期。

6月12日发布的最新RK182X SDK 1.0.4版本，有以下三大亮点

1. 量产级工具链，从开发到运维全闭环

这个版本在工具链上下了大功夫，真正做到了覆盖全流程：

批量烧录+自动化测试，产线可以一站搞定；KV Cache导入导出，预计算上下文，首包加速效果明显；运维闭环包含OTA远程升级和设备状态监控；模型加密功能保护企业自研算法IP；LoRA微调支持私有数据微调，无需全量重训。瑞芯微表示，该版本已通过严苛测试，支持7×24小时连续稳定运行。

2. Agent 能力大幅跃升

谷歌最新开源模型Gemma4，在指令遵循、工具调用等Agent核心能力上实现了大幅提升，是端侧Agent落地的理想基座。瑞芯微自研的KV Cache压缩技术，让上下文长度直接翻倍——Qwen3-4B最高支持37K token，这意味着Agent可以记住更长的对话和任务指令，应用场景大大扩展。

3. 全模态模型体系，端侧AI完整链路

端侧AI不只是“跑大模型”，而是需要形成完整的链路：听→看→想→做。瑞芯微这次展现的模型生态相当完整：音频入口有Qwen3 ASR/TTS、VITS等，让设备能听会说；视觉入口有PaddleOCR、SigLIP、DINOv2、Yolo系列、Depth-Anything等，让设备能看懂；Agent决策层面，Qwen全系列、GLM Edge、Gemma4、InternVL3等从理解到执行全覆盖。整体模型全景覆盖LLM（0.5B~8B）、VLM、Omni全模态、ViT/CNN等8大类40多款模型，基本能应对各种端侧AI需求。

赋能轻量级Agent！瑞芯微重磅发布RK182X SDK 1.0.4版本

6月12日发布的最新RK182X SDK 1.0.4版本，有以下三大亮点

1. 量产级工具链，从开发到运维全闭环

2. Agent 能力大幅跃升

3. 全模态模型体系，端侧AI完整链路

相关阅读

相关下载