首页 > 教程攻略 > ai资讯 >赋能轻量级Agent!瑞芯微重磅发布RK182X SDK 1.0.4版本

赋能轻量级Agent!瑞芯微重磅发布RK182X SDK 1.0.4版本

来源:互联网 时间:2026-06-30 15:03:07

6月12日,瑞芯微放出了一个大动作——正式发布RK182X SDK 1.0.4版本。这个版本的核心目标只有一个:为轻量级Agent全栈赋能,加速端侧AI从概念走向量产。

先说个核心判断:瑞芯微之所以在RK3588之外,还要专门开发RK182X这颗协处理器,根本原因在于传统SoC在端侧跑大模型时,遇到了物理瓶颈。RK182X本身就是一颗内置了多核高算力NPU的AI推理芯片,峰值算力高达20 TOPS。瑞芯微给出的解决方案是:当客户现有产品需要增加AI能力时,通过这颗协处理器与主处理器协同工作,直接满足AI算力的升级需求,从而大大节省时间成本和研发周期。

从实测数据来看,RK182X的能力相当可观。运行Qwen2.5-3B模型时,输出速度突破百Token,是市场对标产品的3倍;运行Qwen3-VL-2B模型时,输出速率也接近百Token。实打实的硬数据摆在这里,效果一目了然。

再来看财报。瑞芯微2026年第一季度财报显示,公司依托RK3588等主力AIoT SoC平台及RK182X协处理器系列,实现营收12.05亿元,同比增长36.22%;净利润3.29亿元,同比增长57.15%;毛利率达到43.04%。增长势头相当强劲。

瑞芯微在财报中特别强调,2026年第一季度,终端市场受存储价格高涨冲击,但AIoT市场依然延续增长态势。端侧AI正在深入千行百业,重塑产品体验的趋势日益显著。财报还重点披露,瑞芯微于2025年7月正式发布协处理器RK182X系列,9月迅速发布SDK,快速导入十几个行业、数百家客户,首批客户已进入产品发布、量产阶段,应用于各产品线的旗舰产品,导入速度超出预期。

6月12日发布的最新RK182X SDK 1.0.4版本,有以下三大亮点

1. 量产级工具链,从开发到运维全闭环

这个版本在工具链上下了大功夫,真正做到了覆盖全流程:

批量烧录+自动化测试,产线可以一站搞定;KV Cache导入导出,预计算上下文,首包加速效果明显;运维闭环包含OTA远程升级和设备状态监控;模型加密功能保护企业自研算法IP;LoRA微调支持私有数据微调,无需全量重训。瑞芯微表示,该版本已通过严苛测试,支持7×24小时连续稳定运行。

2. Agent 能力大幅跃升

谷歌最新开源模型Gemma4,在指令遵循、工具调用等Agent核心能力上实现了大幅提升,是端侧Agent落地的理想基座。瑞芯微自研的KV Cache压缩技术,让上下文长度直接翻倍——Qwen3-4B最高支持37K token,这意味着Agent可以记住更长的对话和任务指令,应用场景大大扩展。

3. 全模态模型体系,端侧AI完整链路

端侧AI不只是“跑大模型”,而是需要形成完整的链路:听→看→想→做。瑞芯微这次展现的模型生态相当完整:音频入口有Qwen3 ASR/TTS、VITS等,让设备能听会说;视觉入口有PaddleOCR、SigLIP、DINOv2、Yolo系列、Depth-Anything等,让设备能看懂;Agent决策层面,Qwen全系列、GLM Edge、Gemma4、InternVL3等从理解到执行全覆盖。整体模型全景覆盖LLM(0.5B~8B)、VLM、Omni全模态、ViT/CNN等8大类40多款模型,基本能应对各种端侧AI需求。

相关阅读