首页 > 教程攻略 > ai资讯 >面向企业的边缘AI扩展:构建终极多模型多路流安全系统

面向企业的边缘AI扩展:构建终极多模型多路流安全系统

来源:互联网 时间:2026-05-27 10:00:48

在今年的ISC West展会上,一个共识正在形成:边缘AI的“试点阶段”已经结束了。现在,真正的挑战浮出水面——如何将技术规模化落地。这不再是单一模型处理单路视频流的简单问题,而是要以商业上可行的成本,在多路视频流上协同调度数十个AI模型,构建一个真正智能、可靠且高效的系统。

面向企业的边缘AI扩展:构建终极多模型多路流安全系统

正是在这样的背景下,Axelera在ISC West 2026上带来了一场野心勃勃的现场演示。其核心目标,是展示一个实时、多模型、高分辨率多路流安全系统的极限能力。这套方案的核心成就,是在2.5 PetaOPS的算力支撑下,实现了跨多路8K视频流的实时AI嫌疑人识别与威胁检测。

从单点突破到规模化协同

去年,Axelera展示了8K AI推理的可能性。今年,重点转向了如何将这种能力扩展为完整的解决方案。通过Voyager SDK,安全相关的功能得到了极大丰富,涵盖了从嫌疑人识别、告警到可视化的全链条。这套方案联合了四家ISV合作伙伴,其目的很明确:向客户展示,如何轻松地训练、部署自定义模型,并将其无缝集成到一个端到端的软件流水线中,最终实现规模化、即插即用的AI部署。

Voyager SDK与Metis AIPU:开箱即用的编排能力

基于Axelera Metis AIPU与Voyager SDK进行开发,意味着你获得了一套强大的多路流AI工作负载编排工具。这套工具能帮你处理那些最繁琐的底层工作:

  • 硬件加速解码

    :同步采集和解码多路4K/8K视频流,确保低延迟和高吞吐量。
  • 基于切片的预处理

    :将高分辨率画面切分成重叠的图像块,既能保证对小目标的高精度检测,也能通过透视变换统一不同摄像机的视角。
  • 并发分析

    :并行运行多个模型,实时检测并追踪人员、面部特征和目标物体。
  • 模型级联与自定义逻辑

    :可以将检测器的输出智能地传递给下游模型(如人脸检测后接识别),还能集成自定义代码,实现条件逻辑,筛选特定帧或区域。
  • 智能边缘编排

    :只将关键的事件元数据上传云端以节省带宽,同时将原始高分辨率视频保留在本地,供后续取证分析。

值得一提的是,Voyager SDK新增了对自定义C++与Python逻辑的嵌入支持,这为构建现代高性能应用提供了至关重要的架构灵活性。

嫌疑人追踪:从“逐帧识别”到“时序智能”

在真实世界中识别和追踪嫌疑人,挑战无处不在:目标可能混迹于人群、被物体遮挡、或刻意躲避摄像头。此外,光线不足、运动模糊、面部角度多变等问题更是家常便饭。

传统逐帧处理的方式在这里显得力不从心。人脸识别模型对输入质量异常敏感,如果盲目处理所有模糊、侧脸或半遮挡的人脸,不仅会大幅增加漏识和误识的概率,还会白白浪费宝贵的AI算力。

因此,系统的设计思路必须从“帧”升级到“轨迹”。在检测器之后引入追踪器,系统就能在多帧中锁定同一个体,并为每个追踪ID构建一个“姿态质量缓冲区”。这个缓冲区会持续收集目标在不同时刻、不同角度下的图像,并依据姿态、像素密度、光照等指标进行评分和筛选。只有质量更高的新图像才会替换掉缓冲区里最差的旧图像。

随着时间的推移,劣质的模糊帧和角度不佳的帧会被自然过滤掉,确保最终输入识别模型的,始终是质量最高、最可靠的图像数据。这种机制带来了两个核心优势:一是显著提升了识别准确率,二是通过筛选避免了无效计算,节省了算力。

从数学原理上看,这套设计巧妙地利用了贝叶斯更新。系统会将多帧的识别结果进行融合,生成一个累积置信度评分。简单来说,两个相互独立的70%匹配结果,其提供的确定性要高于单个90%的匹配结果。这种设计赋予了系统强大的时序稳定性和抗干扰能力——一旦通过多帧高质量图像确立了高置信度的身份,后续出现的个别模糊帧或异常数据,很难推翻已有的累积证据。

当然,系统也考虑到了极端情况,比如目标只在某一帧中清晰闪现。为此,设计了“覆盖门控”机制。如果某个传入的兴趣区域同时满足高质量正面姿态和高置信度匹配,系统会立即判定识别可靠,触发即时告警,并可以覆盖现有的低质量数据缓冲区。这就确保了即便目标只出现了“惊鸿一瞥”,也难逃系统的法眼。

双管齐下:嫌疑人追踪与武器检测的联合流水线

真正的安防场景往往是多任务并行的。因此,演示系统将嫌疑人追踪器与实时武器检测模型结合起来,专为多模型并发场景设计。开发者可以很方便地通过并行运行多种分析模型来扩展系统功能。

为了最大化检测的可靠性,系统为每个目标建立了“人体”和“人脸”双路径追踪。人体检测和人脸检测模型并行运行,当身体被人群遮挡时,可以依靠人脸识别;当人脸不可见时,则可以依靠人体追踪。应用程序通过动态映射这两者的重叠检测结果,为每个目标维持一个持久、唯一的身份标识。

这套流水线遵循“快速提交、持续精化”的设计哲学:用第一个高质量匹配结果快速建立初步身份(低延迟),同时维护姿态质量缓冲区来持续提升确定性(高准确率),再配合覆盖门控机制来捕捉瞬时高质量目标(不漏网)。

在操作界面上,系统以一个高分辨率兴趣区域网格(全景视图)来展示所有被追踪人员。得益于完整的3300万像素分辨率,操作员即使对远距离目标也能保持清晰视野。界面支持双向联动:将光标悬停在网格中的某人身上,系统会在原始视频流中实时标注其位置,反之亦然。操作员还可以一键切换,查看每个人的实时画面或其姿态质量缓冲区中的最佳截图。

ISC West 2026 现场演示揭秘

考虑到在展厅展示真实武器的安全与合规风险,本次演示别出心裁地选用了一款来自“更古典时代”的武器——光剑,具体是Count Dooku那柄独特的弯柄光剑。其弯曲的手柄几何形态,高度还原了战术警棍、刀刃武器或枪支消音器的特征,既能实现高精度的检测,又极具视觉冲击力且绝对安全。

整个演示方案的配置可谓匠心独运:

  • 监控名单

    :以Axelera员工作为“嫌疑人”目标进行注册。
  • 武器检测

    :基于Ultralytics YOLOv8l训练的定制光剑检测模型。
  • 视觉硬件

    :两台Axis Q1809-LE 8K IP摄像机俯瞰展厅,画面在75英寸8K显示器上呈现。
  • 智能交互

    :界面设有焦点视图单元,平时显示展台内部4K摄像头画面供访客互动;一旦触发武器告警,该区域将自动突出显示高优先级警报。
  • 合规验证

    :展台摄像头同时运行PPE(个人防护装备)检测模型,当检测到人员身着完整防护服时,界面会亮起绿色盾牌图标。
  • 端到端响应

    :检测到事件后,系统不仅在现场告警,还会自动向ServiceNow推送事件工单,实现从边缘到云端的闭环响应。

这场演示是生态合作的成果:Digica提供了人脸检测与识别模型,Innowise利用合成与真实数据混合训练了光剑检测模型,SpanIdea则贡献了PPE检测模型。

硬核性能:2.5 PetaOPS如何驱动多路8K流

要实时处理多路8K视频流并运行多个AI模型,背后的硬件配置必须足够强大。演示系统采用了ORIGIN L-Class V2工作站,搭载Intel Xeon W7-3565X处理器,并由独立GPU负责视频解码和8K渲染。

真正的AI算力核心来自三块Axelera 4芯片Metis卡,它们共同提供了48个AIPU核心,峰值并行处理能力高达2.5 PetaOPS。正是这样的算力,支撑起了高分辨率切片处理和密集模型推理的需求。

关键性能指标如下:

  • 切片吞吐量

    :完整方案下,处理速度达到288块/秒。
  • 模型并发

    :每块Metis卡可并行执行多达16个模型实例。
  • 系统总容量

    :三块卡在48个核心上同时运行5个主模型和1个辅助模型,综合推理吞吐量不低于1440次/秒,且全程稳定,无性能降级。
  • 能效表现

    :在如此高性能下,每块卡的典型功耗仅为30至58瓦,能效比突出。

未来已来:Europa架构与生态演进

技术的脚步从未停歇。Axelera的下一代Europa架构,其性能预计将达到Metis的3倍。它将集成片上视频解码和向量引擎,进一步加速预处理流程,为下一代更复杂的监控系统预留充足的算力空间。

与此同时,Voyager流水线对Python逻辑的支持,只是迈向更友好的Python Pipeline Builder API的第一步。这将赋予开发者更大的自由,以高性能的方式构建复杂且线程安全的处理流水线。

更值得关注的是其不断壮大的生态系统。Axelera蓝图允许开发者将官方模型库与ISV合作伙伴的模型自由组合,实现的功能将远超简单的告警,甚至可以触发本地的实时自主响应协议。这不仅能大幅降低软件集成成本,更能显著加速产品的上市进程。

回顾起来,Axelera在三个核心需求上实现了关键突破:

易用性

(可快速参数化定制)、

灵活性

(在单一流水线内管理复杂任务)和

性能

(由SDK处理底层多流、多硬件同步的繁杂工作)。通过提供这些基础构建模块,Axelera正在切实推动高性能安全系统从概念验证走向规模化落地,帮助客户应对日益演进的安全挑战。


——Doug Watt,Axelera AI应用工程总监

Q&A

Q1:Axelera Metis AIPU在多路8K视频流处理中的性能表现如何?

三块Axelera 4芯片Metis卡共提供48个AIPU核心,峰值并行处理能力达2.5 PetaOPS。系统在完整配置下可达到288块切片/秒的处理速度,综合推理吞吐量不低于1440次模型推理/秒,每块卡典型功耗仅30至58瓦,在保持高性能的同时兼顾能效表现。

Q2:Voyager SDK的姿态质量缓冲区机制是如何提升人脸识别准确率的?

系统为每个追踪ID构建姿态质量缓冲区,依据姿态角度、像素密度和光照等指标持续填充最优兴趣区域。新帧仅在评分高于缓冲区最弱帧时才会替换。识别结果通过贝叶斯更新融合,生成累积置信度评分,有效将多个低置信度匹配转化为高确定性识别结论,显著降低漏识与误识率。

Q3:Axelera下一代Europa架构相比Metis有哪些提升?

Europa架构性能较Metis提升3倍,集成了片上视频解码与向量引擎,可加速预处理流程,为下一代监控系统提供更充裕的AI算力余量。同时,Voyager流水线将引入Python友好型Pipeline Builder API,赋予开发者更大的自由度,以高性能方式构建复杂且线程安全的流水线。

相关下载