中国北京——2025年6月28日——图灵新讯美长期深耕金融安防、视频监控等关键领域,聚焦人工智能在复杂业务场景下的识别、分析与智能决策。凭借深厚的行业经验和系统集成能力,图灵新讯美今日宣布,率先基于 NVIDIA 用于视频搜索与总结 (VSS, Video Search and Summarization) 的 AI Blueprint,在中国推出企业级多模态视觉大模型融合解决方案,推动先进 AI 模型在交通治理、工业质检、金融风控等领域实现高效识别、精准预警和稳定交付。
该平台以 NVIDIA AI Blueprint 和 IBM Watsonx、Red Hat OpenShift 为核心技术底座,结合本地化架构设计和多行业深度适配,打造出国内首个实现工程化部署的视频智能平台,助力企业从数据感知走向智能决策。
从“识别对象”到“理解意图”:视频智能的跃迁式升级
在实际业务场景中,交通事故预警、工业生产溯源、金融欺诈监测等任务,对系统的理解能力提出了远高于传统视觉系统的要求。基于 VSS Blueprint 的融合解决方案聚焦 “意图识别”,突破以往仅能做对象检测和分类的技术瓶颈,通过多模态融合实现对视频内容的结构化分析、语义提取、事件追踪和交互问答。
该系统采用 IBM Red Hat OpenShift 及 NVIDIA 视觉大模型为技术底座,通过上传视频或实时接入 RTSP 视频流,对人脸、人体、特殊物品、行为事件等进行高精度识别,能精准检测并跟踪目标,广泛适用于智慧安防、交通管理、企业园区、校园、矿山等多个领域。在智慧交通领域,对交通流量、车辆行为、行人动态等实时分析的准确率高,违章检测、拥堵预警、事故识别等功能表现出色。
构建可交付的多模态视频智能系统
依托 NVIDIA AI Blueprint,图灵新讯美融合解决方案具备以下工程化能力:
平台集成与视觉大小模型整合:基于 VSS Blueprint 开发的应用接口,将事件分析、证据留存、触发告警的工作流无缝集成到现有视频管理及调度平台上,实现不同目标任务、不同数据源、视觉模型及视觉大模型的灵活匹配和最佳部署。
多路视频并发与流调度:支持大规模实时或录播视频流的并发处理,自动完成流识别、队列管理与并行调度,适用于高密度交通与工业场景。
多模态数据协同理解:集成音频自动转录(NVIDIA Riva ASR 微服务),实现“图像+语音”双模语义抽取,显著提升讲解、培训、安防等多场景下的智能解析能力。
语义驱动的零样本对象检测与追踪:通过 Grounding DINO、SAM2 视觉模型及 Set-of-Mark (SoM) 提示机制,无需样本即可进行复杂目标检测、分割与跨帧追踪。
上下文增强检索与事件链推理:内嵌 CA-RAG、GraphRAG 框架,对视频中实体、事件和语义块进行图结构建模,实现跨时空事件分析、多跳问答与复杂场景洞察。
弹性部署与低资源消耗:支持 NVIDIA Hopper 及 Ada Lovelace 架构,以及边缘多种部署方式,可在资源受限环境下高效运行,满足行业客户本地化、安全性和经济性需求。
模块化开发与云端支持:提供 Docker/Helm 一键部署、API Catalog 及云端快速集成,方便企业按需扩展业务流程。
赋能复杂场景,驱动行业深度应用
平台已在多个行业场景实现实际应用与验证:
城市交通治理:支持交管中心对路口视频流的异常检测、违规行为识别和事故回溯,实现从“被动录像”到“主动智能管控”的转型。
工业生产与质检:自动识别生产线异常工况和不合规操作,支持 SOP 合规性审核与生产过程追溯,提升安全与质量管理效率。
金融风控与安防:通过视频与音频联动,实时监控和追溯潜在风险行为,实现“事前预警+事后可查”的风控闭环。
目前,图灵新讯美已与多地交管单位、头部企业展开深度合作,平台能力正加速拓展至工业制造、金融服务、公共安全等多个领域。
构建智算驱动的多模态基座,重塑企业视觉智能生产力
以融合解决方案为切入口,图灵新讯美充分发挥自身作为独立软件供应商 (ISV) 在技术集成、场景适配和客户交付方面的专业优势,打通从智算基础设施到场景应用的全链路,推动视觉智能从“看得清”走向“想得通、答得快”,真正将多模态 AI 转化为生产力、决策力与增长引擎。
未来,图灵新讯美将继续专注技术创新与工程实践,助力客户用更智能、高效、可持续的方式释放数据价值,推动行业加速迈向数智化新阶段。
WeChat
Profile