一、方案背景
阿里巴巴通义大模型事业部将千问-Omni全模态大模型部署于NVIDIA DRIVE平台,为智能座舱AI能力带来质的飞跃。核心挑战:传统车载语音助手仅限于预设指令集,无法理解多模态信号和隐含意图,智能座舱需要从被动响应迈入主动感知与自主行动新阶段。
二、解决方案名称与核心技术
解决方案名称:基于NVIDIA DRIVE平台的千问-Omni全模态座舱AI方案
核心技术:千问-Omni通过统一Transformer架构进行多模态对齐与推理,可同时处理语音、视觉和文本输入。在NVIDIA DRIVE平台高算力支持下实时处理座舱内摄像头画面,识别驾乘人员手势、表情和身位姿态。大模型推理通过Tensor Core加速实现毫秒级响应,满足车载实时交互要求。
三、应用场景
当后排乘客指向窗外问"那栋楼是什么",大模型可结合视觉定位和地理信息回答;检测到驾驶员疲劳时主动推送休息建议或调整座舱环境。阿里巴巴与NVIDIA将千问-Omni与DRIVE平台的功能安全、车规级部署要求深度整合,为智能座舱打造面向未来的AI技术基础。
WeChat
Profile