电信运营商正在将AI应用于网络运维、客户服务和后台工作流,但大多数仍处于自动化之旅的早期阶段。在网络运维领域,自动化通常停留在TM Forum自治网络分级中的Level 2-3区间,即在选择性网络域中流式执行预定义解决方案。要真正达到Level 4-5级别的自治,需要能够理解运营商意图、实时感知网络状态、研究并制定方案、权衡取舍并跨域协调受控行动的智能体。
约束条件不再是模型质量本身,而是运营商是否已经构建了一个自治平台——智能体可以在此平台上共享电信领域模型、策略控制、工具和数字孪生。这为智能体不仅执行现有操作方案,还能发现和验证更好的运营方式奠定了基础。
在电信运营中,不同类型的智能体围绕一个共同的问题-解决方案循环协作。按需型智能体处理有限任务,如应用配置变更、运行NOC脚本或回答客户服务问题。长期运行型智能体则在更长的时间跨度内持续感知网络状态,验证并协调跨系统行动,决定何时升级、回滚或重新优化。深度研究型智能体则通过专门的技能包探索已知答案之外的可能性,跨数据源、工具和数字孪生进行拓展,提出并验证多套替代方案。
运营问题通常落入三种模式:遇到已知问题且已知解决方案的执行路径、已知方案但需优化的优化路径,以及未曾遇到过的新问题发现路径。当方案和执行轨迹被编码为新的技能包后,曾经需要深度研究的问题可以转化为受控的执行路径,从而逐步扩展运营商的可复用自治知识库。
NVIDIA为此提供了一套完整的自治平台技术栈。在数据和模型层,运营商可以利用NVIDIA NeMo Data Designer生成合成数据,利用NeMo Safe Synthesizer对敏感记录进行匿名化处理。Nemotron推理模型可在电信数据集上进一步微调,使智能体具备理解信号、形成和验证假设、推理系统级动态的能力。NV-Tesseract时间序列模型可分析多变量网络遥测数据,检测异常并预测行为趋势。
在智能体框架层,NVIDIA Agent Toolkit提供了企业级AI智能体的构建模块,使团队能够将智能体框架连接到共享工具、可观测性和评估体系。安全运行时方面,NVIDIA OpenShell为每个智能体创建独立的隔离沙箱,根据企业策略管控其对文件系统、网络、工具和推理端点的访问,NVIDIA NemoClaw则负责智能体的部署、生命周期管理和策略下发。
以深度研究智能体为例,NVIDIA AI-Q蓝图展示了多智能体系统的组织方式:规划智能体构建问题框架并确定相关的域和数据源,研究员智能体在OSS/BSS系统、遥测数据和数字孪生之间并行收集证据,编排智能体将所有发现汇总并驱动额外的分析迭代,直到满足质量和风险阈值。最终生成一组与底层数据和仿真结果关联的排序方案,交由执行智能体在策略约束下应用变更,并在变更后持续监控遥测数据,在未达目标时触发回滚或新的研究。
在实际电信场景中,这一架构已在SR-MPLS骨干网络的异常检测与修复中得到验证。当遥测信号显示拥塞、隧道降级或链路故障时,深度研究智能体提取拓扑和路由状态,分析性能指标,比较替代SR-TE路径或路由策略,返回带有性能、风险和策略权衡的排序修复方案。长期运行型智能体则负责选择方案、跨SDN控制器和流量工程工具协调执行步骤,并在变更后确认网络是否恢复,必要时回退到替代方案。
AI原生电信运营商实现更高自治水平的关键路径,是将智能体规模化部署到问题不断演化的工作流中,在问题-解决方案循环中持续发现、验证和优化。实际可行的步骤是:识别高价值工作流,将其部署到自治平台上,使每个工作流从初始事件或意图到验证执行,完整通过问题-解决方案循环;然后将更多的工具、域和策略集成到同一平台中,使每个新用例都强化共享的推理和执行栈,而非创建孤立的自动化。将智能体定位为电信自治平台的首批租户,这正是下一代AI原生电信运营商的核心技术路径。
WeChat
Profile