咨询热线:

4001616691

新闻中心

当前位置:首页 >> 新闻中心

如今,品牌及其创意机构承受着巨大的压力,需要大规模地创建和提供高质量、准确的产品图片,从活动关键视觉效果到电子商务包装截图等。面向受众的内容,如个性化和本地化视觉变化,增加了制作的复杂性。

制作成本、短时间线、资源和维护品牌身份都是营销团队创建更多资产和更具针对性的内容的重复障碍。

例如,意式特浓咖啡制造商可能希望在即将推出的产品中面向广泛的受众,从居住在城市的年轻专业人士到在乡村享受退休生活的老一代。历史上,这需要多个工作流程、地点、团队和审查周期来执行,而这通常是不可能的,这会限制营销团队用于定位的可用内容。

为了大规模地为广泛的受众群体生成高质量、品牌准确的内容,创意团队现在可以利用生成式 AI 工作流。将生成式 AI 集成到用于生成准确的视觉资产和制作内容的工具和应用中,可以为内容供应链带来新的可能性和效率。

许多开发者已经在努力将其变为现实。

在本文中,我们将介绍用于精确视觉生成式 AI 的 3D 条件 的 NVIDIA Omniverse 蓝图,概述其工作原理及其用途,并聆听一些行业领导者讲述他们如何考虑该领域的发展。

NVIDIA Omniverse 蓝图是参考工作流,可让您轻松实施和构建 3D、模拟和 数字孪生 应用。


Four photos of an espresso machine in different kitchens, including different window views.
图 1、使用 NVIDIA Omniverse 3D 条件创建的输出图像示例,用于实现精确的视觉生成式 AI


模型调节以解锁生成式 AI,从而实现可扩展和可控的资产创建

如果无法控制产品的视觉输入,将生成式 AI 集成到工作流程中以创建精确的品牌形象可能会有问题。您可能会让特定的几何图形、颜色、徽标和品牌指南被误解或丢失,而不需要特定的条件。

模型条件 是指为模型提供特定信息或规则,帮助其根据您的期望做出更好的预测或决策。要调节 LLM,您需要提供基于文本的说明、示例、上下文或之前的对话历史记录。对于图像生成器,您可以提供文本或示例图像。

但这只能提供对 AI 模型如此多的控制。这就是为什么需要 3D 条件。

通过在 3D 环境中设置舞台,艺术家能够对生成的视觉效果的输出进行出色的创意控制或指导。为最终用户交互构建易于使用的 UI,使非技术团队能够在受控和有条件的框架中迭代和创建内容,同时保持 AI 不会影响品牌资产。

此 Omniverse 蓝图采用多模态方法,并结合使用 3D 作为英雄资产和简单的环境几何图形,以及 2D 渲染通道,以便快速修复以完成受控场景。您可以通过蒙版来保持产品数字孪生的完整性,还可以通过更改摄像头角度和缩放 3D 视窗来构图镜头。

为精确的视觉生成式 AI 构建经 3D 调整的工作流程涉及以下几个关键组件:

品牌内的英雄资产:最终成品资产,由艺术家打造,通常由品牌经理和艺术总监批准,应视为英雄资产。在本例中,我们提供了一台简单的意式特浓咖啡机。

简单、无纹理的 3D 场景: 由 3D 艺术家提供,用于存放英雄资产以及控制布局和构图。

自定义应用程序: 使用基于 Kit 106.2 的 Kit 应用程序模板 构建。

生成式 AI 微服务和 Kit 扩展程序:为您的自定义应用添加生成式 AI 功能。在这种情况下,扩散模型(例如 Stable Diffusion)负责修补。

解决方案测试: 验证集成工作流程的功能和性能。

对于此工作流,我们专门探索了微服务,使您能够使用生成式 AI,同时利用 OpenUSD 进行 3D 应用和工作流开发。

Omniverse 蓝图旨在实现可扩展和可定制。您可以在工作流中引入一些其他组件,如 PyTorch、pandas 和 LangChain 等。

  • 大型多模态模型(LMM)+ ComfyUI:快速生成式文本转图像模型,可根据文本提示合成逼真图像。

  • Edify 360 NIM :Shutterstock 提供生成式 3D 服务的早期访问预览,用于生成 360 度高动态范围图像(HDRI)。该模型使用 Shutterstock 的许可创意库在 NVIDIA Edify 上进行训练。

  • Edify 3D NIM :用于生成 3D 素材的 Shutterstock 生成式 3D 服务,用于场景装饰的其他 3D 对象。使用 NVIDIA Edify 和 Shutterstock 许可的创意库进行训练。

  • USD 代码 :一个回答 OpenUSD 知识查询并生成 USD Python 代码的语言模型。

  • USD Search :使用基于文本或图像的输入,对 OpenUSD 数据、3D 模型、图像和资产进行 AI 驱动的搜索。

在 工作流程指南 结束后,您将能够使用 AI 开发自己的自定义应用,从而为您的创意和营销团队提供支持和加速。所有微服务目前均可在 build.nvidia.com 上预览,您可以在其中调用 API 进行评估。


A workflow diagram shows how developers, artists, and end users interact with the AI agent.
图 2、用于精确视觉生成式 AI 的 3D 调节架构 NVIDIA Omniverse Blueprint


利用 NVIDIA Omniverse 蓝图构建营销生态系统

独立软件供应商(ISV)和生产服务机构的开发者正在基于 OpenUSD 构建新一代内容创作解决方案,该解决方案采用可控生成式 AI。

例如, Accenture Song 、 GRIP 、 Monks 、 WPP 和 Collective World 正在采用 Omniverse 蓝图来加速开发。

开发可扩展的人工智能解决方案,以创建符合品牌资产

此蓝图为您提供了如何构建可控的生成式 AI 应用的架构示例。您或您的客户现在可以充分利用您的应用:

  • 多模态 AI 生成的最终帧活动素材

  • 为关键视觉效果快速构思和构思

  • 批量处理提示输入,根据从数据库输入的预定义文本提示生成可能数百个视觉输出

通过实施此蓝图,您或您的客户将获得以下优势:

  • 加快上市时间: 可显著缩短创建高分辨率品牌资产所需的时间,从而加快产品上市速度。

  • 轻松定位: 支持即时创建本地化图像,以帮助品牌满足特定的文化趋势或不同市场的需求。

  • 提高工作效率: 使用 3D 数据的易于使用的工具可以降低传统上与高保真资产创建相关的技术技能组合。


  • 咨询热线
  • 4001616691