咨询热线:

4001616691

解决方案

当前位置:首页 >> 解决方案

NVIDIA 中构建 RAG 基问答大语言模型工作流程

详情介绍:

       利用检索增强生成(RAG)技术快速开发解决方案,助力问答 LLM 工作流程,由此催生出新型系统架构。NVIDIA 将 AI 用于内部运营,并在系统功能与用户期望之间取得了多项重要发现。

       研究发现,无论预期的范围或用例如何,用户通常都希望能够执行非 RAG 任务,例如执行文档翻译、编辑电子邮件甚至编写代码。一个普通的 RAG 应用程序可能会这样实现:对每个消息执行检索管道,从而导致令牌的过度使用,并由于包含不相关的结果而导致不必要的延迟。

研究还发现,即使应用程序专为访问内部私有数据而设计,用户也非常喜欢访问 Web 搜索和摘要功能。我们使用 Perplexity 的搜索 API 来满足这一需求。

       NVIDIA NIM 微服务及其 LlamaIndex 连接器使开发具有自我管理或托管 LLM 的 LLM 应用变得轻而易举。Chainlit 和 LlamaIndex Workflow 事件因其共享的事件驱动架构而完美契合,因此可以轻松为用户界面提供有关 LLM 响应的完整追踪信息。


image.png

LlamaIndex Workflow 处理过程

LlamaIndex Workflow events 通过其事件驱动、基于步骤的方法来控制应用程序的执行流程,准确地提供了我们所需的解决方案。我们发现,将应用程序扩展为 Workflow events 要容易得多,速度也更快,同时仍保留关键的 LlamaIndex 功能,例如必要时的向量存储和检索器。下图为 Workflow 事件流程。

LlamaIndex Workflow 处理过程

LlamaIndex Workflow events 通过其事件驱动、基于步骤的方法来控制应用程序的执行流程,准确地提供了我们所需的解决方案。我们发现,将应用程序扩展为 Workflow events 要容易得多,速度也更快,同时仍保留关键的 LlamaIndex 功能,例如必要时的向量存储和检索器。下图为 Workflow 事件流程。

image.png

LlamaIndex Workflow 功能与特点

1. 数据摄取:

· 数据连接器: LlamaIndex 提供到各种数据源的连接器,如数据库、API、文件等,允许用户轻松地将数据摄取到工作流程中。

· 文档解析: 提供解析不同文档格式的工具,以便为索引和查询做好数据准备。

2. 索引:

· 数据索引: 数据摄取后,LlamaIndex 将数据以一种大型语言模型可以高效处理和查询的方式进行索引。这包括创建嵌入,即捕捉文本语义含义的向量表示。

· 自定义索引结构: 用户可以定义自定义索引结构或使用预构建的索引结构,以优化不同类型的查询。

3. 查询:

· 查询引擎: 一个理解如何从索引数据中检索相关信息的查询引擎。它可以使用相似性搜索、关键词搜索或更高级的检索技术。

· 语境搜索: 能够执行语境相关的搜索,利用大型语言模型的语义理解。

4. 与LLMs的集成:

· 提示工程: LlamaIndex Workflow 促进提示工程,用户可以设计提示来引导LLM的响应,增强特定任务的模型输出。

· 响应生成: 工作流程与LLMs集成,以基于索引数据和用户查询生成响应。

5. 应用开发:

· API和SDK: 提供开发者可以用来将LlamaIndex功能集成到其应用程序中的API和SDK。

· 端到端解决方案: 帮助构建从数据摄取到提供基于该数据的答案或见解的端到端应用。

6. 优化和性能:

· 缓存: 为了提高性能,LlamaIndex 可以缓存结果或中间步骤,以避免重复计算。

· 并行处理: 支持并行处理以同时处理大数据集或多个查询。

7. 可扩展性:

· 插件和扩展: 用户可以通过插件或自定义扩展来扩展LlamaIndex的功能,允许进行专业任务或与其他工具集成。

使用场景:

· 知识检索: 从庞大的数据集或文档库中快速查找信息。

· 聊天机器人和虚拟助手: 通过提供基于大知识库的理解和响应能力,增强对话代理。

· 数据分析: 通过提供见解或总结大量文本数据来协助数据分析。

· 教育和研究: 通过提供相关文献或数据来支持研究。

LlamaIndex Workflow 

       对于希望利用大型语言模型来处理需要从复杂数据集中深入理解和检索信息的任务的组织或个人特别有用。它旨在填补原始数据与LLMs能力之间的差距,使得利用AI进行信息检索和分析变得更容易。

  • 咨询热线
  • 4001616691