要素提取

目标

大语言模型对导入的不同文本进行Keyvalue信息的提取,输出结构化的结果。

效果示例

构建思路

  1. 对相同信息内容的提取是固定要求,导入的文本内容是“变量”,因此我们使用[提示词/Prompts]中的PromptsTemplate组件,通过在“Template”提示词中设置固定内容+变量达到这个目标。

  2. 此外我们还需要语言模型/LLMs中的大语言模型组件帮助我们进行信息提取、装载器/Loaders和InputFileNode组件实现文本内容的导入和解析、ResponseSchema组件和StructuredOutputParser组件对要提取的信息进行规范、描述;

  3. 需要LLMChain组件把大语言模型和提示词组件连接起来,构成一个完整的技能链。

  • 连接示例如图

  • 工作原理

用户上传文档并解析完成后,按照PromptTemplate组件“Template”参数中的提示词模板对内容进行组装,形成完整的提示词,LLMChain组件把提示词传递给大语言模型,输出提取信息内容的结构化的答案。

  • 组件参数设置

    • PromptTemplate

      • “Template”参数

      • 提示词模板如下:

    • 根据提供的{context},提取{format_instructions}信息。-如果你无法在文本中找到某项信息,对应输出值为""。{input} {context}:PyPDFLoader组件导入的文本内容 {format_instructions}:StructuredOutputParser组件和ResponseSchema组件产生的一段提示词,可以控制大语言模型以结构化的形式进行输出答案 {input}:用户输入内容(该场景下,可以输入“开始”、“begin”等词语。)

Last updated