要素提取
Last updated
Last updated
大语言模型对导入的不同文本进行Keyvalue信息的提取,输出结构化的结果。
对相同信息内容的提取是固定要求,导入的文本内容是“变量”,因此我们使用[提示词/Prompts]中的PromptsTemplate组件,通过在“Template”提示词中设置固定内容+变量达到这个目标。
此外我们还需要语言模型/LLMs中的大语言模型组件帮助我们进行信息提取、装载器/Loaders和InputFileNode组件实现文本内容的导入和解析、ResponseSchema组件和StructuredOutputParser组件对要提取的信息进行规范、描述;
需要LLMChain组件把大语言模型和提示词组件连接起来,构成一个完整的技能链。
连接示例如图
工作原理
用户上传文档并解析完成后,按照PromptTemplate组件“Template”参数中的提示词模板对内容进行组装,形成完整的提示词,LLMChain组件把提示词传递给大语言模型,输出提取信息内容的结构化的答案。
组件参数设置
PromptTemplate
“Template”参数
提示词模板如下:
根据提供的{context},提取{format_instructions}信息。-如果你无法在文本中找到某项信息,对应输出值为""。{input} {context}:PyPDFLoader组件导入的文本内容 {format_instructions}:StructuredOutputParser组件和ResponseSchema组件产生的一段提示词,可以控制大语言模型以结构化的形式进行输出答案 {input}:用户输入内容(该场景下,可以输入“开始”、“begin”等词语。)