知识库 Schema

2026-04-27   访问量:0


知识库 Schema 是描述知识库内数据结构的信息,向智能体应用提供知识库构成的依据。主要体现在应用的知识检索与调用效果上,因此需在应用内的知识管理处进行配置。知识库数据分为两类:结构化数据和非结构化数据。

结构化数据包含数据库。当知识库中引入数据库时,无需生成知识库 Schema。

非结构化数据包括知识库文档的常规链路,主要由文档和问答组成。文档类知识指以文档形式存储的知识,包括 Word、PPT、表格、图片等数据格式。Schema包含文档的文件名、摘要以及标签。当文档数量较多时,知识库 Schema 生成过程会自动对知识库进行聚类。聚类完成后,将生成文件夹名称和文件夹摘要信息。在此情况下,无需传入文档标签。

定义

说明

文件名

用户上传的文件名称,可能具备含义,也可能无明确语义。

文件夹名

自动聚类概括生成的文件夹名称。

摘要

文件内容的50字左右摘要,由大模型生成。

文件夹摘要

文件夹内容说明,由大模型生成的描述文件夹内的内容摘要。

标签

用户定义的文档标签。如果未定义则缺省。

问答类知识以“问题-答案”的形式成对存在。Schema 包括 Question、Answer 和标签。

定义

说明

Question

用户设定的问题内容。

Answer

对应问题的匹配答案。

标签

用户定义的问答对标签。如果未定义则缺省。

创建方式

知识库检索 Agent 的运行依赖于知识库 Schema。单击应用 > 知识管理,手动点击知识库 Schema。生成 Schema 后,可分别查看各知识库的 Schema 信息。







单击知识库设置,可调整知识库 Schema 生成模型。







注意:

生成知识库 Schema 将消耗 tokens 并产生费用,具体用量取决于知识库的文档规模,计费模型将根据知识库设置中选择的知识库 Schema 生成模型计费。

如需了解如何在应用内引用知识检索 Agent,请参见 知识库检索 Agent




热门文章
更多>