知识标签
# 知识标签
——通过这篇文章帮助您了解知识标签的使用方式
# 知识标签的作用
我们希望您在了解知识标签之前,了解它的场景及用途:
● 使用场景: 在知识问答RAG场景,存在知识片段语义相似度较为接近,在知识召回时不准确的问题,进而引发大模型回答的不准确。主要有以下情况:
- 制造业企业售后排障场景:制造业企业的产品型号繁多,故障类型也复杂多样,且不同产品型号、故障类型之间的语义相似度较高。在知识问答过程中,系统容易混淆相似的产品型号,错误地召回与实际故障不匹配的产品型号文档,最终导致大模型给出的回答不准确,影响售后排障效率。
- 企业内部SSC问答场景:企业内部不同职级、部门的员工,其薪酬福利方案存在差异。然而,在知识问答时,由于语义相似度接近,系统可能无法准确区分不同员工对应的文档,容易召回错误的员工文档,使得大模型提供错误的薪酬福利相关回答,给员工带来困扰。
- 游戏知识问答场景:游戏中的角色和道具丰富多样,各自拥有独特的玩法攻略和解释说明。但由于不同角色、道具的文档在语义上可能存在相似之处,在知识问答时,系统容易将其他角色或道具的文档错误召回,导致大模型回答不准确,影响玩家的游戏体验。
针对以上语义相似度接近导致的召回错误问题,您可以通过知识标签功能进行RAG优化。当访客问题与知识片段存在标签匹配时,被匹配的片段相似度分数将会经过标签加权得到一个更高的综合分数,使正确切片更容易被召回,提高问答准确率。同时,如果有一些需要召回的片段未召回,也可以通过手动标记标签来增加匹配分数,使其更容易召回。
● 亮点:
- 大模型自动标记标签,提升知识运用效率。
- 大模型机器人通过标签快速、准确匹配知识,提高问答准确率和回答质量。
# 知识标签配置
# 如何创建知识标签
在【知识中心 - 知识库 - 知识标签】页面,您能够创建知识标签。进入知识标签页(可参考图 2),点击【添加】按钮,即可跳转至添加标签页(详见图 3)。当您填写【组名称】时,建议选择那些在知识问答场景中容易引发混淆的名词,或是与业务配置紧密相关的内容作为标签,例如产品型号、商品名称、故障类型(包含故障代码)、游戏角色等。完成上述操作后,便可为相应的【组】配置对应的【标签】。
# 如何为知识添加标签
- 如何自动标记标签
- 在创建标签的过程中,若您开启了【自动标记】按钮(参考图 3),需选定自动标记的适用范围。此后,大模型会自动将该组内的标签标记到对应的知识上。完成新建标签操作后,系统会在次日 0:00 检测是否存在新标签。一旦检测到新标签,便会为所有相关片段自动添加该标签。(不同区域的标记时区不同。国内和新加坡环境为东八区0:00,北美环境为零时区0:00)
- 当您在知识中心新增或编辑知识,且知识解析结束后,系统会自动为知识打上所有属于“自动标记”类型的标签。
- 相反,若在创建标签时未开启【自动标记】功能,那么就需要您手动为知识打上相应标签。
- 注意:目前,自动标记功能还处于Beta内测阶段,如您想体验功能,可以联系您的客户经理帮忙开启。
- 如何手动添加标签
1.在解析片段中手动添加标签
在知识中心(【知识中心-知识库-知识库管理-编辑】)查看已发布的知识文档,可以对解析片段添加标签。
- 在算法详情页添加标签
在查看线上接待记录或者客户问题学习时,会话记录中的【大模型机器人-算法生成过程】模块,可以查看本次问答召回和采用的切片。您可以对已召回和采用的切片添加标签,以优化召回和采用效果。
图5:添加标签实现知识优化页面
# 编辑知识标签及自动标记的知识库
编辑标签信息 当您编辑标签组名称和标签时,正在批跑的标签任务会暂停,第二天0:00系统将开启新任务,并按照您编辑后的标签信息重新打标签;当您删除标签时,会立刻开始删除所有标签。因此建议您谨慎修改标签,否则会造成非必要的费用消耗。
修改自动标记的知识库 当设置自动标记的知识库增加后,第二天服务器0:00为新增知识库的所有相关文档打上该标签;当设置自动标记的知识库减少后,系统将立刻为非自动标记的知识片段删除标签。
# 如何通过标签提高问答效果
# 标签建议使用方式
通过知识标签提高问答效果,这里我们给出两个建议:
依据知识库中的产品型号、故障类型、游戏角色、人员职级等关键信息,构建一套体系化的标签系统。 以 3C 家电行业为例,您能够按照“组名称:扫地机器人型号”的架构来创建标签组,具体标签可设置为“s1、s2、s3”等。如此一来,当用户针对扫地机器人的不同型号提出具体问题时,机器人便能更精准地识别并关联到对应的型号标签,为用户提供更准确、更有针对性的解答。
在问答过程中,若遇到某些知识难以被准确召回的情况,您可以通过为其添加标签的方式来优化匹配效果,提升匹配分数,从而促进知识的成功召回。 以游戏账号申诉场景为例,部分玩家在表达问题时可能会使用较为口语化的表述,如“我的账号被ban了”。然而,相似度模型在处理这类表述时,往往难以将其与标准的“账号被封禁”这一概念建立起有效的关联。 针对这种情况,您可以为该知识添加一个“账号封禁”的标签。借助大模型的强大推理能力,它能够判断出玩家所说的“我的账号被ban了”与所添加的“账号封禁”标签之间存在紧密的关联性。这样一来,机器人就能够依据这一关联,将原本难以召回的知识成功匹配并呈现出来。
# 知识标签算法原理
AI如何自动为知识添加标签 通过将知识切片与标签(包含标签组名称和具体标签)进行语义匹配,以实现自动打标签效果。首先,会采用相对轻量的小模型,来计算切片与各个标签之间的相似程度。最终保留相似度排名前 20 的标签。完成预筛选后,就由大模型发挥作用,从这 20 个标签中挑选出最适合内容切片的标签。
标签增强问答原理 在实际问答中,机器人首先会对知识中心的所有知识进行“相似度”计算,得到相似度分数。其次,机器人会对客户问题打标签,并与所有知识片段的标签进行匹配,得到每个知识片段的标签加权分数。最后,机器人会用标签加权后分数比对召回阈值,将分数高于阈值的知识“召回”,供RAG问答使用。
调整标签权重 机器人将根据知识标签匹配情况对“相似度分数”进行标签加权,最终得出综合分数用于知识召回。其中,知识标签权重越高,标签加权后的分数越高。
# 计费
大模型每为知识片段打上一个标签,都会记扣0.2条AI资源包(不足1条时记为1条)。您可以在【管理中心-企业账户-资源包账单】中查看计费情况,使用产品为大模型机器人。