私有知识库 - tencentmusic/cube-studio GitHub Wiki

场景配置

知识库可以进行配置,点击cube右上角的“企”图标,再进入私有知识库,即可配置知识库的场景。基础的大模型,配上自己的先验知识文件,或者不同的提示词模板,可以配置成不同的场景。

提示词模板中提供先验知识

比如下图中,我们就是将我们的规模较大的先验知识库配置成upload_url,再把召回的相关性最大的小知识库配置成recall_url,就可以把相关性最大的知识库放到提示词模板中,提高大模型回答问题的准确性。

输入图片说明

多轮对话配置

再比如下图中,我们可以通过在原生大模型中修改提示词模板,传入之前对话的history和query参数,完成多轮对话提示。由于大模型的使用存在提示词长度的限制,这里我们也可以限制上下文的长度。

输入图片说明

接口类型配置

还需要配置接口类型,目前可使用的接口有chatgpt3.5、AIGC、召回列表。前两个是大模型的接口,后一个是用来调试知识库的。

比如我们在构建知识库的过程中,会先配置一个大的先验知识库,然后再通过匹配用户的query,召回一批最为相关的先验知识,再把召回的先验知识放到提示词中,和用户的query一起提给大模型,得到答案。如果答案离我们预期差太远,我们想要调试召回模型,我们就可以使用召回列表这个接口来实现。

输入图片说明

微信、钉钉智能聊天

私有知识库模块已经和微信、钉钉打通,如果想要在微信或钉钉中实现智能聊天,可以配置用户自身微信或钉钉的后台AppID、秘钥、Token等。

输入图片说明

aigc

首先需要在aihub中部署文生图模型,

在这里插入图片描述

在某个场景中配置aigc服务接口

在这里插入图片描述

然后就可以在聊天中进行文生图应用了。

在这里插入图片描述

场景对话

通过以上的几种配置,平台已经实现了以下几种智能聊天的场景。图示给出了使用python聊天窗的效果。

输入图片说明

在聊天窗中直接新建会话场景,上传知识库文件,可以取得和后台配置知识库文件一样的效果。

输入图片说明