您可以在百炼控制台以零代码的方式快速创建智能体应用,并将RAG(Retrieval-Augmented Generation,检索增强生成)以及插件能力集成进来。应用创建完成后,您可以通过控制台或API的方式来使用。
大模型具有强大的语言理解和生成能力,然而大模型有一定局限性,如: 无法回答私有领域问题,如公司制度、人员信息等; 无法及时获取最新消息,如实时天气、比赛结果等; 无法准确回答专业问题,如数学计算、图像生成等。 您可以使用智能体应用来解决这些问题。智能体应用是以大模型为基础,根据业务场景集成特定外部能力的应用。 您可以在百炼控制台通过零代码的方式创建智能体应用,并将外部能力集成到应用中,解决您的业务问题。 智能体应用有许多使用场景,如: 私有领域知识问答 您只需准备好知识库文件,便可以在百炼控制台快速创建一个私有领域知识问答应用,将其应用到如公司制度、人员信息等问答场景。 个性化聊天机器人 百炼提供了长期记忆功能,可以保存关键的历史对话信息,为您提供个性化的聊天体验。此外,百炼集成了夸克搜索和图像生成等插件,可以扩展聊天机器人的功能。 智能助手 通过引入RAG能力、长期记忆以及自定义插件等能力,您可以构建一个智能助手,帮助您提升工作效率,如处理邮件、撰写周报等。 说明 数据更新可能存在延迟,模型的支持情况以智能体应用内显示为准。为什么使用智能体应用
此处外部能力含义为:大模型本身不具备的能力。如获取实时信息、回答私有领域问题等。
支持的模型
访问百炼控制台应用管理,单击新增应用,在智能体应用页签,单击立即创建。 进入智能体应用管理界面后,您需要进行大模型的选择与参数配置。您可以参考右图,单击设置,并在模型选择的下拉菜单中选择模型,此处选择通义千问-Max。您可以根据需求进行模型参数的配置,参数详情请将鼠标移动到 说明 DeepSeek-R1 系列模型暂不支持设置温度系数。 选择大模型之后,您就在百炼创建完成了一个智能体应用。您可以输入问题进行测试。 您可以在智能体应用管理界面,通过设置Prompt、添加RAG与插件等方法拓展智能体应用的能力。 您可以在智能体应用管理界面中输入Prompt来指引应用生成内容的方向。例如设置Prompt为: 输入“你好”,智能体应用的输出如右图。 说明 针对 DeepSeek R1 系列模型,DeepSeek官方不建议设置系统提示词,原文如下:"Avoid adding a system prompt; all instructions should be contained within the user prompt." 您可以在提示词中引用变量,点击提示词下方变量中自定义变量增加自定义变量并在提示词中引用。 RAG (Retrieval-Augmented Generation) 是一种检索技术,它通过自动检索相关文档内容,并将这些信息作为上下文输入给智能体,从而提高智能体的回复准确率。特别是在处理私有知识或垂直领域问答时,RAG能显著提升智能体的效果。 访问应用数据,单击导入数据。此处选择百炼系列手机产品介绍.docx作为知识库文件。在导入数据界面,将文件通过本地上传方式导入。 访问知识库,单击创建知识库。在创建知识库界面填入知识库名称与知识库描述,此处设置知识库名称为:百炼手机产品介绍,知识库描述为:本知识库包含百炼手机产品的详细介绍。其它保持默认选项即可,单击下一步。 单击选择文件,类目位置单击默认类目,文件名称选择百炼系列手机产品介绍。单击下一步。 数据处理,使用默认的智能切分。单击导入完成。 当状态为解析完成时,表示知识库创建完毕。 访问应用管理,单击已创建应用卡片的管理按钮,进入智能体应用管理界面。单击知识库按钮,Prompt中会自动填入让大模型参考知识库的指令。单击+知识库,然后从列表中选择百炼手机产品介绍,其它选项保持默认即可。 知识库配置(可选): 如果您需要配置片段拼装策略、设置知识范围、展示回答来源,您可以进一步修改检索配置。具体配置可参见知识库。 视觉(可选): 当您在智能体应用内选择VL系列模型时,开启视觉功能可在当前会话上传图像,通过大模型的视觉理解能力分析图像内容并解答问题。 动态文件解析(可选): 开启后您可以在当前会话上传文件(文档、图片、视频或音频),预置算法将自动解析文本内容,支持基于文本的问答。 联网搜索(可选): 开启后则依据场景触发联网搜索,配合知识库使用。 样例库(可选): 开启后则提示词中增加${samples}的变量,实现基于few shot的prompt样例引入,提高生成效果。 样例库:增加案例。 配置:设置召回片段数。 向输入框输入问题: 从右图可以看到,在集成了RAG能力后,智能体应用可以根据上传的知识库文件来回答问题。 智能体支持接入 MCP 服务。百炼提供了多种官方MCP服务。您可以在智能体应用管理界面单击+MCP,便可以在MCP广场中选择一个或多个MCP服务。具体MCP服务使用案例,请参见百炼MCP快速入门。 说明 DeepSeek和QwQ系列模型暂不支持MCP服务。 此处以Amap Maps为例,勾选对应服务后,点击确定。 您可以在同一个智能体应用中选择最多5个MCP服务。智能体应用会根据输入选择使用一个或多个MCP服务。 添加服务后,向输入框输入: 智能体应用的回复如右图,可以看到智能体应用多次调用MCP服务,完成路径规划和时间估算。 插件可以使智能体应用更高效、更专业地应用到业务场景中。百炼提供了多种官方插件。您可以在智能体应用管理界面单击选择插件,便可以在插件栏中选择一个或多个插件。 说明 DeepSeek和QwQ系列模型暂不支持插件,包括“夸克搜索”在内的联网搜索插件目前无法使用。 此处以图片生成插件为例,选择对应插件后,单击添加至智能体。 添加插件后,向输入框输入: 智能体应用的回复如右图,可以看到智能体应用调用了图像生成插件(即text_to_image)。 您可以在同一个智能体应用中选择最多10个插件。智能体应用会根据输入选择使用一个或多个插件。比如提问: 智能体应用会输出如右图的内容。 智能体应用具备短期对话记忆能力,但受限于大模型注意力机制,可能无法长时间保持上下文连贯性。 长期记忆功能允许大模型自动存储个性化信息,确保智能体应用在后续对话中能够持续调用和参考这些信息,提升对话的个性化和连贯性。 在智能体应用编辑界面,开启长期记忆功能开关。 点击记忆变量,添加新的记忆变量字段,点击右上角发布按钮,发布应用。 输入“我是一名前端开发工程师”,等待大模型回答完毕。 点击记忆,即可查看两种记忆类型: 记忆片段是长期记忆功能的一部分,用于展示大模型基于对话历史自动提取的用户个性化信息。 记忆变量则是您自己定义的个性化信息。 此时,大模型在两种长期记忆中都保存了我们输入的信息。即使当前聊天被清除后,这些记忆也能保存到新对话中。 您可以使用文本、语音或视频对话的方式体验智能体应用。 文本对话是智能体应用的核心交互方式,为您提供智能和个性化的多轮对话体验。智能体将以文本形式回复您的问题。 文本对话支持两种主要输入方式: 直接文本输入: 您可以通过键盘输入文字与智能体进行交流。 文件上传: 除了文字输入,您还可以直接上传文档、图片、视频和音频。智能体应用会自动提取文件信息,使您可以直接针对文件内容进行对话。 在智能体应用编辑界面,开启视觉功能开关后,您可以上传图片。此功能需要使用视觉(VL)模型下使用。 智能体应用还支持语音和视频对话: 语音对话:依托语音合成-CosyVoice/Sambert模型,智能体可以将文本回复转换为自然语音输出,您可以与智能体进行流畅的语音交流。 视频对话:依托视觉理解模型,智能体可以识别画面中的物体、场景、人物动作等,您可以与智能体进行实时视频通话。 全球高可用、低延迟:依托阿里云的实时音视频网络体系,全球3200+节点覆盖和QoS优化,使得用户可以在全球范围内与 AI 智能体完成音视频通话。 高度拟人化:通过持续迭代智能降噪、智能打断、智能断句等功能,使智能体在互动行为上更接近于人类,CosyVoice模型提供更加逼真的人声。 易调试:提供体验窗与调试信息展示,全流程可观测、可修改、可调试。 易体验、易集成:集成方式可参见集成方案。 说明 DeepSeek R1和QwQ系列模型不支持音频和视频对话功能;DeepSeek V3 模型不支持视频对话功能 首先,请配置一个可正常执行的智能体。 然后,请通过文本对话调试出符合预期的效果。 切换到语音交互或视频交互,配置 API-KEY。 进行音视频设置,配置参数后,在体验窗调试音视频交互效果。 其中语音转文字可进行语种选择 点击右上角体验按钮,生成临时体验二维码,通过手机微信/钉钉/浏览器扫码体验交互效果。 效果确认后,点击发布按钮,进入发布渠道,完成智能媒体服务开通和SLR授权后,创建互动智能体。 说明 计费模式:百炼与视频云分别产生应用调用的账单。 百炼按照应用API调用计费(如果TTS选择百炼CosyVoice,则模型调用也会计费),详情请参见大模型产品计费说明。 视频云按照AI实时互动计费模式计费,AI实时互动每日为未订阅套餐包的用户赠送20通免费电话额度用于产品体验。详情请参见AI实时互动计费说明。 发布后的应用可以被API调用,也可以通过Web页面分享给同一主账号下的RAM子账号使用。您可以单击智能体应用管理界面右上角的发布按钮。如果您的应用非首次发布,弹窗会向您展示当前智能体应用相比于上一次发布时的修改项。在您确认修改项后单击确认发布。 说明 如果您使用了 RAM 账号创建应用,发布应用前请确认已拥有服务关联角色权限 您可以在智能体应用发布渠道页签,单击API调用右侧的查看API,查看通过API调用智能体应用的方法。 单击官方或魔笔渠道右侧的生成分享链接,您可以按需将该链接分享给同一主账号下的RAM子账号使用。 您可以将智能体应用与钉钉机器人集成,以便通过钉钉访问和使用智能体应用。要实现此集成,您需要在钉钉平台上创建一个机器人,并将其与您的百炼应用相关联。详细的操作步骤,请参阅 通过钉钉发布应用。 您可以将智能体应用与微信公众号集成,以便用户通过微信公众号访问和使用智能体应用。要实现此集成,您需要创建一个微信公众号,并将其与您的百炼应用相关联。详细的操作步骤,请参阅 通过微信发布应用。 在应用的发布渠道页签下,将鼠标悬停在微信公众号右侧的二维码图标上,即可显示公众号的二维码。用户可以通过微信扫一扫功能,扫描此二维码来关注您的公众号,进而访问已集成的百炼应用。 您可以在应用管理找到已发布的应用卡片,在 进行删除与复制智能体、修改应用名操作。 发布应用后,您可以在内置的安全规则基础上,自定义内容干预规则,确保大模型生成的内容安全可控。您还可以选择开启和备份多轮对话。 您可以在应用管理找到已发布的应用卡片,在 配置以上功能。 在使用智能体应用时,如果您希望妥善处理对话中存在潜在的违规、敏感或不当内容,可以借助快速干预工具来及时拦截和处理。该工具能够基于自定义的规则,对用户输入或模型生成的文本进行检测,一旦触发条件就会执行预先设置的干预操作。 通过以上两步,您就能够使用快速干预工具对潜在的风险内容进行一站式的拦截和替换,保证您的智能体应用在与用户交互时保持合规与安全。这样既有助于满足平台审核要求,也能为最终用户提供更健康的对话体验。 智能体应用默认开启多轮对话功能。百炼提供内置缓存,用于保存多轮对话记录,有效期为会话开始后 1 小时。您也可以选择将多轮对话记录备份至 ADB-PG。 除快速干预工具外,智能体应用还内置了一套内容安全策略。当大模型生成的内容触发此策略时,智能体应用将拦截全部生成内容,并提示内容存在安全问题。 目前,百炼仅提供“全部拦截”的风险内容拦截方式,您无需手动配置此项。 如果您需编辑历史版本描述信息,或选择和使用发布过的历史版本,您可以通过版本管理功能实现。具体操作请参见以下操作步骤: 您可以在智能体应用的配置页签,单击顶部导航栏右侧的版本管理。 在历史版本列表中,选中目标版本后: 如果您需修改版本信息,请将鼠标悬浮至 如果您需使用该版本,请单击覆盖当前草稿,在二次确认对话框中单击确认。 百炼提供了丰富的实践教程文档,如果您想快速将百炼集成到您的业务中,请参考实践教程。步骤一:创建智能体应用
1. 创建应用
如果您之前已创建过应用,则单击右上角的新增应用。
2. 选择大模型并配置参数
进行查看,若无特定需求保持默认即可。
3. 测试应用
步骤二:拓展智能体应用的能力
系统提示词(System Prompt):指引内容生成方向
请你模仿李白的语气。
知识检索增强(RAG):提升私域知识问答能力
提示: RAG 检索到的文本也会占用大模型的上下文窗口长度(Context Window),因此需要根据实际情况调整检索策略和文本长度,以充分利用上下文窗口并避免超出限制。
1. 上传数据
2. 创建知识库
3. 在应用中集成RAG
如需了解文件大小、格式及操作演示,请参考上传文件。
我喜欢打游戏,推荐哪款手机?
当智能体应用关联结构化知识库时,支持在提问时上传图片。此时,如果知识库中存在图片索引,系统会先将输入图片转为向量并检索到相关记录,然后将这些记录与提问一起提供给大模型;如果不存在图片索引,则输入的图片不会用于检索。
智能体应用目前仅支持生成文本内容。
MCP 服务:接入海量第三方应用的工具集
同时您也可以添加自定义 MCP 服务,详情请查看百炼MCP快速入门。
1. 添加服务
使用Amap Maps之前需要开通服务,具体请参见百炼MCP快速入门。
2. 测试插件效果
现在出发,从杭州萧山国际机场到杭州西湖景区。请你提供三种公共交通出行方案。
插件:接入图像视频、代码执行等更多效率工具
同时您也可以添加自定义插件,详情请查看插件概述。
1. 添加插件
2. 测试插件效果
画一只猫。
3. 使用更多插件
查一下杭州明天的天气,并将这个天气的西湖画出来。
长期记忆:保存个性化信息
详细的功能介绍请参考长期记忆文档。
1. 开启长期记忆
2. 配置用户画像
字段是记忆变量的属性,例如“岗位”、“行业”、“兴趣爱好”等。
字段描述用于解释字段名称,帮助大模型更好地理解字段的含义。
是否通过模型推理控制该字段是否参与模型推理。开启后,系统会根据对话内容自动推理和填充该字段的记忆变量信息。关闭后,则需要通过手动设置。
3. 测试记忆效果
步骤三:体验智能体应用
视频对话仅限通义千问 VL 系列模型
文本对话和文件上传
如需了解文件大小、格式及操作演示,请参考上传文件。
语音和视频通话
功能亮点
用法说明
#角色
你是一个口语练习专家,你会首先使用中文对用户的英文输入进行点评,给出优化建议、纠错及润色,之后使用英文维持继续对话,不要加入多余的中文翻译。
#执行步骤
1.如果用户用中文交流,让用户重新用英文对话。
2.针对用户的英文输入,使用中文进行评价,给出优化建议。
3.使用英文开启下一轮对话,不要说出中文意思。
4.不要输出占位符等无法被转换为语音的文本信息。
文字转语音可进行语音模型选择和音色选择
步骤四:发布智能体应用
ram:CreateServiceLinkedRole
,详情请参考服务关联角色。如果您的应用为首次发布,则不会有弹窗信息。
通过API调用
注:您需用您的API KEY对DASHSCOPE_API_KEY进行替换才可发起调用。
通过官方或魔笔渠道分享应用
发布为钉钉机器人
发布为微信公众号
步骤五:删除与复制智能体
步骤六:配置内容安全和多轮对话(可选)
使用快速干预工具处置风险内容
启动和备份多轮对话
如果需要了解 ADB-PG 的更多功能与计费信息,请参阅云原生数据仓库AnalyticDB PostgreSQL版帮助文档。
配置风险内容的拦截方式
步骤七:版本管理
图标位置单击,在编辑版本描述对话框中按需完成修改后,单击确定。
此版本内容将覆盖当前版本草稿内容。
下一步
知识库检索额外计费吗? 知识检索增强功能免费,但检索到的内容作为模型输入,按模型输入 Token 计费。 自定义插件是否有超时限制? 是,超时限制时间为 5 秒。 使用智能体应用对外提供 AI 服务,需要通过什么备案审核吗? 根据国家网信办《生成式人工智能服务管理暂行办法》,百炼智能体应用对外提供服务时,需要通过相应的备案或审核。具体备案流程和要求请参考调用通义系列大模型开发应用上架应用商店/微信小程序申请指南。 是否支持通过 API 创建智能体应用? 支持使用 Assistant API 创建大模型应用,其功能和智能体应用类似。 注意: Assistant API 创建的应用不支持控制台管理,详细信息请参阅 Assistant API 文档。常见问题