为了让大语言模型的AI能力更贴近业务需求,本文详细介绍了在阿里云百炼创建自定义模型的最佳实践。即便不清楚大模型的技术细节,您也能按照本篇的操作指引创建一个有效的自定义模型,从而轻松地为业务场景添加大模型服务能力。
自定义大模型是指基于通用大语言模型,通过微调和训练,能更好地适应特定领域或任务的大语言模型。自定义模型概述
您可能需要了解机器学习、深度学习和自然语言处理的基础概念。如果不了解这些概念,您也可以遵循本实践文档的指引完成整个创建流程。
您需要开通阿里云百炼大模型服务平台,并确认账号余额充足,以免无法创建自定义模型。
创建自定义模型时,可能涉及多种计费项,包括但不限于模型调优、模型部署和模型评测。计费规则请参考计费项。
在开始训练前,您需要完成训练数据的准备工作。这些准备工作包括:从业务场景中收集具有代表性的业务数据,并转换为问答对的形式(数据收集);上传训练数据、评测数据、验证数据(数据上传);使用阿里云大模型服务平台百炼提供的数据清洗工具和数据增强工具,提升训练数据的质量。 完成训练数据的准备后,您便可以开始模型调优。模型调优,即使用训练数据集和验证数据集训练模型。 阿里云百炼提供Fine-tuning的训练方式,还提供多种参数的调整,可以根据业务需求调整参数,优化模型调优效果。以下是新建模型训练任务和关联模型训练任务的操作方法: 待您获得自定义模型后,您需要将该模型部署到计算资源上,方可调用该模型。 阿里云百炼提供了多种资源配置方式,您可以按需选择。如果需要评测模型的训练效果,您需要先部署自定义模型,再使用模型评测评估自定义模型的训练效果。 完成模型部署后,如需测试模型的效果,可在模型评测中进行评测。对于本篇介绍的自定义模型,阿里云百炼提供了基线评测方法。基线评测预置多种常用的能力评测集及评测脚本,可自动评测模型多种基本能力。训练数据准备
模型调优
模型部署
模型评测
至此,本篇已经介绍了自定义模型调优、部署与评测的全生命周期管理。阅读完本篇后,您可以自行创建一个自定义模型,并能够在业务场景中调用该自定义模型。
如果您需要将自定义模型投入到阿里云百炼的自定义应用中,请参考应用简介选择并构建应用。
本篇涉及的所有计费信息,请参考产品计费。