Amazon SageMaker发布Cohere Command R微调模型
关键要点
AWS在Amazon SageMaker上推出了Cohere Command R微调模型,旨在让企业充分利用大型语言模型LLMs的潜力。Cohere Command R是一个可扩展的LLM,专为处理企业级工作负载而设计,优化了对话交互和长期任务的应对能力。微调Cohere Command R模型可以显著提高特定领域和任务的性能,尤其在金融、科技、零售、医疗和法律等行业中,表现提高超过20。使用RAG检索增强生成的方法,结合微调的模型可实现更精准的任务执行,适用于自然语言处理、文本生成和问答等多种应用场景。AWS近日在Amazon SageMaker上发布了Cohere Command R微调模型,这项新功能使企业能够更好地利用大型语言模型LLMs在各种应用中的潜力。Cohere Command R能够轻松处理企业级工作负载,专门优化了对话场景和长期文本处理任务。它具备高性能、精准度和低延迟等特性,使企业能够从概念验证阶段快速过渡到生产应用。
Cohere Command R模型的特性包括高精度的检索增强生成RAG能力、长达128000个标记的上下文长度,并支持10种主要语言,满足企业在多样化应用场景中的需求。
微调:为特定用途定制LLMs
微调是一种有效的技术,可以将Cohere Command R等大型语言模型LLMs适配于特定领域和任务,从而显著提升性能。评估表明,在金融服务、科技、零售、医疗和法律等行业中,微调后的Cohere Command R模型性能提高超过20。相较于尺寸较大的模型,微调后的Cohere Command R可以更高效地服务于需求。
推荐使用至少包含100个示例的数据集来进行微调。

Cohere Command R采用RAG方法,从外部知识库中检索相关背景信息以提升输出质量。然而,微调可以使模型更具针对性,文本生成模型的微调在以下几种场景中至关重要:
场景描述领域特定适配RAG模型可能在金融、法律或医疗等高度专业化领域表现不佳。微调可以让模型适应该领域的独特需求,以提高准确性。数据增强微调允许引入额外的数据源或技术,增强模型的知识库以提高其鲁棒性,尤其在数据稀缺的情况下。精细控制尽管RAG具有出色的整体能力,微调可以实现对模型行为的细致控制,精确适配到期望任务中以实现极致精度。RAG与微调LLMs的结合使您能够以无与伦比的灵活性和效能解决多种挑战。 随着Cohere Command R微调功能在SageMaker上的推出,企业可以根据独特需求定制和优化模型性能。通过在特定领域数据上进行微调,企业可以提高Cohere Command R在自然语言处理、文本生成和问答等场景中的准确性和实用性。
通过结合Cohere Command R的可扩展性和强鲁棒性,以及在SageMaker上的微调能力,AWS使企业能够在AI接受过程中应对复杂性,并利用其变革力量促进各种行业和领域的创新和增长。
客户数据,包括提示、输出、自定义模型以及用于微调或持续预训练的数据,始终保存在客户的AWS账户中,不会与第三方模型提供商共享。
解决方案概述
在接下来的部分中,我们将逐步介绍如何在SageMaker上微调Cohere Command R模型的步骤,包括准备数据、部署模型、准备微调、创建推断端点和执行推断。
准备微调数据
在开始微调作业之前,您需要上传一个带有训练和可选择评估数据的数据集。
首先,确保您的数据以jsonl格式存储,结构应如下:
messages 包含对话消息的列表。每条消息包括以下部分:role 指定当前说话者,可以选择系统System、用户User或聊天机器人Chatbot。content 包含消息内容。下面是一个训练聊天机器人的示例,便于阅读,文档跨越多行。确保您的数据集中每行只包含一个完整示例。
json{ messages [ { role System content 您是一个由Cohere训练的大型语言模型。 } { role User content 嗨!过去10年《时代》杂志的十大封面故事是什么? } { role Chatbot content 过去10年《时代》杂志的十大封面故事是:nn1 弗拉基米尔泽连斯基n2 伊隆马斯克n3 马丁路德金n4 地球如何幸存n5 她的持久影响n6 没有什么好看的n7 核心崩溃n8 处理吧n9 美国之巅n10 苦涩之药 } { role User content 弗拉基米尔泽连斯基是谁? } { role Chatbot content 弗拉基米尔泽连斯基是乌克兰政治家,于2019年当选为乌克兰总统。在此之前,他曾担任弗拉基米尔格罗伊斯曼总理的内政部长。 } { role User content 谢谢! } ]}
一元梯子部署模型
请按照以下步骤部署模型:
在AWS Marketplace上订阅Cohere Command R模型。订阅模型后,您可以配置模型并创建训练作业。
选择“在Amazon SageMaker中查看”。根据界面中的说明创建训练作业。或者,您可以使用以下示例笔记本创建训练作业。
准备微调
要微调模型,您需要以下内容:
产品ARN 在您订阅产品后会提供给您。训练数据集和评估数据集 为微调准备数据集。Amazon S3位置 指定存储训练和评估数据集的Amazon Simple Storage ServiceAmazon S3位置。超参数 微调通常涉及调整各种超参数,例如学习率、批量大小、训练周期数等。您需要指定适合您的微调任务的超参数范围或值。创建推断端点
当微调完成后,您可以使用微调后的模型创建推断端点。要创建端点,请使用createendpoint方法。如果端点已存在,可以使用connecttoendpoint方法进行连接。
执行推断
现在您可以使用该端点进行实时推断。以下是您用于输入的示例消息:
pythonmessage = 将以下文本分类为非常负面、负面、中性、积极或非常积极:mr deeds是,一部喜剧来说,非常傻而且是最好的方式。result = cochat(message=message)print(result)
以下截图显示了微调模型的输出。
可选地,您还可以使用评估数据samplefinetunescienceQAevaljsonl测试模型的准确性。
清理
在您完成笔记本运行和Cohere Command R微调模型的实验后,重要的是要清理您所配备的资源。未清理将可能导致不必要的费用产生。为避免此问题,请使用以下代码删除资源并停止计费过程:
pythoncodeleteendpoint()coclose()
总结
Cohere Command R通过微调使您能够定制模型以满足业务、领域和行业的需求。同时,用户还可以受益于Cohere Command R在最常用商业语言10种语言和RAG引用准确及验证信息的能力。微调后的Cohere Command R在目标用例中实现高性能,同时减少资源使用。企业可以在不需要大量计算的情况下,实现较低的运营成本、改善的延迟和更高的吞吐量。
立即开始使用Cohere的微调模型在SageMaker上构建!
关于作者
Shashi Raina是亚马逊网络服务AWS的高级合作伙伴解决方案架构师,专注于支持生成性AIGenAI初创企业。拥有近6年的AWS工作经验,Shashi在DevOps、分析和生成性AI等多个领域积累了深厚的专业知识。
James Yi是亚马逊网络服务新兴技术团队的高级AI/ML合作伙伴解决方案架构师。他热衷于与企业客户和合作伙伴合作,设计、部署和扩展AI/ML应用,以实现商业价值。工作之余,他喜欢踢足球、旅行和与家人共度时光。
Pradeep Prabhakaran是Cohere的客户解决方案架构师。在Cohere的当前角色中,Pradeep充当客户和合作伙伴的可信技术顾问,提供指导和策略,帮助他们充分发挥Cohere尖端生成AI平台的潜力。在加入Cohere之前,Pradeep曾任亚马逊网络服务的首席客户解决方案经理,领导大型企业的企业云转型项目。在AWS之前,Pradeep曾在Slalom、德勤和Wipro等咨询公司担任过多个领导职位。他拥有工程学学士学位,驻扎在德克萨斯州达拉斯。