亚马逊 SageMaker 发布 Cohere Command R 微调模型机器学习博客

2026-01-27 12:23:23

Amazon SageMaker发布Cohere Command R微调模型

关键要点

AWS在Amazon SageMaker上推出了Cohere Command R微调模型，旨在让企业充分利用大型语言模型LLMs的潜力。Cohere Command R是一个可扩展的LLM，专为处理企业级工作负载而设计，优化了对话交互和长期任务的应对能力。微调Cohere Command R模型可以显著提高特定领域和任务的性能，尤其在金融、科技、零售、医疗和法律等行业中，表现提高超过20。使用RAG检索增强生成的方法，结合微调的模型可实现更精准的任务执行，适用于自然语言处理、文本生成和问答等多种应用场景。

AWS近日在Amazon SageMaker上发布了Cohere Command R微调模型，这项新功能使企业能够更好地利用大型语言模型LLMs在各种应用中的潜力。Cohere Command R能够轻松处理企业级工作负载，专门优化了对话场景和长期文本处理任务。它具备高性能、精准度和低延迟等特性，使企业能够从概念验证阶段快速过渡到生产应用。

Cohere Command R模型的特性包括高精度的检索增强生成RAG能力、长达128000个标记的上下文长度，并支持10种主要语言，满足企业在多样化应用场景中的需求。

微调：为特定用途定制LLMs

微调是一种有效的技术，可以将Cohere Command R等大型语言模型LLMs适配于特定领域和任务，从而显著提升性能。评估表明，在金融服务、科技、零售、医疗和法律等行业中，微调后的Cohere Command R模型性能提高超过20。相较于尺寸较大的模型，微调后的Cohere Command R可以更高效地服务于需求。

推荐使用至少包含100个示例的数据集来进行微调。

亚马逊 SageMaker 发布 Cohere Command R 微调模型机器学习博客

Cohere Command R采用RAG方法，从外部知识库中检索相关背景信息以提升输出质量。然而，微调可以使模型更具针对性，文本生成模型的微调在以下几种场景中至关重要：

场景描述领域特定适配RAG模型可能在金融、法律或医疗等高度专业化领域表现不佳。微调可以让模型适应该领域的独特需求，以提高准确性。数据增强微调允许引入额外的数据源或技术，增强模型的知识库以提高其鲁棒性，尤其在数据稀缺的情况下。精细控制尽管RAG具有出色的整体能力，微调可以实现对模型行为的细致控制，精确适配到期望任务中以实现极致精度。

RAG与微调LLMs的结合使您能够以无与伦比的灵活性和效能解决多种挑战。随着Cohere Command R微调功能在SageMaker上的推出，企业可以根据独特需求定制和优化模型性能。通过在特定领域数据上进行微调，企业可以提高Cohere Command R在自然语言处理、文本生成和问答等场景中的准确性和实用性。

通过结合Cohere Command R的可扩展性和强鲁棒性，以及在SageMaker上的微调能力，AWS使企业能够在AI接受过程中应对复杂性，并利用其变革力量促进各种行业和领域的创新和增长。

客户数据，包括提示、输出、自定义模型以及用于微调或持续预训练的数据，始终保存在客户的AWS账户中，不会与第三方模型提供商共享。

解决方案概述

在接下来的部分中，我们将逐步介绍如何在SageMaker上微调Cohere Command R模型的步骤，包括准备数据、部署模型、准备微调、创建推断端点和执行推断。

准备微调数据

在开始微调作业之前，您需要上传一个带有训练和可选择评估数据的数据集。

首先，确保您的数据以jsonl格式存储，结构应如下：

messages 包含对话消息的列表。每条消息包括以下部分：role 指定当前说话者，可以选择系统System、用户User或聊天机器人Chatbot。content 包含消息内容。

下面是一个训练聊天机器人的示例，便于阅读，文档跨越多行。确保您的数据集中每行只包含一个完整示例。

json{ messages [ { role System content 您是一个由Cohere训练的大型语言模型。 } { role User content 嗨！过去10年《时代》杂志的十大封面故事是什么？ } { role Chatbot content 过去10年《时代》杂志的十大封面故事是：nn1 弗拉基米尔泽连斯基n2 伊隆马斯克n3 马丁路德金n4 地球如何幸存n5 她的持久影响n6 没有什么好看的n7 核心崩溃n8 处理吧n9 美国之巅n10 苦涩之药 } { role User content 弗拉基米尔泽连斯基是谁？ } { role Chatbot content 弗拉基米尔泽连斯基是乌克兰政治家，于2019年当选为乌克兰总统。在此之前，他曾担任弗拉基米尔格罗伊斯曼总理的内政部长。 } { role User content 谢谢！ } ]}

一元梯子

部署模型

请按照以下步骤部署模型：

在AWS Marketplace上订阅Cohere Command R模型。

订阅模型后，您可以配置模型并创建训练作业。

选择“在Amazon SageMaker中查看”。根据界面中的说明创建训练作业。

或者，您可以使用以下示例笔记本创建训练作业。

准备微调

要微调模型，您需要以下内容：

产品ARN 在您订阅产品后会提供给您。训练数据集和评估数据集为微调准备数据集。Amazon S3位置指定存储训练和评估数据集的Amazon Simple Storage ServiceAmazon S3位置。超参数微调通常涉及调整各种超参数，例如学习率、批量大小、训练周期数等。您需要指定适合您的微调任务的超参数范围或值。

创建推断端点

当微调完成后，您可以使用微调后的模型创建推断端点。要创建端点，请使用createendpoint方法。如果端点已存在，可以使用connecttoendpoint方法进行连接。

执行推断

现在您可以使用该端点进行实时推断。以下是您用于输入的示例消息：

pythonmessage = 将以下文本分类为非常负面、负面、中性、积极或非常积极：mr deeds是，一部喜剧来说，非常傻而且是最好的方式。result = cochat(message=message)print(result)

以下截图显示了微调模型的输出。

可选地，您还可以使用评估数据samplefinetunescienceQAevaljsonl测试模型的准确性。

清理

在您完成笔记本运行和Cohere Command R微调模型的实验后，重要的是要清理您所配备的资源。未清理将可能导致不必要的费用产生。为避免此问题，请使用以下代码删除资源并停止计费过程：

pythoncodeleteendpoint()coclose()

总结

Cohere Command R通过微调使您能够定制模型以满足业务、领域和行业的需求。同时，用户还可以受益于Cohere Command R在最常用商业语言10种语言和RAG引用准确及验证信息的能力。微调后的Cohere Command R在目标用例中实现高性能，同时减少资源使用。企业可以在不需要大量计算的情况下，实现较低的运营成本、改善的延迟和更高的吞吐量。

立即开始使用Cohere的微调模型在SageMaker上构建！

关于作者

Shashi Raina是亚马逊网络服务AWS的高级合作伙伴解决方案架构师，专注于支持生成性AIGenAI初创企业。拥有近6年的AWS工作经验，Shashi在DevOps、分析和生成性AI等多个领域积累了深厚的专业知识。

James Yi是亚马逊网络服务新兴技术团队的高级AI/ML合作伙伴解决方案架构师。他热衷于与企业客户和合作伙伴合作，设计、部署和扩展AI/ML应用，以实现商业价值。工作之余，他喜欢踢足球、旅行和与家人共度时光。

Pradeep Prabhakaran是Cohere的客户解决方案架构师。在Cohere的当前角色中，Pradeep充当客户和合作伙伴的可信技术顾问，提供指导和策略，帮助他们充分发挥Cohere尖端生成AI平台的潜力。在加入Cohere之前，Pradeep曾任亚马逊网络服务的首席客户解决方案经理，领导大型企业的企业云转型项目。在AWS之前，Pradeep曾在Slalom、德勤和Wipro等咨询公司担任过多个领导职位。他拥有工程学学士学位，驻扎在德克萨斯州达拉斯。

上一篇 AWS 认证的退役与推出培训与认证博客

下一篇使用 Amazon Bedrock 和 Amazon Kendra 构建生成式 AI Slack 聊

产品展示

亚马逊 SageMaker 发布 Cohere Command R 微调模型机器学习博客

Amazon SageMaker发布Cohere Command R微调模型

关键要点

微调：为特定用途定制LLMs

解决方案概述

准备微调数据

部署模型

准备微调

创建推断端点

执行推断

清理

总结

关于作者

最新资讯

通过 Amazon QuickSight 自动化简化报告流程商业智能博客

研究重点突出在保障开源软件方面的挑战与优先事项媒体

新星暴雪攻击瞄准 WhatsApp 账户媒体

将您的 Ruby Gems 添加到 AWS CodeArtifact 新闻博客

如何在 Amazon EKS 中使用 AWS Secrets Manager 和 ABAC 来增强秘

导航

订阅我们的时事通讯并获取最新消息

导航

最新内容

将您的 Ruby Gems 添加到 AWS CodeArtifact 新闻博客

如何在 Amazon EKS 中使用 AWS Secrets Manager 和 ABAC 来增强秘

联系我们

产品展示

亚马逊 SageMaker 发布 Cohere Command R 微调模型 机器学习博客

Amazon SageMaker发布Cohere Command R微调模型

关键要点

微调：为特定用途定制LLMs

解决方案概述

准备微调数据

部署模型

准备微调

创建推断端点

执行推断

清理

总结

关于作者

最新资讯

通过 Amazon QuickSight 自动化简化报告流程 商业智能博客

研究重点突出在保障开源软件方面的挑战与优先事项 媒体

新星暴雪攻击瞄准 WhatsApp 账户 媒体

将您的 Ruby Gems 添加到 AWS CodeArtifact 新闻博客

如何在 Amazon EKS 中使用 AWS Secrets Manager 和 ABAC 来增强秘

导航

订阅我们的时事通讯并获取最新消息

导航

最新内容

将您的 Ruby Gems 添加到 AWS CodeArtifact 新闻博客

如何在 Amazon EKS 中使用 AWS Secrets Manager 和 ABAC 来增强秘

联系我们

亚马逊 SageMaker 发布 Cohere Command R 微调模型机器学习博客

通过 Amazon QuickSight 自动化简化报告流程商业智能博客

研究重点突出在保障开源软件方面的挑战与优先事项媒体

新星暴雪攻击瞄准 WhatsApp 账户媒体