(全球TMT2023年11月21日讯)IBM近期推出Granite系列大模型。这是IBM首个从头开始在最大的可信企业级数据湖上训练开发的企业级生成式大模型集合。IBM数据与人工智能资深技术专家、The Open Group卓越级技术专家吴敏达介绍,Granite系列是仅解码器架构,第一个版本的Granite系列包括130亿参数模型的两个变体:granite.13b.v1.chat 和 granite.13b.v1.instruct…
(全球TMT2023年11月21日讯)IBM近期推出Granite系列大模型。这是IBM首个从头开始在最大的可信企业级数据湖上训练开发的企业级生成式大模型集合。IBM数据与人工智能资深技术专家、The Open Group卓越级技术专家吴敏达介绍,Granite系列是仅解码器架构,第一个版本的Granite系列包括130亿参数模型的两个变体:granite.13b.v1.chat 和 granite.13b.v1.instruct。 日前,granite.20b.code也随着watsonx Code Assistant发布,这是200亿参数的代码生成大模型。
IBM同时还公开了Granite系列模型的细节,包括架构、训练数据、训练算法、计算基础设施等细节。Granite大模型支持所有5个NLP任务(问答、生成、提取、总结、分类),这些任务针对跨多个领域的业务目标数据进行训练,以提供最相关的见解。Granite大模型采用了特定领域的企业数据,10%的训练数据来自法律和金融,这使得信用风险评估、保险QA、对话式金融QA和总结等财务任务具有卓越的性能。 因此,金融服务领域的客户(银行、保险、金融)或有法律需求的客户,Granite是一个值得推荐的绝佳模型。考虑到开放和单一模型无法满足每个业务用例的独特需求,Granite系列正在开发不同参数大小的模型。
如需转载请标明来源,内容与数据仅供参考,不构成投资建议。发布者:全球君,转转请注明出处:https://www.bigcompany.info/news/3921.html