今天,IBM 推出了其迄今为止最先进的 AI 模型系列,将 Granite 的版本号提高到 3.0。早在 2023 年 9 月,IBM 就推出了 Granite 基础模型,现在他们正在将该系列切换到开源模型,同时改进其他各个方面。所有 Granite 3.0 模型(稍后将提到)都包含在 Apache 2.0 许可证的条款中,该许可证允许企业客户和整个社区利用它们。
Granite 3.0 的三个分支和每个分支的成员如下:
通用/语言: Granite 3.0 8B Instruct, Granite 3.0 2B Instruct, Granite 3.0 8B Base, Granite 3.0 2B Base
护栏和安全:Granite Guardian 3.0 8B,Granite Guardian 3.0 2B
专家混合物:Granite 3.0 3B-A800M 说明书、Granite 3.0 1B-A400M 说明书、Granite 3.0 3B-A800M 底座、Granite 3.0 1B-A400M 底座
与使用公共数据进行训练的竞争对手不同,IBM 的 Granite 模型使用企业数据,可以轻松集成到各种工作流程和业务环境中,与大型前沿模型相比,成本降低了 23 倍。据 IBM 称,这些新模型的训练涉及超过 12 万亿个令牌,这些数据来自来自 12 种不同的自然语言和 116 种不同的编程语言。
该系列的亮点之一是 Guardian 3.0.它具有市场领先的风险和伤害检测功能,除了社会偏见、仇恨、毒性、亵渎、暴力、越狱等已经很常见的属性之外,还考虑了接地气、上下文相关性和答案相关性。
那些想要开始使用 IBM 的 Granite 3.0(或升级到新代码段)的人可以去 Hugging Face 并获取它们。虽然 Nvidia 的 NIM 微服务和 Google Cloud Vertex AI Model Garden 将与 Hugging Face 的集成中出现一系列模型,但新的 Granite 3.0 8B 和 2B 语言模型以及 Granite Guardian 3.0 8B 和 2B 模型的指令变体可通过 IBM Watson 平台用于商业用途。