微软发布AI语言模型Phi-2评估 效能击败Llama 2、Gemini Nano 2

来源:网界网 | 2023-12-13 09:32:22

  科技巨头微软周二(12日)发布《Phi-2:小语言模型的惊人力量》一文指出,旗下AI语言模型Phi-2在各种测试中取得卓越的效能,优于Llama 2、Gemini Nano 2。

  微软新的 AI 语言模型 Phi-2 有 27 亿个参数,是微软最小的语言模型,该公司表示,与 Phi-1.5 相比,该模型在逻辑推理和安全性方面显示出显著改进。

  微软宣称,Phi-2具备出色的推理和语言理解能力,展示了参数少于 130 亿的基础语言模型中最先进的性能。 透过正确的微调和定制,小语言模型是云端和边缘应用程式的强大工具。

  微软测试结果显示,Phi-2 效能击败Meta的 Llama 2,以及法国初创公司 Mistral AI 的 Mistral 7B

微軟測試顯示 Phi-2 效能擊敗 Meta (META-US) 的 Llama 2,以及法國人工智慧新創公司 Mistral AI 的 Mistral 7B (圖片:微軟)

  同时,与谷歌Gemini 家族最小的语言模型相比,微软表示,Phi-2 在所有基准测试中都表现出更佳性能。

Phi-2 在微軟提出的所有基準測試中都表現出了更好的效能 (圖片:微軟)

  Phi-2 在微软提出的所有基准测试中都表现出了更好的效能 (图片:微软)

  微软表示,Phi-2 模型将在 Azure Studio 中推出,足见微软持续发展生成式人工智能 (AI) 的野心。

  Phi-2 AI 语言模型三款对手简介

  Meta 语言模型 Llama 2 经过持续预训练,能够有效处理长文本,并在长、短上下文任务优于当前的开源模型,而且不需要人工注释数据,整体长上下文表现。

  Mistral 7B 是 Mistral AI 公司推出的一款具有 73 亿参数的 AI 模型,采用了 Grouped-query attention (GQA) 和 Sliding Window Attention (SWA) 技术,不仅能快速进行推断,还能以较低的成本处理长序列,该模型能够在诸如常识推理、世界知识、阅读理解数学等多个领域与其他大型模型相媲美。

  谷歌全新的 Gemini Nano 2 模型,是谷歌特别针对在设备上处理与执行任务所打造出的高效模型,主要是被设计来处理边缘设备的 AI 需求。

相关阅读

每日精选