阿里巴巴的大型语言模型(LLM)系列已跻身全球十大开源模型之列。
根据人工智能和机器学习开发平台Hugging Face的数据,排名前10的中国LLM中有三位来自阿里巴巴开发的通义千问系列,也称为Qwen,该平台周三发布了带有新指标的更新排行榜。
阿里巴巴Qwen-72B-Instruct LLM在六个基准测试中以43.02的平均分位居榜首。这个 Qwen 模型是在 720 亿个“参数”上训练的——这是一个机器学习术语,用于描述训练期间 AI 系统中存在的变量,这有助于确定数据提示如何产生所需的输出。
“Qwen 72B [Instruct] 是王者,中国公开赛模式总体上占据主导地位,”Hugging Face 联合创始人兼首席执行官克莱门特·德朗格 (Clement Delangue) 周三在 X(前身为推特)上的一篇文章中表示。
根据周三在Hugging Face开发者社区网站上的帖子,这个特殊的Qwen模型因其“在数学、远程推理和知识方面的表现”而受到赞誉。
与此同时,截至周四,阿里巴巴的Qwen-72B和Qwen1.5-110B型号分别排名第三和第十。根据 Hugging Face 的说法,随着越来越多的 LLM 被评估,预计排名会随着时间的推移而变化。
来自北京初创公司 01.AI 的Yi-1.5-34B-Chat型号排名第七。该公司由著名风险投资家李开复于 2023 年创立,他曾担任谷歌中国总裁。
对阿里巴巴LLM的崇高认可表明,阿里巴巴在人工智能领域的快速发展得益于其对开源开发的坚定承诺。通义千问已经向第三方开发者开放了几个月。
开源允许公众访问程序的源代码,允许第三方软件开发人员修改或共享其设计、修复断开的链接或扩展其功能。在过去的几十年里,开源技术一直是中国蓬勃发展的科技产业的巨大贡献者。
Facebook 母公司 Meta Platforms 的 AI 模型在 Hugging Face 的前 10 名榜单中排名第二,仅次于阿里巴巴。ChatGPT 创建者 OpenAI 的主要支持者 Microsoft 的一位 LLM 排名第六。
Hugging Face社区周三表示,在AI“性能停滞不前”的时候,其对AI模型进行排名的方法增加了更多指标,例如长度约为1000个单词的复杂问题。
由于 Hugging Face 排名侧重于开源开发的程序,因此它不包括在 OpenAI 的 GPT 等专有环境中开发的高级 LLM。
在加州大学伯克利分校(University of California, Berkeley)和大型模型系统组织(Large Model Systems Organisation)的LMSYS聊天机器人竞技场排名中,OpenAI于5月推出的最新LLM产品GPT-4o位居榜首。 阿里巴巴的Qwen2-72B-Instruct排名第19位。