苹果公布两组小规模开源人工智能模型直追Meta、谷歌的同级产品

来源：网界网 | 2024-07-22 15:55:50

　　苹果机器学习研究团队科学家Vaishaal Shankar稍早于“X”表示，分别推出两组小规模的开源人工智能模型，均隶属于“DCLM” 发展项目，分别对应69亿组参数及14亿组参数，强调能与Mistral AI的70亿组参数规模人工智能模型，以及Meta提出的Llama 3、Google的Gemma、阿里云的开源模型Qwen2直接抗衡。

　　同时，Vaishaal Shankar更标榜“DCLM”为真正形式上的开源模型，其中69亿组参数版本是基于OpenLM框架，以2.5兆个词元（token）进行训练，前后文长度各可对应2K组词符，在大规模、多任务的语言理解（MMLU）测试达63.7%，超过Mistral-7B-v0.3的62.7%表现，并且贴近Meta Llama3 8B的66.2%、Google Gemma的64.3%），以及微软Phi-3的69.9%，另外也以更少算力完成相关测试。

　　而在14亿组版本，苹果则是与Toyota研究团队共同训练，并且以2.6兆组词符数量进行训练，在大规模、多任务的语言理解测试达41.9%，超过微软Phi-1.5B的35.90%。

　　另外，苹果方面也在69亿组参数规模的人工智能模型基础下，将前后文长度支持至8K组词符，在在大规模、多任务的语言理解的表现基本维持不变，意味相比语言模型框架设计，用于训练的数据集设计将变得更加重要。

　　目前“DCLM”计划以开源形式与业界研究人员合作，目前合作对象包含华盛顿大学、特拉维夫大学与Toyota研究中心，但目前在“DCLM”计划研究项目并不会用于苹果市售产品，避免引发不必要的争议，目前作为研究为主。

每日精选

苹果公布两组小规模开源人工智能模型直追Meta、谷歌的同级产品

　　苹果机器学习研究团队科学家Vaishaal Shankar稍早于X表示，分别推出两组小规模的开源人工智能模型，均隶属于DCLM 发展项目，分别对应

2024-07-22
三星将放弃Google Messages的原生消息应用程序从Z Fold6和Z Flip6开始

　　　　根据 9to5Google 的说法，三星正在新的 Galaxy 手机上放弃自己的消息传递应用程序，转而支持 Google Messages。谷歌已经在推

2024-07-22
7月25日！特易资讯2024年外贸智能化营销创新与增长峰会上海终站

　　随着全球贸易环境的日益复杂与智能化技术的飞速发展，外贸企业正面临前所未有的机遇与挑战。为助力外贸企业把握时代脉搏，实现营销创新

2024-07-22
谷歌给暗示！Pixel 9加入全新保命功能两年免费用

　　　　自从苹果 iPhone 14 首度支持卫星通讯后，现在谷歌也要跟上了！根据 Android 代码给暗示，Pixel 9 将能通过卫星拨打紧急

2024-07-22
努比亚Z60S Pro关键规格曝光 OLED面板支持1.5K分辨率

　　明天，努比亚将推出努比亚 Z60S Pro 和努比亚 Z60 Ultra 骁龙 8 Gen 3 领先版旗舰手机。该公司已经确认了Ultra型号的设计和

2024-07-22
十铨科技推出PD20迷你外置固态硬盘提供1 TB至4 TB的存储容量

　　昨日，十铨科技推出 PD20 迷你外置固态硬盘，具备超快的传输速度和全方位的存储容量选项。其精致紧凑的设计包括一个方便的挂孔，以实

2024-07-22
Watercool推出大型“MO-RA IV”PC冷却散热器配备多达9个风扇

　　Watercool 宣布推出 MO-RA IV 散热器系列，这是一系列专为超频系统、工作站和服务器设计的高性能散热器。这家总部位于德国的公司声

2024-07-22

苹果公布两组小规模开源人工智能模型直追Meta、谷歌的同级产品

相关阅读

每日精选