消息称苹果使用YouTube视频来训练Apple Intelligence

来源:网界网 | 2024-07-18 10:16:54

  我们之前曾看到过许多报道,声称 OpenAI 使用 YouTube 内容来训练其文本到视频模型 Sora。现在有报道称,苹果、英伟达、Anthropic等公司也在使用用户生成的“公开数据”来训练他们的人工智能模型。显然,苹果使用了数以万计的带字幕的 YouTube 视频来训练 Apple Intelligence,这违反了该平台的内容政策。

  该消息来自Proof News与Wired共同发布的一项调查。

  根据调查,苹果和其他公司正在使用一个名为YouTube字幕的数据集,其中包括来自48,000多个频道的173,536个YouTube视频的成绩单。数据集中的视频范围从可汗学院和麻省理工学院等教育频道到《华尔街日报》等新闻网站,再到该平台的一些顶级创作者,如 MrBeast 和 Marques Brownlee。

  根据 Marques Brownlee 的说法,苹果在技术上避免了“错误”,因为他们从使用 YouTube 视频转录而不是直接使用数据的公司那里获取 AI。尽管如此,数据/成绩单仍然有助于人工智能模型,创作者在其中投入了时间和金钱。布朗利总结说,这将是一个长期内不断发展的问题。

  Proof News 还为创作者创建了一个工具,用于在数据集中搜索他们的内容。YouTube 字幕数据集不包括来自视频的图像,但包含一些已翻译的语言字幕。据报道,该数据集是由一家名为Eleuther AI的非营利性研究实验室创建的,该实验室致力于促进开放科学规范。

  上述公司均未立即对此事发表评论。YouTube首席执行官尼尔·莫汉(Neal Mohan)在接受采访时已经明确表示,公司使用YouTube视频来训练其AI模型是“明显违反”该平台政策的。

相关阅读

每日精选