消息称苹果、英伟达、Anthropic等以诸多YouTube文字数据训练人工智能模型

来源:网界网 | 2024-07-17 15:17:50

  相关报道指出,包含苹果、英伟达、Anthropic在内科技业者均采用由非营利人工智能研究团体EleutherAI建立的资料集,藉此训练其人工智能模型,但此资料集内容涵盖源自4万8000个YouTube频道、超过17万3000部影片内容的文字资料,其中更包括著名网红MrBeast与MKBHD (Marques Brownlee)所拍摄影片, 以及包含纽约时报、BBC、ABC News等内容。

  除了此次传出科技业者以第三方单位建构的资料集进行训练,不少科技业者目前仍避谈其人工智能模型背后所使用资料来源,或是未对外透明解释,例如不少创作者对于苹果接下来将推出的Apple Intelligence服务有意见,因为苹果并未清楚说明其服务背后人工智能模型如何训练。

  在先前声明中,谷歌表示任何直接以YouTube 视频内容训练人工智能模型的作法,都将违反YouTube 服务使用条款,而苹果、英伟达、Anthropic 等业者均未对此作任何回应。

  这样的情况,或许将成为接下来人工智能技术发展较大争议,虽然许多业者尽可能避免直接在侵权情况下使用他人数据训练人工智能模型,但在某种程度上可能会藉由模糊地带情形规避使用条款限制。

相关阅读

每日精选