IT之家10月11日消息,科技媒体Appleinsider于10月10日发布博文称,两名学术作者对苹果公司提起集体诉讼,指控其训练“苹果智能”(Apple Intelligence)AI系统时,使用了包含他们盗版作品的“Books3”数据库。
此次发起集体诉讼的,是来自纽约州立大学健康科学大学的学术作者苏珊娜・马丁内斯 - 康德(Susana Martinez-Conde)和斯蒂芬・麦克尼克(Stephen Macknik)。两人指控苹果在未获授权的情况下,用包含其著作《幻觉冠军》(Champions of Illusion)与《思维的诡计》(Sleights of Mind)盗版内容的数据库训练“苹果智能”AI系统,侵犯了版权。
诉讼核心证据链指向“Books3”影子图书馆。2024年4月,苹果公司承认训练OpenELM语言模型时使用了“The Pile”数据集,而该数据集包含“Books3”数据库。“Books3”收录超18万本书籍全文,一份公开文件显示原告两部作品在其中。虽“Books3”于2023年10月因版权争议被移除,但原告认为苹果已完成对其作品的复制和训练。
不过,该案面临多重法律挑战。一方面,苹果未公布训练详细文档列表,证明其处理涉案具体书籍存在困难;另一方面,美国法院系统以往判例(如Midjourney案)倾向于认为,要求AI开发者对海量训练数据逐一授权与赔偿难度过高。在Anthropic公司案件中,法官认定其使用书籍训练模型属“合理使用”,但因将书籍存储于中央图书馆构成侵权,为本案提供了复杂参考。
原告诉求明确,要求陪审团审判、获得经济赔偿,并永久禁止苹果使用其受版权保护的作品。依据美国版权法,若故意侵权行为成立,苹果或需为每部侵权作品支付最高15万美元(IT之家注:现汇率约合107万元人民币)赔偿。