技術(shù)
導(dǎo)讀:?12 月 13 日,據(jù)路透社報(bào)道,根據(jù)一起版權(quán)侵權(quán)訴訟的新文件顯示,Meta Platforms 在明知使用數(shù)千本盜版書籍訓(xùn)練其 AI 模型存在法律風(fēng)險(xiǎn)的情況下,仍然一意孤行。
12 月 13 日,據(jù)路透社報(bào)道,根據(jù)一起版權(quán)侵權(quán)訴訟的新文件顯示,Meta Platforms 在明知使用數(shù)千本盜版書籍訓(xùn)練其 AI 模型存在法律風(fēng)險(xiǎn)的情況下,仍然一意孤行。
據(jù)IT之家了解,該訴訟由喜劇演員 Sarah Silverman、普利策獎(jiǎng)得主 Michael Chabon 等著名作家于今年夏天聯(lián)合發(fā)起,他們指控 Meta 未經(jīng)許可使用其作品訓(xùn)練人工智能語(yǔ)言模型 Llama。本周一起,該案與另一起類似訴訟合并審理。
上個(gè)月,加州一位法官駁回了 Silverman 的部分訴訟,但表示將允許作者修改訴訟內(nèi)容。新訴狀中包含了 Meta 一名研究員在 Discord 聊天服務(wù)器上討論獲取數(shù)據(jù)集的聊天記錄,這可能是 Meta 知曉使用書籍可能存在版權(quán)風(fēng)險(xiǎn)的重要證據(jù)。聊天記錄中的對(duì)話顯示,他們?cè)懻撨^(guò)使用盜版書籍訓(xùn)練 AI 模型的法律風(fēng)險(xiǎn)。其中,一位 Meta 研究員 Tim Dettmers 提到,Meta 的法律部門律師曾表示,如果使用這些書籍訓(xùn)練 AI 模型,可能會(huì)存在法律問(wèn)題。律師稱,這些數(shù)據(jù)無(wú)法使用,如果使用了的話,模型也無(wú)法發(fā)布。
今年,多家科技公司都面臨著內(nèi)容創(chuàng)作者的類似指控,他們指責(zé)這些公司在構(gòu)建生成式 AI 模型時(shí)侵犯了作品版權(quán)。
如果這些訴訟成功,可能會(huì)給生成式 AI 的發(fā)展帶來(lái)不利影響,因?yàn)檫@可能會(huì)增加構(gòu)建 AI 模型的成本,迫使 AI 公司向藝術(shù)家、作者和其他內(nèi)容創(chuàng)作者支付使用其作品的費(fèi)用。
與此同時(shí),歐盟關(guān)于人工智能的新臨時(shí)規(guī)則可能會(huì)迫使公司披露其用于訓(xùn)練模型的數(shù)據(jù),這可能會(huì)使他們面臨更大的法律風(fēng)險(xiǎn)。
Meta 于今年 2 月發(fā)布了其第一版 Llama 大型語(yǔ)言模型,并公布了用于訓(xùn)練的數(shù)據(jù)集列表,其中包括“ThePile”數(shù)據(jù)集的“Books3”部分。根據(jù)訴訟文件,該數(shù)據(jù)集的創(chuàng)建者曾表示,其中包含 196,640 本書籍。該公司沒(méi)有披露其最新版模型 Llama 2 的訓(xùn)練數(shù)據(jù),該模型于今年夏天面向商業(yè)用戶開放。