OpenAI稱《紐約時報》花錢請人破解ChatGPT以獲取訴訟證據
鞭牛士報道,2月28日消息,據CNBC報道,OpenAI 要求法官駁回《紐約時報》就部分內容對其提起的訴訟,指控該媒體公司「花錢請人破解 OpenAI 的產品」,例如 ChatGPT,爲其案件生成 100 個侵犯版權的示例。
在週一向曼哈頓聯邦法院提交的一份文件中,OpenAI聲稱,《紐約時報》進行了數萬次嘗試才得出高度異常的結果,並且該公司使用了公然違反 OpenAI 使用條款的欺騙性提示。
「普通人不會以這種方式使用 OpenAI 的產品。」OpenAI 在文件中寫道。
OpenAI 在文件中聲稱的黑客攻擊也可以稱爲即時工程或紅隊,這是人工智能信任和安全團隊、倫理學家、學者和科技公司對人工智能系統漏洞進行壓力測試的常用方式。這是人工智能行業的常見做法,也是提醒公司注意系統內問題的一種流行方式,類似於網絡安全專業人員對公司網站的弱點進行壓力測試的方式。
「在這份文件中,OpenAI 沒有否認,也不能否認,他們在未經我們許可的情況下複製了數百萬份《紐約時報》的作品來構建和支持其商業產品。」蘇斯曼·戈弗雷 (Susman Godfrey) 合夥人兼首席法律顧問伊恩·克羅斯比 (Ian Crosby) 表示。
他補充道,OpenAI 奇怪地錯誤地描述爲黑客,只是利用 OpenAI 的產品來尋找他們竊取和複製《紐約時報》版權作品的證據。這正是我們所發現的。事實上,OpenAI 的抄襲規模比投訴中列出的 100 多個例子要大得多。
該文件提交之際,OpenAI 與出版商、作家和藝術家之間就使用受版權保護的材料進行人工智能訓練數據展開了一場更廣泛的鬥爭,其中包括備受矚目的《紐約時報》訴訟,一些人認爲這是該行業的分水嶺時刻。該新聞媒體於 12 月提起訴訟,旨在阻止微軟OpenAI 造成了數十億美元的損失。
過去,OpenAI 曾表示,如果沒有版權作品,不可能訓練頂級人工智能模型。
「因爲今天的版權幾乎涵蓋了人類的每一種表達方式——包括博客文章、照片、論壇帖子、軟件代碼片段和政府文件——如果不使用受版權保護的材料,就不可能訓練當今領先的人工智能模型。」OpenAI 在一份報告中寫道。
OpenAI上個月在英國提交了文件,以迴應英國上議院的質詢。
「將訓練數據限制在一個多世紀前創建的公共領域書籍和繪圖可能會產生一個有趣的實驗,但不會提供滿足當今公民需求的人工智能系統。」OpenAI 在文件中繼續說道。
就在上個月,在瑞士達沃斯,OpenAI 首席執行官 Sam Altman 表示,他對《紐約時報》的訴訟感到驚訝,稱 OpenAI 的模型不需要根據出版商的數據進行訓練。
「我們實際上不需要對他們的數據進行訓練。」奧特曼在彭博社在達沃斯組織的一次活動中表示。「我認爲這是人們不理解的事情。任何一種特定的培訓來源,對我們來說都沒有太大的推動作用。」
儘管一個發行商可能不會對 ChatGPT 的運營能力產生影響,但 OpenAI 的文件表明,許多發行商選擇退出的決定可能會產生影響。
近幾個月來,該公司開始向出版商尋求允許將內容用於培訓數據。
該公司已經與擁有 Business Insider、Morning Brew 和其他媒體的德國媒體集團 Axel Springer 達成了協議,據報道,該公司還正在與 CNN、福克斯公司和《時代》雜誌就其作品授權進行談判。
OpenAI 在文件中寫道:我們預計與其他公司正在進行的談判很快就會產生更多的合作伙伴關係。
在文件及其博客文章中,OpenAI 強調了其針對出版商的選擇退出流程,該流程允許媒體禁止該公司的網絡爬蟲訪問其網站。但 OpenAI 在文件中表示,這些內容對於訓練當今的人工智能模型至關重要。
「雖然我們期待繼續開發額外的機制,賦予權利持有人選擇退出培訓的權利,但我們正在積極與他們合作,尋找互惠互利的安排,以獲得原本無法訪問的材料,並以以下方式展示內容:超出了版權法允許的範圍。」該公司寫道。