每日經(jīng)濟新聞 2024-08-16 15:19:54
每經(jīng)編輯 杜宇
8月16日,上海秘塔網(wǎng)絡科技有限公司官微發(fā)布聲明稱,昨日公司收到《中國學術期刊(光盤版)》電子雜志社有限公司(下稱“知網(wǎng)”)長達28頁的侵權告知函。
秘塔科技在聲明中表示,秘塔AI搜索的“學術”版塊僅收錄了論文的文獻摘要和題錄,并未收錄文章內(nèi)容本身,閱讀正文需通過來源鏈接跳轉至網(wǎng)站獲取。
秘塔科技稱,即日起秘塔AI搜索將不再收錄知網(wǎng)文獻的題錄及摘要數(shù)據(jù)。
圖片來源:視覺中國
據(jù)AI秘塔微信公眾號8月16日消息,上海秘塔網(wǎng)絡科技有限公司官微發(fā)布聲明稱,昨日公司收到知網(wǎng)長達28頁的侵權告知函。
圖片來源:AI秘塔微信公眾號
“知網(wǎng)”是中國知網(wǎng)CNKI系列數(shù)據(jù)庫編輯出版單位。侵權告知函提到,“知網(wǎng)”發(fā)現(xiàn)秘塔通過秘塔AI搜索、秘塔AI搜索APP向用戶提供其學術文獻題錄及摘要數(shù)據(jù),且數(shù)量巨大。侵權告知函要求,立即停止在搜索服務中提供中國知網(wǎng)學術文獻題錄摘要數(shù)據(jù),“同時,我司不希望我司網(wǎng)站中國知網(wǎng)被秘塔科技搜索到,請立即斷開搜索結果到我司網(wǎng)站的鏈接。”
圖片來源:AI秘塔微信公眾號
秘塔AI表示,依照學術規(guī)范,文獻的摘要和題錄應具有獨立性和自明性,能夠使讀者不閱讀全文就能獲得必要的信息。秘塔AI搜索的“學術”版塊僅收錄了論文的文獻摘要和題錄,并未收錄文章內(nèi)容本身,閱讀正文需通過來源鏈接跳轉至網(wǎng)站獲取。“近些年國際學術界、出版界和圖書情報界聯(lián)合推動的《布達佩斯開放存取倡議》(BOAI)即在不斷推進學術文獻的免費閱讀、下載、復制、傳播、打印和檢索。沒有search(搜索),就沒有research(研究)。”
秘塔AI表示,從即日起,秘塔AI搜索將不再收錄知網(wǎng)文獻的題錄及摘要數(shù)據(jù),轉而收錄其他中英文權威知識庫的文獻題錄及摘要數(shù)據(jù)。
上海秘塔網(wǎng)絡科技有限公司成立于2018年,今年2月上線“秘塔AI搜索”。
根據(jù)公開資料,秘塔科技近期完成了超1億元人民幣的新一輪融資,由螞蟻集團領投、光速光合跟投,秘塔之前的老股東有明勢資本、獵豹移動和豐元資本等。
團隊方面,秘塔科技創(chuàng)始團隊背景較為豐富,涵蓋了人工智能、計算機工程以及法律等多個領域。核心團隊主要有董事長兼CEO閔可銳、技術專家唐悅和首席運營官王益為等。
根據(jù)天眼查數(shù)據(jù)顯示,閔可銳持股比例為28.8%。他擁有復旦大學計算機科學學士學位和牛津大學數(shù)學碩士學位,并且在多個知名公司擔任過重要職務,包括玻森數(shù)據(jù)的CTO&聯(lián)合創(chuàng)始人、獵豹移動首席科學家以及微軟亞洲研究院的實習研究員。
上海大邦律師事務所高級合伙人、律師游云庭對澎湃科技表示,秘塔AI搜索的“學術”版塊最大的問題在于可以完整展現(xiàn)文章內(nèi)容,“論文PDF在研究結果里,雖然不能下載,但用戶在結果頁里點PDF的鏈接,是可以查看這篇文章全文的,這侵犯了這篇文章的信息網(wǎng)絡傳播權。”但如果吸收了文章精華后,人工智能用自己的方式轉述給用戶,根據(jù)《著作權法》規(guī)定,為了說明某個問題合理引用部分作品內(nèi)容的,屬于合理使用。
對于大模型用論文數(shù)據(jù)做訓練,游云庭表示,這種行為并不侵權中國知網(wǎng)。根據(jù)《著作權法》,訓練的過程是復制和學習,復制是將文章從網(wǎng)絡復制到服務器里訓練,學習是否屬于侵權,目前在法律上沒有明文判決可以判斷。但不管是復制權、學習,還是涉及到的著作權的其他權利,中國知網(wǎng)都不是論文權利人。
游云庭舉例,比如作者投稿某雜志,雜志刊登后,文章的版權可能是作者的,也可能是作者授權給了雜志,“知網(wǎng)只是進行了收錄,擁有信息網(wǎng)絡傳播權,而且是一個分授權,所以知網(wǎng)無權干涉這篇文章的訓練。”但他表示,如果是雜志社過來維權,那么秘塔將面臨《紐約時報》起訴OpenAI一模一樣的問題。
圖片來源:視覺中國-VCG31N2008743681
在意識到ChatGPT對歷史和時事的了解源自其網(wǎng)站上發(fā)布的故事(甚至是付費內(nèi)容)時,去年年底,《紐約時報》對OpenAI以及微軟提起訴訟,指控后者未經(jīng)授權使用該報版權內(nèi)容訓練AI模型,并在ChatGPT產(chǎn)品中呈現(xiàn)給用戶。
該案打響了媒體機構起訴OpenAI的第一槍,隨后又有多家媒體加入了這一反抗的隊列。據(jù)《每日經(jīng)濟新聞》記者的不完全統(tǒng)計,截至今年6月底,已至少有13家新聞媒體機構對OpenAI和微軟提起了侵權訴訟。
“判斷這種數(shù)據(jù)抓取行為是否侵犯版權,是一個復雜且有爭議的問題。”安杰世澤律師事務所合伙人、中國和美國紐約州執(zhí)業(yè)律師于雯竹在接受每經(jīng)記者采訪時表示。
《紐約時報》的起訴不僅是媒體領域的重要里程碑案件,亦可以為法律業(yè)界提供極具參考價值的信息。
目前,該案件但還沒有定論。
媒體之難:證明“實質(zhì)性相似”
《紐約時報》在起訴書中稱,ChatGPT幾乎逐字復制了其新聞報道。該報舉例稱,2019年,《紐約時報》發(fā)表了一篇榮獲普利策獎的關于紐約市出租車行業(yè)掠奪性貸款的系列文章。該報稱,只要稍加提示,ChatGPT就會一字不差地背誦其中的大部分內(nèi)容。
在其他多家媒體的起訴書中,記者發(fā)現(xiàn),其法律論證和主張都基于美國1976年版權法和《數(shù)字千年版權法》(DMCA)。對于這兩部法案中涉及AI的內(nèi)容,于律師告訴《每日經(jīng)濟新聞》記者,“就1976年版權法而言,侵權的判定通常依賴于原作品和被指控侵權作品之間的相似性,以及實際的復制行為。本案中實際復制行為相對容易證明,因為OpenAI并未否認其訓練數(shù)據(jù)中包含《紐約時報》的文章。”
然而難點在于,“證明最終生成的文本構成版權侵權仍需滿足‘實質(zhì)性相似’測試,因為它有助于判斷受版權保護的表達元素是否被復制,還是僅復制了其中的思想。版權保護的是表達,而不是思想。你可以用自己的語言重新實現(xiàn)他人的思想,這不構成版權侵權。但如果你使用他人的語言——即他們的表達——那就是版權侵權。”于律師說道。
談及DMCA,于雯竹解釋道:“其中的一項規(guī)定鼓勵版權持有者在數(shù)字資產(chǎn)中添加內(nèi)容管理信息(CMI),例如幫助識別創(chuàng)作者或權利持有者的信息,并禁止他人移除這些信息。”然而,《紐約時報》起訴書提到,OpenAI在抓取其文章以創(chuàng)建數(shù)據(jù)庫時,移除了這些信息,違反了DMCA。
OpenAI的“盾牌”:“合理使用”
而在回應《紐約時報》版權侵權訴訟時,OpenAI強調(diào)使用公開材料訓練AI模型屬于合理使用。這一規(guī)則基于美國1976年版權法第107條規(guī)定。哈佛法學院教授麗貝卡•塔什內(nèi)特(Rebecca Tushnet)在接受《每日經(jīng)濟新聞》記者采訪時認為,“美國版權法既提供了廣泛的權利,也提供了廣泛的例外。關鍵問題是AI訓練是否構成‘合理使用’,以及當AI輸出與現(xiàn)有作品過于相似時,該問題到底應該歸咎于模型還是用戶的濫用。”
塔什內(nèi)特認為,“OpenAI提供了有一個有趣的主張,即(AI)要獲得高度相似的輸出,必須故意用《紐約時報》原始文章中的大量引文來提示模型,這表明錯誤在于提示者(用戶的濫用)。”“‘合理使用’是美國版權法的一項關鍵優(yōu)勢,使其能夠應對不斷變化的情況。它促成了我們所知道的現(xiàn)代互聯(lián)網(wǎng)的興起,尤其是搜索引擎。按照同樣的推理,只要輸出通常不是從特定作品中復制而來,創(chuàng)建AI模型就應該被視為變革性的和公平的。”
她對記者解讀稱,“我認為這是一個相當標準的有關‘合理使用’的問題。”根據(jù)1976年版權法,判定合理使用的認定包括四個因素。其中,于雯竹認為,最重要的是第四點:使用對版權作品的潛在市場或價值的影響。“簡而言之,就是新作品是否對原作品構成‘市場損害’。”
每日經(jīng)濟新聞綜合AI秘塔微信公眾號、澎湃科技、每日經(jīng)濟新聞、公開資料
如需轉載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關注每日經(jīng)濟新聞APP