每日經(jīng)濟(jì)新聞 2024-05-13 16:28:04
每經(jīng)編輯 黃勝 每經(jīng)實(shí)習(xí)編輯 宋欣悅
在科技界萬眾矚目的目光下,OpenAI將于美西時(shí)間5月13日上午10點(diǎn)(北京時(shí)間14日凌晨1點(diǎn))拉開其春季更新活動(dòng)的帷幕,通過線上直播的形式,向全球演示ChatGPT和GPT-4更新的功能。
OpenAI宣布將于5月13日直播演示ChatGPT和GPT-4功能更新 圖片來源:X
盡管公眾對(duì)GPT-5的期待高漲,OpenAI 首席執(zhí)行官薩姆·阿爾特曼(Sam Altman)卻在近期訪談中明確表示,下一代語言模型GPT-5及其自主研發(fā)的搜索引擎均不會(huì)在此次活動(dòng)中亮相,這一消息雖令部分期待者略感遺憾,但阿爾特曼對(duì)即將展示的ChatGPT與GPT-4升級(jí)版信心滿滿。
圖片來源:X
更為引人注目的是,據(jù)彭博社報(bào)道,蘋果公司與OpenAI敲定協(xié)議,擬將ChatGPT技術(shù)融入即將面世的iOS 18操作系統(tǒng),此舉無疑將為智能手機(jī)領(lǐng)域帶來顛覆性變革。
值得一提的是,近日,阿爾特曼在“All-in Podcast”播客節(jié)目接受了采訪時(shí),聊了很多,從推理運(yùn)算談到AI的監(jiān)管問題,再到全民基本收入(UBI)的概念,乃至AI交互界面的未來趨勢,甚至還揭秘了一些公司內(nèi)部情況。訪談中,阿爾特曼還展望了未來能與AI加持的iPhone相抗衡產(chǎn)品的可能形態(tài),進(jìn)一步點(diǎn)燃了科技愛好者對(duì)未來智能設(shè)備生態(tài)的好奇與期待。他這番廣泛又深入的交流,讓人忍不住猜想,是不是在為OpenAI即將宣布的更新暗暗鋪墊呢?
阿爾特曼在播客節(jié)目“All-in Podcast”中接受采訪 圖片來源:截圖于Youtube
1.關(guān)于GTP-5的發(fā)布
目前尚未確定具體日期,我們對(duì)GPT-5的發(fā)布持謹(jǐn)慎態(tài)度,以確保新模型發(fā)布時(shí)能符合我們的高標(biāo)準(zhǔn)。
2.關(guān)于OpenAI內(nèi)部變動(dòng)
面對(duì)被解雇的情況,我當(dāng)時(shí)在考慮是否要重返崗位,因?yàn)槲腋械骄趩视置悦?。但隨后我意識(shí)到,我對(duì)OpenAI以及同事們懷有深厚的感情,于是我決定要回去。
3.關(guān)于開源與閉源模型的未來
我們認(rèn)為兩者都有其獨(dú)特的價(jià)值和作用。我們已經(jīng)有計(jì)劃在未來開源更多的模型,同時(shí)我們也在積極地開發(fā)通用人工智能,并探索如何廣泛地分配其帶來的利益。
4.關(guān)于AI的未來交互方式
我期望擁有的是一種始終處于激活狀態(tài)且極易使用的設(shè)備,它可以通過語音、文字,或者更理想的狀態(tài),通過其他方式理解我的需求。我期望有一個(gè)系統(tǒng)能夠全天候地輔助我,盡可能多地收集信息,成為世界上最出色的助理,不斷地幫助我提升自我。
5.關(guān)于人工智能的監(jiān)管
我希望能有一個(gè)類似全球監(jiān)管核武器或合成生物學(xué)的國際機(jī)構(gòu),來監(jiān)督這些強(qiáng)大的系統(tǒng),并確保它們經(jīng)過合理的安全測試。
6.關(guān)于蘋果
手機(jī)目前的卓越性能令人驚嘆,因此要達(dá)到一個(gè)新的高度,門檻自然非常之高。我個(gè)人認(rèn)為,iPhone是人類歷史上制造出的最偉大的技術(shù)產(chǎn)品之一。它真的是一款非凡的設(shè)備。我之前也提到過,它已經(jīng)非常出色,以至于想要超越它,我們必須設(shè)定一個(gè)相當(dāng)高的標(biāo)準(zhǔn)。
阿爾特曼參加播客節(jié)目“All-in Podcast” 圖片來源:截圖于Youtube
問:你們會(huì)在何時(shí)發(fā)布GPT-5?
阿爾特曼:關(guān)于GPT-5的發(fā)布時(shí)間,目前我們還沒有確定一個(gè)具體的日期。我們對(duì)新模型的推出持謹(jǐn)慎態(tài)度,致力于確保它在發(fā)布時(shí)能夠達(dá)到我們的高標(biāo)準(zhǔn)。我們正在考慮采用一種新的發(fā)布策略,這可能與以往的方式有所不同。我們對(duì)于GPT-5的命名和發(fā)布策略仍在討論之中,但可以肯定的是,我們致力于讓這款新模型在發(fā)布時(shí)能夠?yàn)橛脩魩碜吭降捏w驗(yàn)。
問:剛才你談到GPT-5這次的發(fā)布會(huì)有點(diǎn)不同,你是不是在想先向付費(fèi)用戶發(fā)布GPT-5?
阿爾特曼:我們正在努力尋找方法,讓GPT-4這樣的先進(jìn)模型能夠以免費(fèi)或低成本的方式提供給更多的用戶。如果我們還沒有找到如何讓用戶免費(fèi)使用GPT-4的方法,我會(huì)非常的難過。這是我們真正想做的事情。
問:你認(rèn)為開源模型在未來幾年會(huì)有什么樣的發(fā)展?
阿爾特曼:在開源和閉源的問題上,我們認(rèn)為兩者都有其獨(dú)特的價(jià)值和作用。我們已經(jīng)有計(jì)劃在未來開源更多的模型,同時(shí)我們也在積極地開發(fā)通用人工智能,并探索如何廣泛地分配其帶來的利益。我們的這一戰(zhàn)略已經(jīng)得到了很多人的認(rèn)同,盡管它可能并不適合所有人。我們正在構(gòu)建一個(gè)龐大的生態(tài)系統(tǒng),其中將包括開源模型以及基于此構(gòu)建的開發(fā)者社區(qū)。
問:你們何時(shí)會(huì)開發(fā)在手機(jī)上運(yùn)行的開源模型?
阿爾特曼:我不清楚我們是否會(huì)這樣,也不清楚是否有人會(huì)這樣做。也許Llama 3或Llama 4能夠做到這些。
問:我猜測70億參數(shù)版本的Llama 3模型可能適合在手機(jī)上運(yùn)行。
阿爾特曼:不管這個(gè)版本的Llama 3是否針對(duì)手機(jī),但我認(rèn)為它可以在手機(jī)上運(yùn)行。我還不確定,我沒有體驗(yàn)過它。
問:penAI作為行業(yè)的領(lǐng)先者,需要采取什么措施來維持其在人工智能領(lǐng)域的領(lǐng)先地位?
阿爾特曼:我們正致力于構(gòu)建一個(gè)生態(tài)系統(tǒng),它不僅包括先進(jìn)的人工智能模型,還包括用戶界面、開發(fā)者工具、教育資源和社區(qū)支持等,以確保我們的技術(shù)能夠被廣泛地接受和有效利用。通過這樣的全面方法,我們希望能夠?qū)崿F(xiàn)長期的成功,并在人工智能領(lǐng)域持續(xù)地為社會(huì)帶來積極的影響。
問:從開源走向閉源,我想知道你為何最終選擇了這樣的道路?
阿爾特曼:我們發(fā)布ChatGPT的部分原因是向世界展示我們的成果。我們一直在努力傳達(dá)一個(gè)信息:人工智能真的非常重要?;氐?022年10月,當(dāng)時(shí)并沒有太多人意識(shí)到人工智能的重要性或其即將帶來的影響。我們努力做這件事的一個(gè)重要部分是使人們能夠?qū)嶋H使用這項(xiàng)技術(shù)?,F(xiàn)在,實(shí)現(xiàn)這一目標(biāo)有多種不同的方式,我認(rèn)為這確實(shí)起到了非常關(guān)鍵的作用。然而,事實(shí)上,目前許多人正在使用免費(fèi)版的ChatGPT,而我們并沒有進(jìn)行廣告宣傳,也沒有考慮過盈利的問題。我們推出免費(fèi)版的ChatGPT,是因?yàn)槲覀兿M藗兡軌蚶眠@些工具。我認(rèn)為,這已經(jīng)為人們提供了很多價(jià)值,就像是“授人以漁”。我們這么做的原因也是為了讓人們更好地理解整個(gè)人工智能行業(yè)的發(fā)展態(tài)勢。至于閉源戰(zhàn)略是否正確,目前我們還沒有標(biāo)準(zhǔn)答案。我們和其他公司一樣,也在探索中前行,并會(huì)在學(xué)習(xí)新事物的過程中多次調(diào)整策略。當(dāng)我們創(chuàng)辦OpenAI時(shí),我們并不清楚事情會(huì)如何發(fā)展。在我們開發(fā)出第一款語言模型之前,我們甚至還沒有開發(fā)出過任何產(chǎn)品。我們只是一步步地努力探索,穩(wěn)步前進(jìn)。我們會(huì)繼續(xù)這樣做。
問:開源讓每個(gè)人都達(dá)到一定的閾值,然后就是對(duì)數(shù)據(jù)的競爭,是不是這樣?
阿爾特曼:我絕對(duì)不認(rèn)為這將變成一場關(guān)于數(shù)據(jù)的競賽,因?yàn)楫?dāng)模型變得足夠智能時(shí),它們?cè)谀硞€(gè)點(diǎn)上,至少在訓(xùn)練方面,將不再依賴于更多的數(shù)據(jù)。智能只是物質(zhì)的一種突現(xiàn)屬性,它就像物理定律一樣。我相信人們將會(huì)理解這一點(diǎn),但系統(tǒng)設(shè)計(jì)將會(huì)有多種不同的方法,人們會(huì)做出不同的選擇,并提出新的想法。我相信,就像任何其他行業(yè)一樣,人工智能領(lǐng)域也會(huì)出現(xiàn)多種不同的方法,不同的人會(huì)有不同的偏好。就像有些人喜歡iPhone,有些人喜歡安卓手機(jī)一樣,我認(rèn)為人工智能模型也會(huì)呈現(xiàn)類似的多樣性。
問:那么在設(shè)備端的情況如何呢?設(shè)備本身是否也會(huì)隨之發(fā)生變化?這些設(shè)備是否也會(huì)變得像iPhone那樣昂貴?
阿爾特曼:我對(duì)這個(gè)話題非常感興趣,并且對(duì)計(jì)算領(lǐng)域的創(chuàng)新形態(tài)充滿熱情。每一次技術(shù)的重大飛躍似乎都能開啟新的可能性。手機(jī)目前的卓越性能令人驚嘆,因此要達(dá)到一個(gè)新的高度,門檻自然非常之高。我個(gè)人認(rèn)為,iPhone是人類歷史上制造出的最偉大的技術(shù)產(chǎn)品之一。它真的是一款非凡的設(shè)備。我之前也提到過,它已經(jīng)非常出色,以至于想要超越它,我們必須設(shè)定一個(gè)相當(dāng)高的標(biāo)準(zhǔn)。
問:不過,你們現(xiàn)在的應(yīng)用已經(jīng)具備了語音功能,實(shí)際上,我將手機(jī)上的快捷動(dòng)作按鈕設(shè)置成了直接啟動(dòng)ChatGPT的語音應(yīng)用。
阿爾特曼:我們將繼續(xù)改進(jìn)并提升語音功能的質(zhì)量。我相信語音交互是通向未來交互方式的一個(gè)重要線索。如果能夠?qū)崿F(xiàn)真正優(yōu)質(zhì)的語音互動(dòng)體驗(yàn),那將是一種與計(jì)算機(jī)互動(dòng)的全新方式。
問:關(guān)于計(jì)算機(jī)視覺領(lǐng)域,是否可以這樣設(shè)想:配備有眼鏡或者佩戴一個(gè)掛墜,這樣就能將視覺或視頻數(shù)據(jù)與語音信息相結(jié)合。通過這種結(jié)合,人工智能就能全面掌握你周圍發(fā)生的一切。
阿爾特曼:多模態(tài)交互的能力極其強(qiáng)大,例如,可以提問:“嘿!ChatGPT,我正在看什么?”或者“我不太確定這是什么植物。”這顯然是另一個(gè)探索方向。但關(guān)于人們是否愿意佩戴眼鏡,或者在需要時(shí)舉起某個(gè)設(shè)備來獲取信息,我認(rèn)為這涉及到許多社會(huì)和人際交往方面的復(fù)雜考量,尤其是在面部佩戴計(jì)算設(shè)備的問題上。
問:如果人工智能變得在每個(gè)人的手機(jī)上都無所不在,那么可能會(huì)催生哪些應(yīng)用程序呢?你有沒有預(yù)感到可能會(huì)發(fā)生什么,或者你希望看到什么樣的應(yīng)用被開發(fā)出來?
阿爾特曼:我期望擁有的是一種始終處于激活狀態(tài)且極易使用的設(shè)備,它可以通過語音、文字,或者更理想的狀態(tài),通過其他方式理解我的需求。我設(shè)想有一個(gè)系統(tǒng)能夠全天候地輔助我,盡可能多地收集上下文信息,成為世界上最出色的助理,不斷地幫助我提升自我。人工智能不是用戶的簡單延伸,而是一個(gè)始終可訪問、始終卓越、能力超群的助理或高管。
問:智能體在某種程度上就像是你的代表,它能夠理解你的需求,并且預(yù)測你的意圖,這正是我對(duì)你所述內(nèi)容的解讀。
阿爾特曼:智能體不只是機(jī)械地執(zhí)行命令,它能夠進(jìn)行推理,是的,它具備推理能力。智能體與我之間的關(guān)系,是我所期待的那種與真正有能力的同事之間的互動(dòng),這與那些只會(huì)盲目遵從的人不同。
問:在這樣一個(gè)由智能體代表80億人進(jìn)行交互的世界里,我們對(duì)應(yīng)用程序的工作方式和整個(gè)體驗(yàn)架構(gòu)的思考需要如何轉(zhuǎn)變?
阿爾特曼:我對(duì)打造一個(gè)既適合人類也適合人工智能使用的世界的構(gòu)想非常感興趣。我青睞于這種設(shè)計(jì)的可解釋性、任務(wù)交接的流暢性,以及我們提供反饋的能力。
問:所以你意識(shí)到,語音交互這種方式有潛力使得傳統(tǒng)應(yīng)用變得多余。你只需簡單地說出你想要壽司,它就能根據(jù)你以往的喜好來推薦你喜歡的壽司類型,同時(shí)避免那些你不喜歡的選項(xiàng),并努力為你提供最佳的點(diǎn)餐體驗(yàn)。
阿爾特曼:我很難想象我們完全進(jìn)入一個(gè)只需簡單地說“嘿,ChatGPT,給我訂份壽司”,然后它回應(yīng)“好的,你想從哪家餐館訂?要哪種類型的壽司?什么時(shí)間送達(dá)?”等等的世界。我相信用戶界面對(duì)于許多任務(wù)來說都是非常有用的。我很難想象一個(gè)你完全不再看屏幕,而只依賴語音交互的世界,但我確實(shí)難以想象那樣的場景。
問:確實(shí)如此。對(duì)于許多事物來說是這樣的。比如,蘋果推出了Siri,按理說我們可以通過Siri來自動(dòng)預(yù)約Uber,但我懷疑實(shí)際上很少有人這么做。畢竟,為什么要冒這個(gè)險(xiǎn)呢?正如你所指出的,因?yàn)槟壳罢Z音助手的服務(wù)質(zhì)量還不夠高。然而,一旦服務(wù)質(zhì)量足夠高,我認(rèn)為人們真的會(huì)更傾向于使用語音助手,因?yàn)樗颖憬?。你不需要拿出手機(jī),不需要打開應(yīng)用,不需要點(diǎn)擊任何東西。如果遇到應(yīng)用自動(dòng)登出,或者需要重新登錄,或者進(jìn)行雙因素認(rèn)證(TFA)的情況,整個(gè)過程就變得非常繁瑣和令人煩惱。
阿爾特曼:我明白,對(duì)于像設(shè)置計(jì)時(shí)器這樣簡單的任務(wù),我總是使用Siri,因?yàn)樗浅S行曳奖?,我也不需要其他額外的信息。然而,對(duì)于像叫Uber這樣的服務(wù),我可能想要比較幾種不同選項(xiàng)的價(jià)格,了解車輛距離我的實(shí)際遠(yuǎn)近,甚至查看司機(jī)在地圖上的實(shí)時(shí)位置,因?yàn)橛袝r(shí)候我可能會(huì)選擇步行到某個(gè)更方便的地點(diǎn)。通過直接在Uber應(yīng)用的界面上操作,我可以更快地獲取這些詳細(xì)信息,這比通過語音指令來完成整個(gè)過程要高效得多。
問:在所有利用OpenAI平臺(tái)開發(fā)應(yīng)用和體驗(yàn)的開發(fā)者中,是否有一些項(xiàng)目給您留下了深刻印象?或者說,是否有一些成果是你的團(tuán)隊(duì)特別指出并認(rèn)為具有重要意義的?
阿爾特曼:我今天早上遇到了一個(gè)新建的創(chuàng)業(yè)團(tuán)隊(duì),嚴(yán)格來說是由兩個(gè)人組成。他們計(jì)劃在夏季開展一個(gè)項(xiàng)目,致力于開發(fā)人工智能導(dǎo)師功能。我對(duì)這一領(lǐng)域一直抱有濃厚興趣,盡管許多人已經(jīng)在我們的平臺(tái)上取得了杰出成果,但如果能夠有人實(shí)現(xiàn)--正如他們所形容的,這將是一次“單軌列車級(jí)別”的創(chuàng)新--徹底改變我們學(xué)習(xí)的方式,那將是非常令人興奮的。如果能夠找到一種新的途徑,讓人們能夠以個(gè)性化的方式探索和學(xué)習(xí),我個(gè)人對(duì)這樣的前景感到非常激動(dòng)。你之前提到的與編碼相關(guān)的許多事項(xiàng),我認(rèn)為這是對(duì)未來的一個(gè)非??岬恼雇?。我相信醫(yī)療保健是一個(gè)特別需要被徹底革新的領(lǐng)域。但就個(gè)人而言,我最感到興奮的是加速和改進(jìn)科學(xué)發(fā)現(xiàn)過程的可能性。雖然GPT-4顯然還未在這方面實(shí)現(xiàn)重大突破,但它或許已經(jīng)在一定程度上加快了進(jìn)程,提升了科學(xué)家的工作效率。
問:這些模型與語言模型在訓(xùn)練和構(gòu)建上有所區(qū)別。雖然它們之間存在許多共同點(diǎn),但也存在許多差異。這些模型中的許多都是基于一種全新的基礎(chǔ)架構(gòu)設(shè)計(jì)的,它們專門針對(duì)特定的問題集或應(yīng)用場景,例如化學(xué)相互作用的建模。是這樣嗎?
阿爾特曼:確實(shí),某些元素是必不可少的,但我認(rèn)為我們當(dāng)前普遍缺失的,對(duì)于我們討論的眾多應(yīng)用而言,是具備推理能力的模型。一旦模型能夠進(jìn)行推理,便可以將它們與化學(xué)仿真器等工具相結(jié)合,或者用于進(jìn)行預(yù)測和假設(shè)。
問:確實(shí),我今天想探討的一個(gè)關(guān)鍵話題是模型網(wǎng)絡(luò)的理念。在討論智能體時(shí),人們往往會(huì)想到一系列線性的函數(shù)調(diào)用,但在生物學(xué)中,我們觀察到的是系統(tǒng)之間復(fù)雜的網(wǎng)絡(luò)和相互作用。這些系統(tǒng)通過集合和網(wǎng)絡(luò)的整合作用產(chǎn)生結(jié)果,而不僅僅是簡單的線性調(diào)用。我們是否正處于這樣一個(gè)架構(gòu)的興起之中:專業(yè)模型或網(wǎng)絡(luò)模型相互協(xié)作,共同解決更復(fù)雜的任務(wù)集,運(yùn)用推理能力,其中一些計(jì)算模型專注于化學(xué)或算術(shù)運(yùn)算,而其他模型則承擔(dān)不同的職責(zé)。這種架構(gòu)避免了依賴單一的、全知全能的模型來處理所有問題。
阿爾特曼:我不確定推理能力最終能否成為一種廣泛適用的功能。我有這樣的預(yù)感,并且希望它是,如果真的能夠?qū)崿F(xiàn),那將是非常理想的。不過,我并不確定它是否真的會(huì)如此。
問:我想知道,是否真的所有這些初創(chuàng)公司都會(huì)失???目前許多初創(chuàng)公司都在采取這樣的策略:收集特定的數(shù)據(jù),接著基于這些數(shù)據(jù)全新訓(xùn)練一個(gè)模型,該模型專門針對(duì)某一任務(wù)進(jìn)行優(yōu)化,并且在這一任務(wù)上的表現(xiàn)超過了其他所有解決方案。
阿爾特曼:某種程度上,正如我們?cè)谟懻撋飳W(xué)和那些復(fù)雜的系統(tǒng)網(wǎng)絡(luò)時(shí)所指出的,我已經(jīng)能夠窺見一二。我之所以會(huì)笑,是因?yàn)樽罱医?jīng)歷了一場嚴(yán)重的疾病,現(xiàn)在已大致康復(fù),但整個(gè)過程就像是身體系統(tǒng)逐一受到打擊。你真的可以明確指出,比如,這是消化系統(tǒng)的問題。這讓我想起了我們之前討論的,你不知道這些系統(tǒng)之間相互作用的復(fù)雜性,直到出現(xiàn)問題,這本身是一個(gè)非常有趣的現(xiàn)象。同時(shí),我嘗試使用ChatGPT來理解我的病情。我可能會(huì)說,我對(duì)某個(gè)問題不太確定。接著,我會(huì)在沒有閱讀的情況下,把相關(guān)的論文鏈接放入上下文中,然后發(fā)現(xiàn),哦,這就是我不確定的那個(gè)問題,現(xiàn)在我認(rèn)為應(yīng)該是這樣。這就是你之前提到的一個(gè)例子,你可以說,我不知道這個(gè)信息,然后你可以添加更多的上下文信息,而不是重新訓(xùn)練整個(gè)模型,你只需要即時(shí)地增加上下文,然后你就能得出一個(gè)結(jié)論。
問:這些用于預(yù)測蛋白質(zhì)結(jié)構(gòu)的模型,比如說,構(gòu)成了這個(gè)領(lǐng)域的基石?,F(xiàn)在,我好奇的是,Alpha 3是否能夠處理其他分子類型的預(yù)測?如果可以,那么理論上最好的通用模型將能夠接入、學(xué)習(xí)訓(xùn)練數(shù)據(jù),并自主解決問題?;蛟S你可以為我們舉一個(gè)例子來闡釋這個(gè)過程。你能和我們談?wù)凷ora嗎?你的視頻模型能夠生成令人驚嘆的動(dòng)態(tài)圖像和視頻。你愿意分享的話,能不能告訴我們它的架構(gòu)有何獨(dú)特之處,以及它是如何區(qū)別于其他模型的?
阿爾特曼:確實(shí),對(duì)于一般性問題,我們顯然需要專業(yè)的模擬器、連接器和各種數(shù)據(jù)片段等工具。我有一種直覺--盡管我得強(qiáng)調(diào)這并沒有科學(xué)依據(jù)--如果我們能夠理解通用推理的精髓,并將這一原理應(yīng)用到新的問題領(lǐng)域,類似于人類的通用推理能力,我認(rèn)為這是可以實(shí)現(xiàn)的。這可能會(huì)是一個(gè)快速的突破過程,至少我是這么認(rèn)為的。至于Sora,它并不是以語言模型為基礎(chǔ),而是專門針對(duì)視頻處理而設(shè)計(jì)的模型。
問:顯而易見,我們還未能完全實(shí)現(xiàn)那樣的技術(shù)境界,對(duì)吧?以構(gòu)建高效視頻模型為例,你們可能是從零開始,采用獨(dú)特的架構(gòu)和特定的數(shù)據(jù)集進(jìn)行開發(fā)。然而,展望未來,一個(gè)具備通用推理能力的系統(tǒng)--也就是我們所說的人工通用智能--理論上應(yīng)該能夠通過自我學(xué)習(xí)和邏輯推理,掌握渲染視頻的方法。
阿爾特曼:我想說的是,以一個(gè)例子來看,據(jù)我所了解,目前全球最優(yōu)秀的文本模型大多還是基于回歸的方法構(gòu)建的。與此同時(shí),頂尖的圖像和視頻模型則采用了擴(kuò)散模型技術(shù),這種情況在某種程度上顯得有些不尋常。
問:圍繞訓(xùn)練數(shù)據(jù)的使用,存在廣泛爭議。你們一直采用合理使用原則和尊重創(chuàng)作者權(quán)利的方式來處理問題,但為何OpenAI選擇不涉足音樂產(chǎn)業(yè)?
阿爾特曼:以音樂為例,如果有人要求模型創(chuàng)作一首泰勒·斯威夫特(Taylor Swift)風(fēng)格的歌,即使該模型從未在泰勒·斯威夫特的歌曲上進(jìn)行過訓(xùn)練,我們?nèi)匀幻媾R一個(gè)挑戰(zhàn):模型可能已經(jīng)了解了關(guān)于泰勒·斯威夫特的信息和她的音樂主題。這就引出了一個(gè)問題:即使沒有直接訓(xùn)練,模型是否應(yīng)該被允許模仿她的風(fēng)格?如果可以,那么泰勒·斯威夫特應(yīng)如何獲得報(bào)酬?在這種情況下,我認(rèn)為首先應(yīng)該有選擇加入或退出的機(jī)制,然后建立一個(gè)經(jīng)濟(jì)模型來處理這些問題。從音樂產(chǎn)業(yè)的采樣歷史中,我們可以找到一個(gè)有趣的視角,來觀察這種經(jīng)濟(jì)模式是如何運(yùn)作的。這雖然和人工智能創(chuàng)作不完全相同,但為我們提供了一個(gè)思考的起點(diǎn)。
問:你是否能夠接受這樣的情況:一個(gè)音樂模型在未向創(chuàng)作了這些音樂作品的藝術(shù)家支付版稅的前提下,自主地通過人類創(chuàng)作出的所有音樂作品庫進(jìn)行訓(xùn)練。接著,你不被允許提出特定藝術(shù)家的請(qǐng)求,而是可以這樣要求:“請(qǐng)為我播放一首相當(dāng)現(xiàn)代的、關(guān)于心碎的流行歌曲,最好是女聲演唱的。”
阿爾特曼:我們已經(jīng)決定暫時(shí)不進(jìn)入音樂產(chǎn)業(yè),部分原因在于圍繞如何界定使用界限的復(fù)雜問題。
問:你看到蘋果最近發(fā)布的廣告了嗎?它將人類的所有創(chuàng)造力凝練在一臺(tái)非常薄的iPad中。你對(duì)這有什么看法?
阿爾特曼:人們對(duì)此產(chǎn)生了非常情感化的反應(yīng),比你想象的要強(qiáng)烈得多。我本人對(duì)人工智能持非常積極的態(tài)度,但我相信人類創(chuàng)造力和藝術(shù)表達(dá)中有些東西是非常寶貴的。對(duì)于能夠提升科學(xué)研究的人工智能,我們當(dāng)然歡迎。然而,當(dāng)涉及到能夠進(jìn)行深刻而美妙的人類創(chuàng)造性表達(dá)的人工智能時(shí),我認(rèn)為我們應(yīng)該審慎行事。這種技術(shù)的發(fā)展是不可避免的,它將成為幫助我們達(dá)到更高層次創(chuàng)造力的工具,但在這個(gè)過程中,我們應(yīng)該找到一種方式,既能推動(dòng)技術(shù)發(fā)展,又能保持我們所珍視的創(chuàng)造性精神。
問:當(dāng)討論到人工智能的監(jiān)管以及在一個(gè)由人工智能主導(dǎo)的世界中實(shí)施全民基本收入時(shí),有人提倡“全面監(jiān)管人工智能”。這究竟指的是什么?你是否能夠就加州最近提出的監(jiān)管提案分享一些看法?
阿爾特曼:我對(duì)目前的情況有些憂慮。雖然我注意到有許多關(guān)于人工智能的監(jiān)管提案正在討論中,但就我個(gè)人所見,加州的許多提案引起了我的擔(dān)憂。同時(shí),我普遍擔(dān)心如果每個(gè)州都獨(dú)立進(jìn)行人工智能的監(jiān)管工作。當(dāng)討論到“監(jiān)管人工智能”時(shí),我認(rèn)為人們的想法并不統(tǒng)一。有些人可能主張完全禁止人工智能的發(fā)展,而另一些人則可能堅(jiān)持認(rèn)為人工智能應(yīng)當(dāng)是開源的,而不是封閉的。我個(gè)人特別關(guān)注的是,我相信在不遠(yuǎn)的將來,我們可能會(huì)面臨一個(gè)時(shí)刻--我得承認(rèn),這只是一個(gè)前瞻性的聲明,做出此類預(yù)測總是伴隨著風(fēng)險(xiǎn)--我的預(yù)測是,在不久的將來,一些先進(jìn)的人工智能系統(tǒng)將有能力造成嚴(yán)重的全球性傷害。對(duì)于這些系統(tǒng),我希望能有一個(gè)類似全球監(jiān)管核武器或合成生物學(xué)的國際機(jī)構(gòu),來監(jiān)督這些最強(qiáng)大系統(tǒng),并確保它們經(jīng)過合理的安全測試,以防止它們失控、自我遞歸改進(jìn)或其他類似的風(fēng)險(xiǎn)。
問:如果你擁有制造核武器的核材料,這通常只限于少數(shù)人所持有,因此,可以將這種情況比作需要核檢查的類比。
阿爾特曼:確實(shí),我覺得這個(gè)觀點(diǎn)很有趣。關(guān)于監(jiān)管問題,我想補(bǔ)充一點(diǎn),我非常擔(dān)心監(jiān)管可能會(huì)過度。我相信,無論是做過了頭還是僅僅做過了一點(diǎn)點(diǎn),我們都可能會(huì)犯錯(cuò)。同樣,如果我們做得不夠,也可能出錯(cuò)。但我真的認(rèn)為,我們有責(zé)任也有使命去討論我們認(rèn)為可能會(huì)發(fā)生的事情,以及為了正確處理這些事情我們需要做些什么。
問:挑戰(zhàn)在于,我們現(xiàn)有的法規(guī)本意是保護(hù)人民和整個(gè)社會(huì),但我們正在面臨一種新類型的法規(guī),這種法規(guī)可能會(huì)賦予政府審查代碼和商業(yè)機(jī)密的權(quán)力,這是我們以前從未遇到過的。我認(rèn)為,這些立法者對(duì)人工智能的理解可能還很有限。正如你所知,甚至比任何人都清楚,隨著技術(shù)的快速發(fā)展,這些法規(guī)在一年后可能就會(huì)變得不再適用。
阿爾特曼:我之所以提倡采取基于機(jī)構(gòu)的方法來處理宏觀層面的問題,而不是將這些寫入法律,是因?yàn)槲艺J(rèn)為在12個(gè)月后,這些法律可能都會(huì)被證明是不正確的。即使這些立法者是世界級(jí)的專家,我也懷疑他們能否在12個(gè)月或24個(gè)月的時(shí)間框架內(nèi)做出正確的決策。我不相信那些政策,比如我們要審查你的所有源代碼,逐一檢查你的所有權(quán)重,是的,我認(rèn)為市面上有很多不切實(shí)際的提議。但是,就像飛機(jī)在獲得認(rèn)證前需要經(jīng)過一系列的安全測試一樣,這與閱讀你所有的代碼完全不同,我們更應(yīng)該審查模型的輸出結(jié)果,而不是模型的內(nèi)部細(xì)節(jié)。我想說的是,我認(rèn)為進(jìn)行安全測試是有意義的。
問:我們?cè)鯓硬拍苓_(dá)到那個(gè)目標(biāo)呢?你認(rèn)為這種方法是否能夠正確解決問題,或者你對(duì)這個(gè)問題有何看法?
阿爾特曼:我認(rèn)為GPT-4并不會(huì)構(gòu)成實(shí)質(zhì)性的威脅,并且有許多安全的方式來發(fā)布這樣的模型。但你也了解,當(dāng)涉及到可能導(dǎo)致大量人員傷亡的情況時(shí),比如飛機(jī)或其他許多例子,我們很樂意有一套測試框架來確保安全。當(dāng)我登上飛機(jī)時(shí),我通常不會(huì)擔(dān)心它的安全性,因?yàn)槲壹俣ㄋ前踩?,?duì)吧?現(xiàn)在,人們對(duì)此有很多不必要的擔(dān)憂。
問:你能解釋一下為什么決定啟動(dòng)全民基本收入項(xiàng)目嗎?你的初衷是什么?
阿爾特曼:我相信,金錢雖然不能解決所有問題,也不會(huì)讓人即刻感到幸福,但它可能能解決一些問題,可能為人們提供一個(gè)更好的起點(diǎn),幫助他們自助,我對(duì)這樣的前景非常感興趣。現(xiàn)在,隨著我們看到人工智能的發(fā)展方式,我在思考,是否有比傳統(tǒng)的全民基本收入(UBI)更好的做法。我在想,未來可能不僅僅是關(guān)于全民基本收入,而更像是全民基本計(jì)算資源。例如,每個(gè)人都可以獲得一定量的GPT-7計(jì)算能力,他們可以使用它,可以將其轉(zhuǎn)售,或者捐贈(zèng)給其他人用于癌癥研究等。但你所獲得的不是金錢,而是相當(dāng)于一部分生產(chǎn)力的份額,你擁有的是生產(chǎn)力的一部分。
問:你曾經(jīng)被解雇,卻又回來了,那是一場內(nèi)部的權(quán)力斗爭嗎?有沒有人背叛了你?
阿爾特曼:我遭遇了被解雇的情況,當(dāng)時(shí)我在考慮是否返回崗位,因?yàn)槟菚r(shí)我感到非常沮喪,有些迷茫。但隨后我意識(shí)到,我對(duì)OpenAI以及那里的同事們懷有深厚的感情,我決定要回去。我明白重返崗位將會(huì)面臨挑戰(zhàn),實(shí)際上,這個(gè)過程比我預(yù)想的更加艱難,但我覺得可以應(yīng)對(duì)。我同意重返OpenAI。在酒店房間里,我?guī)仔r(shí)都處于一種徹底的困惑狀態(tài),努力想弄清楚下一步該怎么辦。然后事情變得非常奇怪。最終,盡管中間經(jīng)歷了許多瘋狂的時(shí)刻,但事情得到了解決。OpenAI當(dāng)時(shí)只有一個(gè)非營利董事會(huì),因此所有的董事會(huì)成員都是獨(dú)董。董事會(huì)的成員數(shù)量已經(jīng)減少到了六個(gè)人。他們先是讓時(shí)任董事長兼總裁格雷格·布洛克曼(Greg Brockman)離開了董事會(huì),隨后又解雇了我。情況就是這樣。
問:我的意思是,是否在董事會(huì)中,那些只具有非營利組織背景的成員與那些具有初創(chuàng)公司經(jīng)驗(yàn)的成員之間發(fā)生了文化沖突?如果你愿意,你能否分享一些關(guān)于導(dǎo)致這些決策背后的動(dòng)機(jī)的信息,或者是任何你愿意透露的細(xì)節(jié)。
阿爾特曼:我總是認(rèn)為文化沖突是不可避免的。顯然,并非所有董事會(huì)成員都是我特別喜愛的人,但我對(duì)他們對(duì)待人工通用智能的嚴(yán)肅態(tài)度以及對(duì)確保人工智能安全重要性的認(rèn)識(shí)持有深深的敬意。盡管我對(duì)他們某些決策和行為持有強(qiáng)烈的異議——我確實(shí)有這樣的異議——但我從未對(duì)他們的誠信或?qū)ξ覀児餐繕?biāo)的承諾,也就是實(shí)現(xiàn)安全且有益的通用人工智能感到懷疑。
問:你是否認(rèn)為他們?cè)谔幚磉^程中做出了正確的決策,或者是否知道如何平衡所有需要妥善處理的事務(wù)?
阿爾特曼:我并不這么認(rèn)為。但我確實(shí)相信,他們的意圖是真誠的,他們對(duì)通用人工智能的重視以及對(duì)正確處理這項(xiàng)技術(shù)的承諾是認(rèn)真的。
問:我想詢問有關(guān)OpenAI的使命,其明確的目標(biāo)是開發(fā)人工通用智能。這確實(shí)是一個(gè)非常有趣的目標(biāo)。這樣的使命是否為您所從事的工作帶來了更多的擔(dān)憂?我理解,它同樣也能激發(fā)動(dòng)力,但您是如何平衡這兩者的?您為什么會(huì)選擇這樣的使命?
阿爾特曼:我首先會(huì)回答第一個(gè)問題,然后是第二個(gè)問題。我認(rèn)為,人工通用智能的發(fā)展確實(shí)引起了廣泛的恐懼,這是可以理解的,因?yàn)樵S多人對(duì)當(dāng)前的人工智能,乃至未來的AGI都感到害怕。盡管如此,他們對(duì)人工智能目前的發(fā)展感到興奮,對(duì)未來的可能性感到更加興奮,盡管這種興奮伴隨著更深的憂慮。我們正在努力應(yīng)對(duì)這些復(fù)雜的情感,但我認(rèn)為通用人工智能的出現(xiàn)是不可避免的,它終將實(shí)現(xiàn)。我相信,盡管如此,它將帶來巨大的益處。然而,我們確實(shí)需要找到一種合理的方式來引導(dǎo)我們走向這一未來。將會(huì)有很多變化發(fā)生,而變化往往讓人們感到不適,所以我們需要在很多方面做出正確的決策和調(diào)整。
問:你是一位杰出的交易者。我見證了你整個(gè)職業(yè)生涯,你在交易方面的確非常出色。你擁有廣泛的人脈,而且在籌資方面技藝高超,成效顯著。你在投資界的動(dòng)作,以及你所參與的公司籌集了巨額資金來建設(shè)芯片廠等事宜,所有這些都顯示了你的實(shí)力。不過,這里稍微夸張了一點(diǎn),我們都知道,你并非真的籌集了7萬億美元,那可能是某公司的市值。暫且不提這些,問題在于,盡管你完成了眾多交易,但有人對(duì)你缺乏信任,這究竟是為什么?你的動(dòng)機(jī)何在?你追求的最終目標(biāo)是什么?哪些機(jī)遇應(yīng)當(dāng)保留在OpenAI內(nèi)部,而哪些可以歸屬于你個(gè)人?是不是因?yàn)槟切┓菭I利組織的人對(duì)你有所懷疑?
阿爾特曼:關(guān)于設(shè)備公司或芯片制造公司的項(xiàng)目,這些并不是我個(gè)人的項(xiàng)目,而是OpenAI的項(xiàng)目。相應(yīng)的,OpenAI將會(huì)獲得相關(guān)股權(quán)。我理解外界可能會(huì)有這樣的看法,尤其是那些不需要日常評(píng)論這些事務(wù)的人。這是公平的,因?yàn)槲覀冞€沒有宣布這些事項(xiàng),它們尚未完成。我并不認(rèn)為世界上大多數(shù)人會(huì)像你們這樣深入思考這些問題。我也認(rèn)同,這種情況確實(shí)容易引發(fā)眾多陰謀論,特別是在科技評(píng)論家中。如果能回到過去,我會(huì)更加明確地表達(dá)我持有股份的意圖,并確保這一點(diǎn)非常清晰。這樣,每個(gè)人都能理解,盡管如此,我依然會(huì)投身于其中,因?yàn)槲疑钋嘘P(guān)心通用人工智能,并相信這是全球最引人入勝的工作。至少,這樣做可以向所有人清楚地傳達(dá)芯片項(xiàng)目的本質(zhì)。
每日經(jīng)濟(jì)新聞綜合公開資料
封面圖片來源:每日經(jīng)濟(jì)新聞 資料圖
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP