每日經(jīng)濟新聞 2023-10-31 17:14:16
◎ 當(dāng)ChatGPT的風(fēng)刮到非洲,會掀起什么樣的風(fēng)暴?《每日經(jīng)濟新聞》記者近期與多位非洲當(dāng)?shù)氐腁I創(chuàng)業(yè)項目負責(zé)人聊了聊。
每經(jīng)記者 李孟林 每經(jīng)編輯 蘭素英
大巴車穿過塞內(nèi)加爾首都達喀爾市區(qū),在老舊二手車的車流中緩慢前行,不時有小販向堵車中的司機兜售小商品和零食。市郊的環(huán)形路口中央裸露著沙土,有牧民趕著羊群吃草。出了市區(qū)上高速,約莫半個小時,大巴來到了一片開闊地帶。在大西洋潮濕海風(fēng)的滋養(yǎng)下,草木郁郁蔥蔥,而我們此行的目的地:阿卜杜·迪烏夫國際會展中心,就坐落在這片尚待進一步開發(fā)的“開發(fā)區(qū)”。
會展中心內(nèi)人們討論的話題——時下最火爆的生成式AI——和周遭環(huán)境頗有格格不入之感:AI正在飛速迭代,但離非洲似乎仍然很遙遠。
10月28日,“AI教父”杰弗里·辛頓表示,科技公司計劃在18個月內(nèi)將AI大模型的計算規(guī)模擴大100倍,為此他和約書亞·本吉奧、姚期智三名圖靈獎得主聯(lián)合發(fā)文,呼吁管控AI快速進步的風(fēng)險。“若被正確和公正地應(yīng)用,先進的 AI 可以為人類解決長久以來的問題,如疾病、貧困和環(huán)境問題……AI也可能會固化甚至加劇全球的不平等,”他們在文中警告稱。
正是帶著同樣的期望和擔(dān)憂,今年10月蓋茨基金會將2023年大挑戰(zhàn)(Grand Challenges)年會的舉辦地點選在了非洲最西端的塞內(nèi)加爾首都達喀爾,重點關(guān)注生成式AI對全球健康和發(fā)展議題的助益。
《每日經(jīng)濟新聞》記者受邀參加了為期三天的活動,和多個受蓋茨基金會資助的AI項目負責(zé)人、科技產(chǎn)業(yè)領(lǐng)袖交流,聆聽專家的圓桌討論,整體感受是潛力很大,挑戰(zhàn)不小。然而,正如比爾·蓋茨和不少非洲領(lǐng)導(dǎo)人反復(fù)說的那樣,非洲在新冠疫情時未能及時獲得疫苗,這樣的事情不應(yīng)該再重演。在大模型起飛之初就讓中低收入地區(qū)參與進來,對于公平利用AI技術(shù)至關(guān)重要。
“你能相信嗎,馬里教育體系講授的語言,99%的人都不會在生活中使用,”說起自己開發(fā)非洲本土語言教材的初衷,邁克爾·利文撒爾(Michael Leventhal)感嘆道。
馬里是西非面積第二大的國家,曾經(jīng)是法國的殖民地。1960年獨立之后,法語仍然是教育和官方體系的語言,而本地人說的班巴拉語,則是一門書寫體系尚未完全規(guī)范化的弱勢語言。近10年前,在硅谷工作多年的美國人利文撒爾來馬里短期“支教”,被這里缺乏教育資源的狀況觸動,最終扎下根來,把推動班巴拉語的教學(xué)為人生新志向。
技術(shù)出身的利文撒爾曾在芯片巨頭美光工作過,對前沿科技并不陌生。三個月前,在獲得了蓋茨基金會10萬美元的資助后,他迅速行動起來,探索如何把生成式AI運用在教育上。
利文撒爾對《每日經(jīng)濟新聞》記者表示,班巴拉語教學(xué)的一大痛點是閱讀材料的匱乏,生成式AI在這一塊能發(fā)揮很大的作用。他的團隊用英語或法語往GPT-4輸入故事的想法“種子”,讓它來填充內(nèi)容,然后再把故事翻譯成班巴拉語。隨后,他們用Stable Diffusion的文字生成圖片技術(shù),給故事配上生動的配圖,這樣就做出了一本圖文并茂的兒童讀物。
“我很喜歡讀中國的《紅樓夢》,所以我就問ChatGPT,這本書里面有什么會是非洲兒童感興趣的情節(jié)?然后從那個點出發(fā),發(fā)展出一整個故事,”利文撒爾對記者舉了一個例子。僅在3個月時間里利文撒爾的團隊已經(jīng)做出了60本書。他表示:“這些事情并不是說人類做不來,但是AI把效率提高了50倍。要知道,世界銀行資助的非洲語言童書項目,一年也才能編寫20本。”
這些故事書已經(jīng)在不少社區(qū)中心和學(xué)校試用,孩子們都很喜歡。近期馬里的國家語言政策委員會開會,商討改善該國65%的文盲率問題,已經(jīng)表示要從利文撒爾這里訂購50萬本故事書做教材。
同利文撒爾的項目一樣,還有近50個來自中低收入國家的AI項目分別獲得了10萬美元的資助,涉及醫(yī)療、教育、農(nóng)業(yè)和普惠金融等領(lǐng)域。不少項目的負責(zé)人在交流過程中對記者表示,AI大模型能節(jié)省人力物力投入、降低滿足需求場景的技術(shù)門檻,這對資源緊缺的地區(qū)而言至關(guān)重要。
坦桑尼亞索科因農(nóng)業(yè)大學(xué)的助理講師蒂歐弗里達·馬金加(Theofrida Maginga)原本在研究利用物聯(lián)網(wǎng)(IoT)技術(shù)監(jiān)控玉米疾病的早期征兆?,F(xiàn)在,她的團隊利用ChatGPT技術(shù)開發(fā)了聊天機器人,能夠及時向文化水平不高的小農(nóng)戶提供玉米疾病的診斷意見和解決方案。對于靠玉米掙到一半收入的當(dāng)?shù)剞r(nóng)民而言,這些指導(dǎo)的重要性不言而喻。
最重要的是,這個工具可以直接在類似微信的Whatsapp里面使用,只需加個好友就行,不用單獨安裝應(yīng)用,而且能用當(dāng)?shù)氐乃雇呶骼镎Z語音輸入和輸出。“用最簡單的方式幫助農(nóng)民決策,這是我們一直的目標(biāo)。農(nóng)民覺得我們的技術(shù)很親切,希望這能成為他們?nèi)粘I畹囊徊糠郑?rdquo;馬金加對記者表示。
南非健康基金會的斯科特·馬奧尼(Scott Mahoney)看重的則是大模型處理大量文本的能力。每年,世界衛(wèi)生組織(WHO)、醫(yī)學(xué)研究協(xié)會以及各國的衛(wèi)生部門都會發(fā)布大量的臨床醫(yī)療證據(jù),需要靠人力分析才能形成臨床指導(dǎo)建議,這是一個耗時耗力的過程。
“高收入國家有很多付費的臨床指南,但訂閱費要250美元到500美元一年,相當(dāng)于(發(fā)展中國家)醫(yī)護人員一年工資的5%到10%,這是一個很大的障礙。”馬奧尼表示。“另一方面,從臨床證據(jù)的出現(xiàn)到其實際應(yīng)用于臨床實踐,大概需要10到17年的時間,加速這一進程可能會改變很多病人的命運。”
馬奧尼所在的團隊希望用GPT-4和微軟云Azure的機器學(xué)習(xí)平臺去提煉出這些文件里的實用建議,給醫(yī)護人員做決策參考。目前,他們已經(jīng)就180多頁的WHO文件做了試驗,發(fā)現(xiàn)機器得出的結(jié)果和專業(yè)編輯團隊的重合率可以達90%,顯示出這一路徑的潛力。
在2022年11月ChatGPT橫空出世之后不久,《時代》雜志的一則新聞報道將世人的目光引向了遠在非洲的肯尼亞。據(jù)報道,OpenAI在這里雇傭了外包的數(shù)據(jù)標(biāo)注人員,員工的低薪、工作時長和精神壓力引發(fā)不少批評。
實際上,肯尼亞的科技創(chuàng)業(yè)氛圍在整個非洲位于前列,首都內(nèi)羅畢的科創(chuàng)產(chǎn)業(yè)區(qū)甚至有“大草原硅谷”(Silicon Savannah)名聲。大模型的爆發(fā)讓當(dāng)?shù)貏?chuàng)業(yè)圈子看到了遠不止外包審核的產(chǎn)業(yè)機會。
“肯尼亞是通往非洲的重要門戶,人口結(jié)構(gòu)年輕,開發(fā)者社區(qū)規(guī)模很大,而且還在快速增長。大模型帶來了一個激動人心的時刻,可能根本性地改變很多商業(yè)策略。”非洲移動支付應(yīng)用M-Pesa的金融科技負責(zé)人朱麗安娜·羅蒂奇(Juliana Rotich)對記者表示。
羅蒂奇是肯尼亞科技界舉足輕重的人物。她聯(lián)合創(chuàng)立的災(zāi)情信息開源軟件Ushahidi已經(jīng)被新西蘭、日本等發(fā)達國家采用。在內(nèi)羅畢,她聯(lián)合發(fā)起了孵化空間iHub,成為當(dāng)?shù)貏?chuàng)業(yè)者的基地。
同樣來自內(nèi)羅畢的托尼·恩東古(Tonee Ndungu)也是一名創(chuàng)業(yè)“老兵”,創(chuàng)立過孵化中心,還是教育科技公司的Kytabu的創(chuàng)始人。和一眾受資助項目相比,他的項目要成熟得多:在已有的K-12教育軟件里引入ChatGPT,為不同年級的學(xué)生提供個性化的學(xué)習(xí)輔導(dǎo)。
“內(nèi)羅畢的每個創(chuàng)業(yè)公司都在看大模型帶來的機會。不管你是做健康產(chǎn)業(yè),還是教育、保險,都需要個人化的服務(wù),而AI能提供更快、更便宜的個人化服務(wù),這真是一個分水嶺時刻,”恩東古對《每日經(jīng)濟新聞》記者表示。
在恩東古看來,肯尼亞人一直很推崇技術(shù),而且肯尼亞的智能手機滲透率已經(jīng)非常高,市場爆發(fā)的潛力已經(jīng)具備,而大模型降低了很多功能開發(fā)上的門檻,這正是肯尼亞科創(chuàng)企業(yè)急需的。
就在恩東古來大挑戰(zhàn)年會的前幾天,亞馬遜云科技(AWS)在內(nèi)羅畢開設(shè)了新的辦公室??夏醽?022年通過了數(shù)據(jù)保護法律,對本國公民的數(shù)據(jù)存儲在海外做了嚴格限制。“有了AWS,創(chuàng)業(yè)者可以合法地收集數(shù)據(jù)了,再加上開源大模型,我們可以做很多本地化的改進。”恩東古表示。
來自南非的卡羅琳·戈瓦森(Caroline Govathson)的工作重點是HIV防治。她的團隊用大模型開發(fā)了一個HIV感染風(fēng)險評估應(yīng)用,希望既能解決醫(yī)生資源不足的問題,也能讓潛在感染者放心咨詢。
“我看到了AI巨大的潛力,來參會的人也都這么說,但是還有很多進一步的工作要做。”她對記者表示。
的確,雖然與會者洋溢著對AI大模型的樂觀情緒,但畢竟從項目征集到大挑戰(zhàn)年會的現(xiàn)場展示交流只過去了三個月,很多項目還處于驗證概念或試運行階段,而不少難點和痛點已經(jīng)暴露了出來。
首當(dāng)其沖的是大模型在跨文化應(yīng)用上帶來的本地化不足的問題,畢竟互聯(lián)網(wǎng)上的語料還是以英語等強勢語言為主,來自中低收入國家的小語言視角相當(dāng)匱乏,AI生成的內(nèi)容常常與本地文化格格不入,甚至帶有冒犯性。
編撰班巴拉語教材的利文撒爾對這一點體會頗深,比如他想要ChatGPT寫一個關(guān)于非洲的故事,系統(tǒng)給出的內(nèi)容卻更像是歐洲人寫的幻想小說,是外國人想象中的非洲,與實際情況相去甚遠。
戈瓦森同樣表示,不少非洲人的文字輸入能力有限,對智能設(shè)備的熟悉程度不高,只能依賴于語音的輸入和輸出。要確保咨詢內(nèi)容的準(zhǔn)確性,如何讓模型更加熟悉本地的俚語就是一個必須要處理的問題。
此外,雖說大模型的生成能力能替代很多人力,但要真正用好還是要頗費一番功夫,對使用者的技能要求很高。
“我寫了一輩子的代碼,我可以說寫Prompt(提示語)比寫代碼還難。你首先要理解這個系統(tǒng)的原理,還要熟悉馬里文化,懂得語言學(xué)知識和教學(xué)法。普通人拿ChatGPT來玩可以很有樂趣,但是要得到高質(zhì)量的結(jié)果,還是需要專家,”利文撒爾表示。
恩東古的教育軟件不是單純引入ChatGPT,而是需要拿自己的題庫做訓(xùn)練和微調(diào),這就在智力和算力上提出了更高的要求。“智力資源是一大挑戰(zhàn)。開發(fā)產(chǎn)品的難度很高,我們不得不到歐洲去招聘人才,”恩東古表示,“另一方面,兒童學(xué)習(xí)的內(nèi)容必須確保準(zhǔn)確,要杜絕‘幻覺’的出現(xiàn)。因此我們的項目需要進行測試,而每跑一次測試的價格高達4000美元,這很貴。”
南非的馬奧尼則持樂觀心態(tài),相信快速迭代的AI技術(shù)能夠解決掉很多問題:“當(dāng)然,大模型還有很多局限,但是我們也要看到大模型發(fā)展的現(xiàn)實情況。三個月前的困難,到今天可能已經(jīng)完全消失了,這可能是通過模型的微調(diào),或者提高應(yīng)用程序接口的響應(yīng)速度。”
或許正是看到了各個項目反映的困難,大挑戰(zhàn)年會期間,比爾·蓋茨宣布蓋茨基金會將投入3000萬美元,支持非洲建立一個AI平臺,給非洲科學(xué)家和創(chuàng)業(yè)人士提供技術(shù)和運營上的支持,比如數(shù)據(jù)存儲方面的支持。此外,這些資金還將幫助有潛力的項目進入下一階段。
“我們很幸運得到了(第一輪的)資助,我們工作很努力。即使沒有進一步資助,這些AI生成的教材也能使用很長時間了,甚至永遠被人閱讀。”利文撒爾對《每日經(jīng)濟新聞》記者表示。
封面圖片來源:蓋茨基金會
如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán),嚴禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟新聞APP