每日經濟新聞 2024-03-19 19:23:47
◎瀾舟科技創(chuàng)始人兼CEO周明表示,數(shù)字化浪潮中,以大模型為代表的人工智能正在重塑人類的未來。2024年將是大模型落地元年,如何利用大模型技術助力企業(yè)成長已成為業(yè)界關注的焦點。
每經記者 趙雯琪 每經編輯 劉雪梅
經過了2023年的創(chuàng)業(yè)元年和百模大戰(zhàn)后,大模型新一輪的商業(yè)場景落地之戰(zhàn)已經打響。
3月18日,瀾舟科技發(fā)布“一橫N縱”孟子大模型系列及產品,包括Mengzi3-13B大模型、孟子金融大模型、孟子編程大模型,及應用能力型產品AI文檔理解、文檔問答、文檔輔助寫作、機器翻譯、瀾舟智會、AI搜索等。
就在同日,同樣是大模型明星公司月之暗面宣布在大模型長上下文窗口技術上取得新的突破,其自研的Kimi智能助手已支持200萬字超長無損上下文,并于當日開啟產品內測。
瀾舟科技創(chuàng)始人兼CEO周明在現(xiàn)場向包括《每日經濟新聞》記者在內的媒體表示,數(shù)字化浪潮中,以大模型為代表的人工智能正在重塑人類的未來。2024年將是大模型落地元年,如何利用大模型技術助力企業(yè)成長已成為業(yè)界關注的焦點。
“政府工作報告新鮮出爐,特別強調以人工智能+,驅動各行各業(yè)的轉型升級。作為賽道中的創(chuàng)業(yè)公司,要把握好這個歷史契機,通過落地,創(chuàng)造價值,拉動創(chuàng)新。”周明表示。
作為創(chuàng)新工場孵化的大模型創(chuàng)業(yè)公司,瀾舟科技同時宣布與李開復的零一萬物達成合作,李開復預測,3年之后,生成式AI的應用將成為用戶增長最快的應用,全移動時代的應用將會成為過去式。
“今天完成了瀾舟深耕大模型(含預訓練模型)三年來的成果匯報,謝謝大家支持!”在瀾舟科技的新品發(fā)布會結束后,周明在朋友圈這樣感嘆。
公開資料顯示,瀾舟科技于2021年6月正式成立,致力于自主研發(fā)大模型技術和行業(yè)應用,在去年3月發(fā)布了孟子GPT V1(MChat)大模型,今年1月孟子大模型GPT V2(含孟子大模型-標準、孟子大模型-輕量、孟子大模型-金融、孟子大模型-編碼)對公眾開放。
周明介紹稱,瀾舟團隊在近期完成了Mengzi3-13B的大模型訓練,在常見公開數(shù)據集,如MMLU(多語言理解均值),Chinese-MMLU(中文-多語言理解均值),GSM8K(評估大模型數(shù)學運算能力的數(shù)據集),HUMAN-EVAL(一個用于評估人工智能模型生成文本質量的指標)等評估模型效果來看,該模型在各項基準測試中與相仿參數(shù)量大模型相比,英文能力提高了6.7%,中文能力提高了9.1%,中英文語言能力成績領先,在編碼和數(shù)學等兩個方面也取得了上升的結果。3月30日Mengzi3-13B的模型將在GitHub(一個面向開源及私有軟件項目的托管平臺)、HuggingFace(一個人工智能社區(qū))、魔搭和始智AI社區(qū)開源。
相比于通用大模型,瀾舟科技從創(chuàng)業(yè)第一天就聚焦于行業(yè)/垂直大模型。據周明介紹,瀾舟科技的體系為“一橫N縱”,即以孟子大模型為基礎,面向多個ToB場景發(fā)布垂直領域的產品。瀾舟科技目前重點投入到了金融行業(yè),輔助編程等領域,希望打造更加貼近行業(yè)場景的垂直大模型。
其中,瀾舟科技的大模型產品包括AI文檔理解,該產品涵蓋專業(yè)的PDF文檔解析能力和信息抽取能力。在與新華智云共建文化大模型,以及其他眾多AI文檔理解,信息提取類客戶場景中均已使用。
除了文檔理解、搜索和問答,周明也介紹了瀾舟科技面向場景的可控AI寫作助手-AI文檔輔助寫作。該產品支持用戶上傳多個文檔作為參考資料,支持自定義多級題目和寫作提綱,由大模型賦能自動化按要求生成完整的文章初稿,目前已經在聯(lián)通客戶項目落地,為其數(shù)智化投研平臺提供了智能研報寫作的能力。
作為創(chuàng)新工場孵化的大模型創(chuàng)業(yè)公司,瀾舟科技與零一萬物也宣布達成合作。在去年的大模型創(chuàng)業(yè)浪潮中,李開復帶隊創(chuàng)辦了AI公司零一萬物,此前已推出Yi-34B和Yi-6B兩個開源大模型,號稱對學術研究完全開放,同步開放免費商用申請。
在李開復看來,瀾舟在基于大模型面向企業(yè)市場落地方面已經有了非常好的基礎,零一萬物在千億級大模型、多模態(tài)方面會投入更多力量,未來兩家創(chuàng)業(yè)公司能實現(xiàn)優(yōu)勢互補。
李開復表示,大模型的智力水平在兩年前就已經比普通人水平“好一點”,目前,世界上最好的大模型已經是人類平均智力水平的3倍。李開復以“答題”舉例,即在100道考題里,普通人平均只能答對33題,而“最好的AI大模型”可答對99道以上。
他同時指出,AI 2.0模型能力突飛猛進,通識理解已經超越人類專家。AI 2.0通過圖靈測試并趨于成熟,揭示下一個平臺級變革。新一代創(chuàng)新應用需要新的技術平臺,基于強大的底層技術搭建出高效的開發(fā)工具,從而節(jié)約開發(fā)生態(tài)做創(chuàng)新產品的成本,促進包括新產品、新業(yè)態(tài)、新的商業(yè)模式的全新應用生態(tài)。
而對于AI 2.0未來的發(fā)展趨勢,李開復如此總結:
最革命性的AI 2.0應用應該是AI-First/AI-Native:最終脫穎而出的應用屬于那些敢于全力投入新技術的先驅者。大語言模型的引入為AI-First應用帶來了巨大的推動力。
現(xiàn)實世界的信息是文本、音頻、視覺、傳感器以及人類各種觸覺的綜合體系,要更為精準地模擬現(xiàn)實世界,就需要將各種模態(tài)能力打通,例如文本-圖像、文本-視頻等跨模態(tài)甚至全模態(tài)的綜合能力。
李開復表示,未來AI 2.0將超越對話,從聊天工具到智能生產力工具,在此趨勢下,用戶體驗以及未來交互界面和商業(yè)模式都會發(fā)生大的變革。除此之外,AI 2.0將走向實體,大幅提振社會生產力,具身智能可以讓機器人制造機器人,進一步實現(xiàn)AI 2.0+生產線智能規(guī)劃。
李開復發(fā)表《AI 2.0 平臺變革進行式》主題演講 圖片來源:每經記者 趙雯琪 攝
經過了過去一年的創(chuàng)業(yè)潮,大模型賽道神仙打架,頭部企業(yè)也密集發(fā)布產品,一直延續(xù)至今年。
但對每一家公司來說,商業(yè)化落地都并非易事。今年以來,大模型市場派代表人物朱嘯虎、周鴻祎接連向技術派“開火”,直言不看好通用大模型在國內的前景。
北京市海淀區(qū)副區(qū)長徐振濤提供的數(shù)據顯示,北京市僅海淀區(qū)大模型企業(yè)、機構超90家,并且數(shù)量持續(xù)增長。通過備案的大模型36家,占全市的72%以上,截止到目前已經培育20家獨角獸企業(yè),占全市的60%,企業(yè)在人工智能領域,授權發(fā)明專利數(shù)量8.1萬件,占全市的62%。這也意味著,大模型賽道愈發(fā)擁擠,競爭也依然激烈。
在周明看來,經過一年的發(fā)展,大模型將在今年迎來落地元年,而談及如何做好大模型落地應用,周明表示,雷軍所說的互聯(lián)網七字法則“專注、極致、口碑和快”仍然適用,還要再加上“成本”,大模型創(chuàng)業(yè)不能不在意成本,一定要有造血的能力,形成大模型落地九字法則:“專注、極致、口碑、快、成本”。
針對大模型的行業(yè)落地適配問題,周明則提到了L1-L2-L3-L4的層次化分級服務體系,基于L1-通用大模型,在此基礎上加入行業(yè)數(shù)據訓練出L2-行業(yè)/垂直大模型,如金融、編程大模型。針對重要場景,在L1或者L2模型基礎上finetune(微調),實現(xiàn)L3大模型。最后Agents(代理人)可以調用L1-L2-L3任何一層的模型形成完整的一個特定任務。
中關村數(shù)智人工智能智能產業(yè)聯(lián)盟理事長崔寶秋則表示,大模型未來會觸及、波及到每個人,對于大模型創(chuàng)業(yè)公司來說,抓住剛需是第一步,其次要了解自己的技術邊界是什么,除此之外,大模型創(chuàng)業(yè)公司不要被大模型快速發(fā)展淹沒,在進行商業(yè)落地、實際運用的探索時要提前想清楚自己的優(yōu)勢是什么。”崔寶秋表示。
“大模型創(chuàng)業(yè)所需要的生態(tài)環(huán)境非常重要,瀾舟一方面聚焦自己擅長的能力和場景,另外一方面會注重與開源社區(qū)、與客戶和合作伙伴攜手共進。”周明表示。
如需轉載請與《每日經濟新聞》報社聯(lián)系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP