每日經(jīng)濟(jì)新聞 2025-01-02 15:07:39
◎EX機器人創(chuàng)始人李博陽接受《每日經(jīng)濟(jì)新聞》記者專訪時表示,大模型技術(shù)顯著提升了人形機器人與用戶的交互體驗,降低了研發(fā)成本。目前公司的線下文旅綜合體已實現(xiàn)盈利,預(yù)計3至5年內(nèi)可收回成本。此外,公司還在拓展教育、陪護(hù)等面向C端的應(yīng)用場景,并計劃在未來10年左右真正面向C端。不過,人形機器人產(chǎn)業(yè)仍面臨同質(zhì)化競爭等挑戰(zhàn),未來3至5年將是淘汰期。
每經(jīng)記者 楊卉 每經(jīng)編輯 魏文藝
困于應(yīng)用落地難題多時的人形機器人產(chǎn)業(yè),終于等來了人工智能這個“及時雨”。
過去一年里,隨著人工智能技術(shù)地迅速發(fā)展,大模型成為機器人的“最強大腦”,使其交互水平大大提高,更多應(yīng)用場景開始成為可能。
近日,深耕人形機器人產(chǎn)業(yè)的大連蒂艾斯科技發(fā)展股份有限公司(以下簡稱EX機器人)創(chuàng)始人李博陽在接受《每日經(jīng)濟(jì)新聞》記者(以下簡稱NBD)專訪時表示,近期人形機器人產(chǎn)業(yè)發(fā)展迅速,大模型技術(shù)的引入顯著提升了機器人與用戶的交互體驗,同時隨著核心零部件的自研,研發(fā)成本也有了顯著下降。“更為關(guān)鍵的是,應(yīng)用場景方面,EX機器人旗下的線下文旅綜合體已實現(xiàn)盈利。”
不過李博陽也指出,從產(chǎn)業(yè)發(fā)展趨勢來看,未來3年之內(nèi)會有很多落地場景出現(xiàn),但預(yù)計5年之內(nèi)人形機器人仍將主要面向公共服務(wù)和工業(yè)應(yīng)用領(lǐng)域,真正進(jìn)入C端市場還需要10年左右的時間。此外,隨著人形機器人企業(yè)數(shù)量和產(chǎn)品的增加,市場已經(jīng)出現(xiàn)了同質(zhì)化的情況,未來3至5年會是行業(yè)淘汰期。
NBD:2024年EX機器人參加了很多展覽,從應(yīng)用場景及功能的角度看,和往年相比,機器人最大的區(qū)別是什么?
李博陽:今年展出的機器人更多突出了大模型的應(yīng)用,有的機器人是完全按照現(xiàn)實生活原型做的孿生,比如一款初中生形象的產(chǎn)品,就是“真人形象+角色模型”的產(chǎn)物,它的“人設(shè)”就是一名初中生;我們的智能客服機器人背后也有一個大模型在支撐,可以實現(xiàn)和機器人的問答類交互。在更新周期上,產(chǎn)品技術(shù)是不斷更新的,近期上新的兩款機器人主要是面向的市場不太一樣。
NBD:我們注意到,EX的人形機器人和市面常見的類型有些差別,更應(yīng)該稱為仿生機器人,面部表情高度類人,但不能實現(xiàn)雙足行走。請問您最初為什么會選擇這樣一個細(xì)分領(lǐng)域?
李博陽:其實這個領(lǐng)域也不能完全算是細(xì)分或小眾領(lǐng)域,很多影視作品和探索都認(rèn)為,這一類機器人(仿生)可能才是人形機器人的最終形態(tài)。原來的智能設(shè)備更多是以語音交互的方式實現(xiàn),但其實表情交互、肢體動作交互等方式是更符合人類交互的模式,會比純語音交互的智能設(shè)備多很多維度。
雙足行走的機器人,他們的移動能力或者說行走能力也是人類能力中的一種,但人類還有很多其他的能力,比如說話、觀察和感知周圍環(huán)境、手部操作、智能決策等,這些能力絕大多數(shù)都是在機器人的上半身來集成的,所以我們更多關(guān)注機器人的腰部以上。至于它的移動,未來在不同場景下我們會采用不同的移動方案,比如輪式、輪足,雙足也是其中的一個。
從前雙足機器人較為受外界關(guān)注,是因為很多高校和科研院所圍繞機器人的項目都是從雙足開始做起的,我們看到做雙足機器人的就會很多。但現(xiàn)在包括馬斯克也是投了大量的成本在人形機器人的上半身和靈巧手上。目前手部的動作是業(yè)內(nèi)最為關(guān)注的,然后是與人類的交互能力。
NBD:ChatGPT火起來之后,業(yè)界很多聲音認(rèn)為,人工智能會給人形機器人交互帶來極大進(jìn)展。就目前公司的實際情況來看,現(xiàn)在的交互是什么水平?現(xiàn)在人形機器人企業(yè)普遍是自研模型,還是用一些已經(jīng)開源的通用大模型?
李博陽:大模型其實對我們的幫助非常大。最開始打造產(chǎn)品的時候,我們就定位要做一個AI的硬件載體。一方面,人形機器人是很好的通用型人工智能硬件;另一方面,大模型本身又是一種通用型的AI,不斷生成的內(nèi)容可以通過機器人的形態(tài)來傳達(dá),變成它的表情、語言、動作,是一個很好的結(jié)合點。
GPT最新版本出來之后,我們有一個直觀的感受就是,它不那么生硬了,好像有情感了,這是我們在探索落地應(yīng)用時非常需要的。要做有情感的人工智能,做有“人設(shè)”的機器人,那每一個產(chǎn)品都應(yīng)該是有個性的,是不一樣的。在實現(xiàn)機器人感知世界的能力時,人形機器人與其他類型的設(shè)備肯定是不一樣的,需要它像人一樣有視覺、觸覺,甚至嗅覺、味覺等感知能力。希望我們的多模態(tài)大模型能夠把更類人的數(shù)據(jù)采集能力融合進(jìn)來,給出正確的反饋。
現(xiàn)在大部分人形機器人企業(yè)還是基于一些基礎(chǔ)大模型自己做定制性開發(fā),同時也在大模型的基礎(chǔ)上做自己的模型,如情緒大模型、適用于表情的一些小模型、針對具體應(yīng)用場景的系統(tǒng)等。我們也是這樣的路線,公司與華為、科大訊飛、中國移動等企業(yè)都是戰(zhàn)略合作伙伴關(guān)系。其實這些基礎(chǔ)大模型大家做得都很全面,也不斷地有大量的數(shù)據(jù)、很高的算力來支持,我們自身會做一些比較有特色的。比如基礎(chǔ)大模型可能更注重知識體系,我們會更注重交互體驗,會在情感、表情方面采集更多數(shù)據(jù)來訓(xùn)練,探索如何讓機器人的行為更像人。
NBD:您剛才提到正在考慮做面向C端的產(chǎn)品,請問有更詳細(xì)的面向C端的計劃嗎?
李博陽:我們現(xiàn)在還沒有完全面向C端消費的產(chǎn)品,有一款已經(jīng)量產(chǎn)的人形機器人,今年發(fā)布后有企業(yè)購買用于展廳、營業(yè)廳、智能前臺等場景了。這款機器人,現(xiàn)在的售價是稅后接近80萬元。
NBD:我們了解到,EX機器人的大部分產(chǎn)品沒有像很多機器人公司一樣直接出售,而是投放到了公司的線下科技館等場所。請您介紹下公司線下科技館的相關(guān)情況。
李博陽:我們線下的科技館,大連和沈陽是最先建的兩個,沈陽已經(jīng)不僅是一個科技館的形態(tài)了,已經(jīng)發(fā)展成了科技文商旅綜合體,既有科技館,又有一條以人形機器人為核心的智慧街區(qū),吃、喝、娛樂等所有業(yè)態(tài)均由機器人服務(wù)。
科技館的客流量確實非常大,特別是每到寒暑假孩子放假后,基本上街區(qū)都是滿員的狀態(tài),不少項目都是要排隊的。我們現(xiàn)在的線下落地場館已經(jīng)能實現(xiàn)很好的營收,預(yù)計在3至5年內(nèi)可以收回全部成本,快的話三年之內(nèi)就可以實現(xiàn)成本回收。
我們目前正在洽談線下文旅場館的城市已經(jīng)有20多個了,還制定了“百城百館”的計劃,希望未來國內(nèi)主要城市都能有線下場館出現(xiàn)。
NBD:單個線下場館大概會配備多少臺機器人?去年談到人形機器人成本的時候您曾提到,單臺人形機器人的成本約在300萬至500萬元,現(xiàn)在成本下降了嗎?如果下降了,是否與人工智能的引入有關(guān),還是某些配件價格下降了?
李博陽:我們每個線下場館通常會配置30至50臺機器人。成本方面,目前我們定制化的首臺機器人基本上可以在150萬元左右。其實現(xiàn)在這種機器人國外也有一些競品,基本上一臺機器人在300萬至500萬元。就我們目前的技術(shù)來說,可以在150萬元左右實現(xiàn)首臺產(chǎn)品的制造。如果是做同個產(chǎn)品的復(fù)制款,那價格就可以大幅下降到100萬元之內(nèi)。
價格下降的原因,首先在產(chǎn)品成熟的過程中很多模塊已經(jīng)定型了,生產(chǎn)研發(fā)的損耗降低了,減少了不斷試驗的過程。另外,我們的核心零部件已經(jīng)實現(xiàn)了自研自產(chǎn),尤其是電機部分,包括大型關(guān)節(jié)等。核心零部件完全自主可控后成本就大幅降低了。另外在算法的開發(fā)上,以前很多工作要自己進(jìn)行,基礎(chǔ)大模型出來后很多玩家都傾向于將已有的計算能力賦能給更多企業(yè),降低了使用門檻。
以華為為例,一個是算力,包括云端的算力,超算中心等;另外一方面還包括了邊緣側(cè)和終端側(cè)。我們現(xiàn)在正在做的就是把我們終端側(cè)的算力能力建立起來,讓每一個機器人自身就有計算能力和模型運行能力,從而大大提升交互速度。
NBD:除了線下文旅綜合體,公司還在嘗試哪些應(yīng)用場景?
李博陽:我們現(xiàn)在主要的市場在文旅場景,除此之外也在拓展教育、陪護(hù)這樣一些面向C端的應(yīng)用場景。比如我們的一款面向兒童及青少年的機器人,未來就可能會出現(xiàn)在智能教室成為孩子的伙伴,或是作為機器人老師和機器人“書童”出現(xiàn)。
另外一個比較受關(guān)注是可移動的家庭服務(wù)類機器人。這個機器人我們是把它和大模型做了結(jié)合,(機器人)可以通過視覺的方式來識別眼前發(fā)生的事情,再通過與用戶的自由交流來進(jìn)行情感交互。同時它還與智能家居和各種智能設(shè)備進(jìn)做了打通。我們希望未來(人形機器人)能夠?qū)崿F(xiàn)智能化的家庭服務(wù),可以在家庭空間內(nèi)實現(xiàn)一定的路徑規(guī)劃,成為面向C端、走進(jìn)家庭的產(chǎn)品。
NBD:現(xiàn)在很多觀點認(rèn)為,人形機器人到了“iPhone 時刻”,您是如何看待的?
李博陽:我覺得現(xiàn)在是到了示范項目逐漸落地的階段,所有廠商都在找應(yīng)用場景,也有很多企業(yè)還在實驗室階段,或是只有產(chǎn)品沒有應(yīng)用。我認(rèn)為未來3年之內(nèi)會有非常多的落地場景出現(xiàn);3年到 5年時間里,這些場景會更加明確并迎來一個小的爆發(fā)期。但我仍然覺得五年之內(nèi)人形機器人還是一個面向公共服務(wù)和工業(yè)應(yīng)用場景的產(chǎn)品,沒有到C端。真正到C端我覺得還要10年左右。
從競爭的角度看,這3到5年實際上是一個淘汰期。我們看到,近兩三年內(nèi)人形機器人企業(yè)大量出現(xiàn),有些是帶著場景來的,而有些企業(yè)還是以比較理想化的狀態(tài)進(jìn)入了這個行業(yè),認(rèn)為可以找到應(yīng)用場景,但其實還是比較難的。此外,我們也注意到有產(chǎn)品出現(xiàn)了同質(zhì)化的現(xiàn)象。可能細(xì)究技術(shù)路徑會不太一樣,但從現(xiàn)場和大家拍的宣傳片來看,做的事情幾乎都是一樣的。所以這里面誰能夠撐過這三年,誰能真的形成市場規(guī)模,我覺得是個考驗。
(實習(xí)生簡禹謙對此文亦有助益)
免責(zé)聲明:本文內(nèi)容與數(shù)據(jù)僅供參考,不構(gòu)成投資建議,使用前請核實。據(jù)此操作,風(fēng)險自擔(dān)。
封面圖片來源:每經(jīng)記者 楊卉 攝
如需轉(zhuǎn)載請與《每日經(jīng)濟(jì)新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP