2026-02-04 21:42:52
2月2日,面壁智能兩位聯(lián)合創(chuàng)始人受訪時(shí)表示,傳統(tǒng)人機(jī)交互在AI進(jìn)入物理世界時(shí)暴露缺陷,全模態(tài)模型或成具身大腦。目前,端側(cè)模型與AI硬件結(jié)合復(fù)雜,手機(jī)交互受功耗、隱私等約束,汽車(chē)機(jī)器人等場(chǎng)景更具潛力。面壁智能定位為“做大模型的光刻機(jī)”,強(qiáng)調(diào)持續(xù)開(kāi)發(fā)能力。劉知遠(yuǎn)認(rèn)為,未來(lái)一兩年模型專(zhuān)業(yè)與交互能力有望爆發(fā),五到十年將出現(xiàn)多智能體協(xié)同。
每經(jīng)記者|可楊 每經(jīng)編輯|陳旭
當(dāng)人工智能開(kāi)始從屏幕走向現(xiàn)實(shí)世界,人機(jī)交互正經(jīng)歷一次升級(jí)時(shí)刻。
無(wú)論是手機(jī)、汽車(chē),還是正在加速落地的機(jī)器人與可穿戴設(shè)備,過(guò)往以你問(wèn)我答為核心的回合制交互,正逐漸暴露出響應(yīng)遲緩、感知割裂、上下文中斷等問(wèn)題。這種交互方式的先天缺陷,正在成為AI進(jìn)入物理世界的關(guān)鍵瓶頸。
2月2日,面壁智能聯(lián)合創(chuàng)始人兼CEO李大海接受包括《每日經(jīng)濟(jì)新聞》記者在內(nèi)的媒體采訪時(shí)表示,新一代人機(jī)交互的方向已經(jīng)出現(xiàn)曙光,但真正的躍遷不會(huì)一蹴而就,而是伴隨著云端與端側(cè)模型能力的持續(xù)提升逐步發(fā)生。在這一過(guò)程中,全模態(tài)模型是否能夠成為連接數(shù)字智能與物理世界的具身大腦,正在成為產(chǎn)業(yè)關(guān)注的核心問(wèn)題。

圖片來(lái)源:面壁智能
隨著AI開(kāi)始進(jìn)入物理世界,當(dāng)其驅(qū)動(dòng)機(jī)器人或可穿戴設(shè)備時(shí),傳統(tǒng)的人機(jī)交互模式開(kāi)始顯現(xiàn)弊端。
清華大學(xué)計(jì)算機(jī)系長(zhǎng)聘教授、面壁智能聯(lián)合創(chuàng)始人兼首席科學(xué)家劉知遠(yuǎn)認(rèn)為,對(duì)人類(lèi)而言,聽(tīng)、說(shuō)、看本身是多通道并行的,人可以在說(shuō)話的同時(shí)繼續(xù)聽(tīng)、繼續(xù)看,這些過(guò)程并不會(huì)彼此阻礙。但在人機(jī)交互層面,此前的大多數(shù)模型都很難具備這種能力,“一旦你開(kāi)始說(shuō),就沒(méi)有辦法看了,有這樣那樣的問(wèn)題?!?/p>
這種交互方式的缺陷,限制了AI走向具身智能的深度。在劉知遠(yuǎn)看來(lái),擬人化、高度自然的交互能力,是讓機(jī)器人、智能終端更像人的關(guān)鍵一步。“它(全模態(tài)模型)和讓我們未來(lái)的機(jī)器人、智能終端能夠像人一樣去進(jìn)行自然交互,可能離得更近?!?/p>
依照這一判斷,具身智能并不是一個(gè)獨(dú)立分支,而是對(duì)模型交互能力提出了更高要求的應(yīng)用場(chǎng)景。劉知遠(yuǎn)強(qiáng)調(diào),在具身、智能終端等場(chǎng)景中,其實(shí)同樣需要類(lèi)似的模型,才可能讓它更好地服務(wù)人類(lèi)。劉知遠(yuǎn)在采訪中判斷,具身智能在能力層面的快速迭代,可能并不遙遠(yuǎn)?!叭绻f(shuō)還有多久,我估計(jì)可能也就是這兩三年時(shí)間?!?/p>
落到產(chǎn)業(yè)層面,端側(cè)模型與AI硬件的結(jié)合,正在成為一個(gè)現(xiàn)實(shí)而復(fù)雜的命題。
在李大??磥?lái),隨著大廠下場(chǎng)、智能體進(jìn)入手機(jī)等終端形態(tài),新一代人機(jī)交互的形態(tài)已經(jīng)看到曙光,但這也并不意味著拐點(diǎn)已經(jīng)到來(lái)。他判斷,這一躍遷不會(huì)是一次性完成的,“大家會(huì)在這個(gè)方向上不斷地探索,這個(gè)要伴隨著云端模型和端側(cè)模型的持續(xù)提升?!?/p>
即便在當(dāng)前被廣泛討論的手機(jī)場(chǎng)景中,技術(shù)本身仍存在明顯約束。李大海表示,像豆包手機(jī)背后依托的是目前行業(yè)里最優(yōu)秀的模型之一,但它對(duì)人類(lèi)復(fù)雜任務(wù)的完成率其實(shí)也沒(méi)有完全達(dá)到可用的理想狀態(tài)。
李大海進(jìn)一步分析稱(chēng),一方面,純?cè)贫朔桨鸽y以繞開(kāi)隱私問(wèn)題;另一方面,端側(cè)資源的算力等消耗,使得全模態(tài)能力在手機(jī)上的落地需要更長(zhǎng)時(shí)間。李大海直言,模態(tài)越多,資源消耗越大,這決定了不同終端形態(tài)的節(jié)奏差異。
手機(jī)目前的交互仍主要以語(yǔ)音和觸控為主,模態(tài)相對(duì)受限。李大海介紹,以豆包手機(jī)為例,其核心突破是讓智能體可以像人一樣操作手機(jī),代替用戶(hù)完成復(fù)雜任務(wù),這相當(dāng)于解決了像人一樣輸出的問(wèn)題。而下一個(gè)重要的演進(jìn)方向,則在于輸入方式的變革。
“目前手機(jī)與人的上下文同步,依賴(lài)人在屏幕上的主動(dòng)操作。如果未來(lái)手機(jī)能直接聆聽(tīng)、觀看真實(shí)世界,它就能更好地與主人同步、共享上下文?!崩畲蠛UJ(rèn)為,這是手機(jī)邁向真正智能體的關(guān)鍵一步,但也將直面功耗與隱私保護(hù)的雙重挑戰(zhàn),對(duì)產(chǎn)品設(shè)計(jì)提出了更高要求。
相比之下,汽車(chē)、機(jī)器人等場(chǎng)景,由于資源條件更寬松,也被李大海認(rèn)為是全模態(tài)模型更具潛力的落地方向。而在具身智能領(lǐng)域,他認(rèn)為,當(dāng)前的瓶頸不在本體,而在大腦,一旦模型能力出現(xiàn)突破性進(jìn)展,具身智能很可能迎來(lái)類(lèi)似“ChatGPT時(shí)刻”的躍遷。
在這種判斷下,面壁智能對(duì)自身的定位并不著重關(guān)注某一個(gè)產(chǎn)品或硬件形態(tài),而在于是否能夠持續(xù)產(chǎn)出高質(zhì)量模型。
在AI領(lǐng)域,Scaling Law(規(guī)模定律)曾是公認(rèn)的鐵律,但關(guān)于其是否會(huì)碰壁的爭(zhēng)論從未停止。面壁智能曾經(jīng)提出另一個(gè)視角:Densing Law(密度法則),即大模型的保鮮期極短,能力密度每100天左右提升一倍。這意味著,重要的不是開(kāi)發(fā)出一個(gè)優(yōu)秀的模型,而是具備持續(xù)開(kāi)發(fā)優(yōu)秀模型的能力。
面壁智能將自己定位為“做大模型的光刻機(jī)”。李大海解釋說(shuō),這個(gè)光刻機(jī)指的是不斷訓(xùn)練出更高能力密度的大模型。
劉知遠(yuǎn)補(bǔ)充表示,密度法則的邏輯與芯片行業(yè)相類(lèi)似:大模型未來(lái)的趨勢(shì)是尺寸越來(lái)越小、密度越來(lái)越高。進(jìn)而極致地降低模型成本,同時(shí)用更小的尺寸讓其更有可能在距離用戶(hù)更近的終端上運(yùn)行。
李大海強(qiáng)調(diào),端側(cè)模型的商業(yè)化,本身也是能力驗(yàn)證和數(shù)據(jù)飛輪的一部分。單純依靠商業(yè)化的路徑銷(xiāo)售模型,來(lái)實(shí)現(xiàn)將模型部署到百億臺(tái)設(shè)備的目標(biāo)可能比較困難,更現(xiàn)實(shí)的路徑是通過(guò)生態(tài)和開(kāi)發(fā)者,共同推進(jìn)這一過(guò)程。
關(guān)于與大廠之間的競(jìng)爭(zhēng),在李大??磥?lái),創(chuàng)業(yè)公司的機(jī)會(huì)并未因?yàn)榇髲S入場(chǎng)而消失。AI仍然是一個(gè)產(chǎn)業(yè)級(jí)機(jī)會(huì),創(chuàng)業(yè)公司面臨的考驗(yàn)是,選擇在一個(gè)非常廣闊的賽道上占領(lǐng)比較小的份額,還是在比較小的市場(chǎng)去爭(zhēng)取頭部,“我相信還有很大的空間給大家去發(fā)揮。”
對(duì)于未來(lái)的技術(shù)趨勢(shì),劉知遠(yuǎn)提出了兩大主旋律:一是智能能力的持續(xù)增強(qiáng);二是智能的使用持續(xù)高效。他認(rèn)為,接下來(lái)一兩年,行業(yè)將快速見(jiàn)證模型專(zhuān)業(yè)能力越來(lái)越強(qiáng),以及與世界交互能力的爆發(fā)?!八ㄖ改P停┳鳛橐粋€(gè)智能體,具備了更強(qiáng)的自主學(xué)習(xí)能力,這是接下來(lái)一兩年非常重要的發(fā)展趨勢(shì)。當(dāng)它具備了自主探索、學(xué)習(xí)成長(zhǎng)的能力之后,再下一步的突破,其實(shí)就是多智能體的協(xié)同?!?/p>
劉知遠(yuǎn)表示,在未來(lái)的五到十年,全球一定會(huì)進(jìn)入多智能體互聯(lián)互通、高度協(xié)作,并涌現(xiàn)出群體智能的狀態(tài)。
封面圖片來(lái)源:受訪公司提供
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP