要聞

突破就在這兩三年！面壁智能聯(lián)合創(chuàng)始人李大海：新一代人機(jī)交互方向已現(xiàn)曙光

2026-02-04 21:42:52

2月2日，面壁智能兩位聯(lián)合創(chuàng)始人受訪時(shí)表示，傳統(tǒng)人機(jī)交互在AI進(jìn)入物理世界時(shí)暴露缺陷，全模態(tài)模型或成具身大腦。目前，端側(cè)模型與AI硬件結(jié)合復(fù)雜，手機(jī)交互受功耗、隱私等約束，汽車(chē)機(jī)器人等場(chǎng)景更具潛力。面壁智能定位為“做大模型的光刻機(jī)”，強(qiáng)調(diào)持續(xù)開(kāi)發(fā)能力。劉知遠(yuǎn)認(rèn)為，未來(lái)一兩年模型專(zhuān)業(yè)與交互能力有望爆發(fā)，五到十年將出現(xiàn)多智能體協(xié)同。

每經(jīng)記者｜可楊每經(jīng)編輯｜陳旭

當(dāng)人工智能開(kāi)始從屏幕走向現(xiàn)實(shí)世界，人機(jī)交互正經(jīng)歷一次升級(jí)時(shí)刻。

無(wú)論是手機(jī)、汽車(chē)，還是正在加速落地的機(jī)器人與可穿戴設(shè)備，過(guò)往以你問(wèn)我答為核心的回合制交互，正逐漸暴露出響應(yīng)遲緩、感知割裂、上下文中斷等問(wèn)題。這種交互方式的先天缺陷，正在成為AI進(jìn)入物理世界的關(guān)鍵瓶頸。

2月2日，面壁智能聯(lián)合創(chuàng)始人兼CEO李大海接受包括《每日經(jīng)濟(jì)新聞》記者在內(nèi)的媒體采訪時(shí)表示，新一代人機(jī)交互的方向已經(jīng)出現(xiàn)曙光，但真正的躍遷不會(huì)一蹴而就，而是伴隨著云端與端側(cè)模型能力的持續(xù)提升逐步發(fā)生。在這一過(guò)程中，全模態(tài)模型是否能夠成為連接數(shù)字智能與物理世界的具身大腦，正在成為產(chǎn)業(yè)關(guān)注的核心問(wèn)題。

圖片來(lái)源：面壁智能

全模態(tài)不是功能疊加，而是交互范式變化

隨著AI開(kāi)始進(jìn)入物理世界，當(dāng)其驅(qū)動(dòng)機(jī)器人或可穿戴設(shè)備時(shí)，傳統(tǒng)的人機(jī)交互模式開(kāi)始顯現(xiàn)弊端。

清華大學(xué)計(jì)算機(jī)系長(zhǎng)聘教授、面壁智能聯(lián)合創(chuàng)始人兼首席科學(xué)家劉知遠(yuǎn)認(rèn)為，對(duì)人類(lèi)而言，聽(tīng)、說(shuō)、看本身是多通道并行的，人可以在說(shuō)話的同時(shí)繼續(xù)聽(tīng)、繼續(xù)看，這些過(guò)程并不會(huì)彼此阻礙。但在人機(jī)交互層面，此前的大多數(shù)模型都很難具備這種能力，“一旦你開(kāi)始說(shuō)，就沒(méi)有辦法看了，有這樣那樣的問(wèn)題?！?/p>

這種交互方式的缺陷，限制了AI走向具身智能的深度。在劉知遠(yuǎn)看來(lái)，擬人化、高度自然的交互能力，是讓機(jī)器人、智能終端更像人的關(guān)鍵一步。“它（全模態(tài)模型）和讓我們未來(lái)的機(jī)器人、智能終端能夠像人一樣去進(jìn)行自然交互，可能離得更近?！?/p>

依照這一判斷，具身智能并不是一個(gè)獨(dú)立分支，而是對(duì)模型交互能力提出了更高要求的應(yīng)用場(chǎng)景。劉知遠(yuǎn)強(qiáng)調(diào)，在具身、智能終端等場(chǎng)景中，其實(shí)同樣需要類(lèi)似的模型，才可能讓它更好地服務(wù)人類(lèi)。劉知遠(yuǎn)在采訪中判斷，具身智能在能力層面的快速迭代，可能并不遙遠(yuǎn)?！叭绻f(shuō)還有多久，我估計(jì)可能也就是這兩三年時(shí)間?！?/p>

落到產(chǎn)業(yè)層面，端側(cè)模型與AI硬件的結(jié)合，正在成為一個(gè)現(xiàn)實(shí)而復(fù)雜的命題。

在李大?？磥?lái)，隨著大廠下場(chǎng)、智能體進(jìn)入手機(jī)等終端形態(tài)，新一代人機(jī)交互的形態(tài)已經(jīng)看到曙光，但這也并不意味著拐點(diǎn)已經(jīng)到來(lái)。他判斷，這一躍遷不會(huì)是一次性完成的，“大家會(huì)在這個(gè)方向上不斷地探索，這個(gè)要伴隨著云端模型和端側(cè)模型的持續(xù)提升?！?/p>

即便在當(dāng)前被廣泛討論的手機(jī)場(chǎng)景中，技術(shù)本身仍存在明顯約束。李大海表示，像豆包手機(jī)背后依托的是目前行業(yè)里最優(yōu)秀的模型之一，但它對(duì)人類(lèi)復(fù)雜任務(wù)的完成率其實(shí)也沒(méi)有完全達(dá)到可用的理想狀態(tài)。

李大海進(jìn)一步分析稱(chēng)，一方面，純?cè)贫朔桨鸽y以繞開(kāi)隱私問(wèn)題；另一方面，端側(cè)資源的算力等消耗，使得全模態(tài)能力在手機(jī)上的落地需要更長(zhǎng)時(shí)間。李大海直言，模態(tài)越多，資源消耗越大，這決定了不同終端形態(tài)的節(jié)奏差異。

手機(jī)目前的交互仍主要以語(yǔ)音和觸控為主，模態(tài)相對(duì)受限。李大海介紹，以豆包手機(jī)為例，其核心突破是讓智能體可以像人一樣操作手機(jī)，代替用戶(hù)完成復(fù)雜任務(wù)，這相當(dāng)于解決了像人一樣輸出的問(wèn)題。而下一個(gè)重要的演進(jìn)方向，則在于輸入方式的變革。

“目前手機(jī)與人的上下文同步，依賴(lài)人在屏幕上的主動(dòng)操作。如果未來(lái)手機(jī)能直接聆聽(tīng)、觀看真實(shí)世界，它就能更好地與主人同步、共享上下文?！崩畲蠛ＵJ(rèn)為，這是手機(jī)邁向真正智能體的關(guān)鍵一步，但也將直面功耗與隱私保護(hù)的雙重挑戰(zhàn)，對(duì)產(chǎn)品設(shè)計(jì)提出了更高要求。

相比之下，汽車(chē)、機(jī)器人等場(chǎng)景，由于資源條件更寬松，也被李大海認(rèn)為是全模態(tài)模型更具潛力的落地方向。而在具身智能領(lǐng)域，他認(rèn)為，當(dāng)前的瓶頸不在本體，而在大腦，一旦模型能力出現(xiàn)突破性進(jìn)展，具身智能很可能迎來(lái)類(lèi)似“ChatGPT時(shí)刻”的躍遷。

行業(yè)將快速見(jiàn)證模型專(zhuān)業(yè)能力與交互能力爆發(fā)

在這種判斷下，面壁智能對(duì)自身的定位并不著重關(guān)注某一個(gè)產(chǎn)品或硬件形態(tài)，而在于是否能夠持續(xù)產(chǎn)出高質(zhì)量模型。

在AI領(lǐng)域，Scaling Law（規(guī)模定律）曾是公認(rèn)的鐵律，但關(guān)于其是否會(huì)碰壁的爭(zhēng)論從未停止。面壁智能曾經(jīng)提出另一個(gè)視角：Densing Law（密度法則），即大模型的保鮮期極短，能力密度每100天左右提升一倍。這意味著，重要的不是開(kāi)發(fā)出一個(gè)優(yōu)秀的模型，而是具備持續(xù)開(kāi)發(fā)優(yōu)秀模型的能力。

面壁智能將自己定位為“做大模型的光刻機(jī)”。李大海解釋說(shuō)，這個(gè)光刻機(jī)指的是不斷訓(xùn)練出更高能力密度的大模型。

劉知遠(yuǎn)補(bǔ)充表示，密度法則的邏輯與芯片行業(yè)相類(lèi)似：大模型未來(lái)的趨勢(shì)是尺寸越來(lái)越小、密度越來(lái)越高。進(jìn)而極致地降低模型成本，同時(shí)用更小的尺寸讓其更有可能在距離用戶(hù)更近的終端上運(yùn)行。

李大海強(qiáng)調(diào)，端側(cè)模型的商業(yè)化，本身也是能力驗(yàn)證和數(shù)據(jù)飛輪的一部分。單純依靠商業(yè)化的路徑銷(xiāo)售模型，來(lái)實(shí)現(xiàn)將模型部署到百億臺(tái)設(shè)備的目標(biāo)可能比較困難，更現(xiàn)實(shí)的路徑是通過(guò)生態(tài)和開(kāi)發(fā)者，共同推進(jìn)這一過(guò)程。

關(guān)于與大廠之間的競(jìng)爭(zhēng)，在李大?？磥?lái)，創(chuàng)業(yè)公司的機(jī)會(huì)并未因?yàn)榇髲S入場(chǎng)而消失。AI仍然是一個(gè)產(chǎn)業(yè)級(jí)機(jī)會(huì)，創(chuàng)業(yè)公司面臨的考驗(yàn)是，選擇在一個(gè)非常廣闊的賽道上占領(lǐng)比較小的份額，還是在比較小的市場(chǎng)去爭(zhēng)取頭部，“我相信還有很大的空間給大家去發(fā)揮。”

對(duì)于未來(lái)的技術(shù)趨勢(shì)，劉知遠(yuǎn)提出了兩大主旋律：一是智能能力的持續(xù)增強(qiáng)；二是智能的使用持續(xù)高效。他認(rèn)為，接下來(lái)一兩年，行業(yè)將快速見(jiàn)證模型專(zhuān)業(yè)能力越來(lái)越強(qiáng)，以及與世界交互能力的爆發(fā)?！八ㄖ改Ｐ停┳鳛橐粋€(gè)智能體，具備了更強(qiáng)的自主學(xué)習(xí)能力，這是接下來(lái)一兩年非常重要的發(fā)展趨勢(shì)。當(dāng)它具備了自主探索、學(xué)習(xí)成長(zhǎng)的能力之后，再下一步的突破，其實(shí)就是多智能體的協(xié)同?！?/p>

劉知遠(yuǎn)表示，在未來(lái)的五到十年，全球一定會(huì)進(jìn)入多智能體互聯(lián)互通、高度協(xié)作，并涌現(xiàn)出群體智能的狀態(tài)。

封面圖片來(lái)源：受訪公司提供

如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán)，嚴(yán)禁轉(zhuǎn)載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站，可聯(lián)系我們要求撤下您的作品。

上一篇文章

商業(yè)航天概念股福光股份遭 “用腳投票” 福建國(guó)資二股東擬最高減持3%股份

返回每經(jīng)網(wǎng)首頁(yè)

下一篇文章

晶科能源：經(jīng)核實(shí)公司未與馬斯克團(tuán)隊(duì)開(kāi)展任何合作亦未簽署任何框架性協(xié)議或正式協(xié)議

相關(guān)文章