每日經(jīng)濟(jì)新聞 2026-02-12 18:02:42
每經(jīng)編輯|蒙錦濤
2025年,可謂是AI智能體真正興起的一年。而2026年,或?qū)⒊蔀?/span>AI智能體大爆發(fā)的一年。在此背景下,“推理”仿佛成了各大芯片廠商關(guān)注的焦點(diǎn)。英偉達(dá)200億美元“收編”Grop,盡顯推理大時(shí)代對(duì)“效率價(jià)值”的重視。
國(guó)內(nèi)廠商方面,不少廠商推出推理專用算力芯片,甚至有廠商只專注于推理芯片。近日,這個(gè)領(lǐng)域的重磅玩家愛芯元智(0600.HK)登陸港交所,成為“中國(guó)邊緣AI芯片第一股”。
推理芯片可分為云端、邊緣側(cè)和端側(cè)三大類,邊緣側(cè)和端側(cè)為推理芯片重要組成部分。而愛芯元智則是國(guó)內(nèi)邊緣側(cè)、端側(cè)推理芯片的佼佼者。
在這場(chǎng)推理大時(shí)代,誰能提供性能、功耗和成本最優(yōu)解,誰就將掌握下一個(gè)時(shí)代的鑰匙。而愛芯元智,則已經(jīng)在邊緣、端側(cè)推理領(lǐng)域占據(jù)了領(lǐng)先身位。
推理大時(shí)代
雙軌驅(qū)動(dòng)構(gòu)建技術(shù)護(hù)城河
ChatGPT的橫空出世,開啟了人類的大模型時(shí)代,也開啟了算力芯片的大爆發(fā)。而隨著AI不斷發(fā)展、迭代,對(duì)算力芯片也提出了新的要求。
2025年,智能體和AI Skills成了新的熱點(diǎn)。如果說,大模型是人工智能的大腦,那智能體和AI Skills則給人工智能裝上了手和腳。不僅能夠“生成”,還能真正地幫助人類干活,成為生產(chǎn)力工具。
頭豹研究院認(rèn)為,盡管生成式AI本身已經(jīng)極大地提升了內(nèi)容生成的效率和質(zhì)量,但Agentic AI(代理型AI)作為其更高級(jí)的形態(tài),通過引入自主性、目標(biāo)導(dǎo)向和多步驟執(zhí)行能力,在生成式AI的基礎(chǔ)上創(chuàng)造了全新的、更深層次的價(jià)值。
而Agentic AI的盛行,讓AI行業(yè)的目光從訓(xùn)練轉(zhuǎn)向推理。如何搭建一個(gè)好用的智能體,如何讓人們使用智能體創(chuàng)造價(jià)值成為關(guān)鍵。
在此背景下,業(yè)界對(duì)AI芯片的需求并非一味地堆疊算力,好用、效率、低延時(shí)成為關(guān)鍵。另據(jù)頭豹研究院,依托小型模型能力躍升,執(zhí)行GPT-3.5級(jí)別的系統(tǒng)推理成本在2022年11月至2024年10月間驟降280多倍。硬件層面,年化成本降幅達(dá)30%,能效年提升率達(dá)40%。據(jù)悉,常規(guī)模型API輸出價(jià)格已經(jīng)降至10元百萬Tokens以下。甚至,已有廠商喊出百萬Tokens一分錢的口號(hào)。
因此,如何在有限的功耗和預(yù)算下釋放大模型的能力,成為決定AI普惠與否的關(guān)鍵瓶頸。面對(duì)邊緣終端設(shè)備在性能、功耗與成本上的“不可能三角”難題,愛芯元智通過底層架構(gòu)創(chuàng)新,構(gòu)建了堅(jiān)實(shí)的技術(shù)護(hù)城河。
公司的核心競(jìng)爭(zhēng)力源于其獨(dú)特的“雙軌開發(fā)模式”:一方面縱向迭代升級(jí)IP核技術(shù),另一方面橫向拓展應(yīng)用領(lǐng)域。這一模式的兩大技術(shù)支柱是公司自主研發(fā)的愛芯通元(AXNeutron)混合精度NPU(神經(jīng)網(wǎng)絡(luò)處理器)和愛芯智眸(AXProton)AI-ISP(人工智能圖像信號(hào)處理器)。
愛芯通元混合精度NPU是破解“不可能三角”的關(guān)鍵。傳統(tǒng)GPU方案雖通用,但在功耗和成本上難以適應(yīng)邊緣場(chǎng)景。愛芯元智的NPU采用多線程、異構(gòu)式多核設(shè)計(jì),將內(nèi)存與處理單元緊密集成,并通過兩大機(jī)制實(shí)現(xiàn)效率躍升:一是優(yōu)化神經(jīng)網(wǎng)絡(luò)計(jì)算以減少計(jì)算負(fù)荷,二是通過內(nèi)存層次設(shè)計(jì)最小化不必要的數(shù)據(jù)傳輸。
邊緣推理另一特性在于,不同應(yīng)用場(chǎng)景下對(duì)算力的需求千差萬別。而愛芯元智的優(yōu)勢(shì)在于,其NPU能根據(jù)不同的計(jì)算需求動(dòng)態(tài)選擇INT4、INT8、INT16等數(shù)值精度,對(duì)內(nèi)存密集型任務(wù)采用低精度,對(duì)精度敏感計(jì)算則保持高精度,在確保精度的同時(shí)顯著提升計(jì)算效率。
這一架構(gòu)創(chuàng)新帶來了驚人的能效比,根據(jù)灼識(shí)咨詢數(shù)據(jù),該NPU每瓦吞吐量比基于GPU架構(gòu)的傳統(tǒng)解決方案提升高達(dá)10倍。這一設(shè)計(jì)理念不僅確保穩(wěn)定的低延時(shí)表現(xiàn),更能在邊緣設(shè)備的功耗限制下高效運(yùn)行復(fù)雜AI模型。
深耕邊緣側(cè)、端側(cè)落地
未來空間廣闊
目前,“推理芯片未來增長(zhǎng)會(huì)大幅快于訓(xùn)練芯片”已成為各方共識(shí)。那么,推理芯片賽道內(nèi)部又將如何演繹呢?
根據(jù)愛芯元智招股書,全球AI推理芯片2024年至2030年的年復(fù)合增長(zhǎng)率預(yù)計(jì)為31.0%。其中,云端推理、邊緣推理和端側(cè)推理年復(fù)合增長(zhǎng)率預(yù)計(jì)分別為36.3%、42.2%和20.4%??梢钥闯?,未來邊緣推理發(fā)展空間極為廣闊。
至2030年,預(yù)測(cè)邊緣推理全球市場(chǎng)規(guī)模為7262億元,端側(cè)推理全球市場(chǎng)規(guī)模為8861億元。兩大市場(chǎng)規(guī)模合計(jì)超1.5萬億元。
邊緣AI推理芯片部署于靠近數(shù)據(jù)源的邊緣服務(wù)器、網(wǎng)關(guān)或基站,執(zhí)行實(shí)時(shí)本地推理,需要在高性能與功效之間保持謹(jǐn)慎平衡,以確保低延遲、數(shù)據(jù)安全及運(yùn)行穩(wěn)定性。端側(cè)AI推理芯片直接應(yīng)用于終端設(shè)備,例如智能手機(jī)等消費(fèi)電子產(chǎn)品、智能汽車及智能家電等。
愛芯元智深耕視覺AI端側(cè)推理多年。愛芯元智2024年以超900萬顆的出貨量排名前五,市場(chǎng)份額為6.8%。值得注意的是,其在中高端芯片細(xì)分市場(chǎng)以24.1%的份額高居榜首。隨著市場(chǎng)需求日益向中高端芯片傾斜,愛芯元智認(rèn)為其有能力在未來鞏固當(dāng)前的領(lǐng)先地位。
在國(guó)內(nèi)邊緣AI市場(chǎng),雖然當(dāng)下仍處于早期階段,但對(duì)數(shù)據(jù)安全和本地化處理日益增長(zhǎng)的需求預(yù)計(jì)將推動(dòng)市場(chǎng)快速擴(kuò)張。據(jù)悉,愛芯元智在這一新興領(lǐng)域出貨量位居第三,2024年出貨量達(dá)10萬顆,市場(chǎng)份額為12.2%。
智能汽車芯片方面,截至2025年9月30日,愛芯元智智能汽車SoC累計(jì)出貨量已超51萬顆,并獲得多家頭部車企及Tier 1的定點(diǎn)項(xiàng)目。
此外,愛芯元智自研的面向高階智能駕駛應(yīng)用的旗艦芯片產(chǎn)品M97已于近日回片并順利點(diǎn)亮。這顆芯片是公司智能汽車業(yè)務(wù)邁向高端化的核心產(chǎn)品,也是繼M55H、M76H、M57系列之后的全新一代智能汽車芯片,凝結(jié)了公司在芯片設(shè)計(jì)和研發(fā)領(lǐng)域的核心創(chuàng)新成果。
值得注意的是,AI芯片的使用不僅需要硬件能力,更考驗(yàn)軟硬件生態(tài)系統(tǒng)。算力上的領(lǐng)先,可能被競(jìng)爭(zhēng)對(duì)手追趕,但生態(tài)系統(tǒng)的構(gòu)建,將成為AI芯片廠商牢不可破的護(hù)城河。
據(jù)悉,通過提供從芯片到軟件工具鏈的完整解決方案,破局云端依賴,深耕邊緣側(cè)、端側(cè)應(yīng)用落地。公司的核心優(yōu)勢(shì)在于其提供了一套完整的以芯片為核心的“交鑰匙”方案。其自研的Pulsar2工具鏈,集成了模型轉(zhuǎn)換、量化與編譯等功能,能夠讓開發(fā)者高效地將主流AI模型部署在愛芯元智的SoC上。
展望未來,隨著AI大模型在邊緣側(cè)的應(yīng)用加速落地,以及智能輔助駕駛對(duì)合規(guī)與成本的更高要求,愛芯元智憑借其“高智價(jià)比”的平臺(tái)化能力和AI芯片及配套方案,有望在資本市場(chǎng)的助力下,進(jìn)一步鞏固其在AI感知與邊緣計(jì)算領(lǐng)域的護(hù)城河,并在重構(gòu)全球邊緣算力格局的進(jìn)程中釋放出巨大的長(zhǎng)期產(chǎn)業(yè)價(jià)值。
(文章內(nèi)容僅供參考,不構(gòu)成投資建議。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。)
編輯|蒙錦濤
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
半導(dǎo)體產(chǎn)業(yè)并購潮起:頭部企業(yè)瞄準(zhǔn)規(guī)模整合,“抓住快速增長(zhǎng)的機(jī)會(huì)”
?五年同城化筑基,成都都市圈從“先手棋”躍升“發(fā)展主引擎”
四川再添兩條氫能大通道 “一廊多路”氫能交通應(yīng)用體系加速落地
全國(guó)人大代表、四川省經(jīng)信廳廳長(zhǎng)翟剛:打造智能經(jīng)濟(jì)新形態(tài),加快推動(dòng)新興產(chǎn)業(yè)成為產(chǎn)業(yè)新支柱
深圳龍崗人機(jī)署回應(yīng)率先“吃龍蝦”:多智能體時(shí)代,誰跑通閉環(huán)誰就卡住身位
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP