2026-03-26 21:46:03
作為聚焦手術(shù)場(chǎng)景的專(zhuān)屬AI(人工智能)大模型,“術(shù)影”手術(shù)視頻大模型的核心定位是醫(yī)生的高級(jí)決策助手,并非替代醫(yī)生,而是為臨床手術(shù)增添“第三只眼睛”和“第二個(gè)大腦”。
每經(jīng)記者|甄素靜 每經(jīng)編輯|楊軍
“‘術(shù)影’手術(shù)視頻大模型是目前業(yè)內(nèi)規(guī)模最大、最完整的手術(shù)視頻通用智能底座。該數(shù)據(jù)集涵蓋約1500萬(wàn)幀、超3658小時(shí)的真實(shí)手術(shù)視頻?!?月24日,中國(guó)科學(xué)院香港創(chuàng)新研究院(以下簡(jiǎn)稱(chēng)香港創(chuàng)新研究院)人工智能與機(jī)器人創(chuàng)新中心(CAIR)在香港科學(xué)園深圳分園舉行了“術(shù)影”手術(shù)視頻大模型發(fā)布會(huì)。
在發(fā)布會(huì)上,香港創(chuàng)新研究院易東研究員介紹稱(chēng),基于上述海量數(shù)據(jù),“術(shù)影”手術(shù)視頻大模型突破傳統(tǒng)像素重建的局限,引入運(yùn)動(dòng)引導(dǎo)的隱空間預(yù)測(cè)機(jī)制,顯著提升了模型對(duì)手術(shù)器械、解剖結(jié)構(gòu)、交互動(dòng)作等關(guān)鍵語(yǔ)義結(jié)構(gòu)的理解能力,為多中心、多科室、多術(shù)式的通用手術(shù)智能奠定了基礎(chǔ)。
作為聚焦手術(shù)場(chǎng)景的專(zhuān)屬AI(人工智能)大模型,“術(shù)影”手術(shù)視頻大模型的核心定位是醫(yī)生的高級(jí)決策助手,并非替代醫(yī)生,而是為臨床手術(shù)增添“第三只眼睛”和“第二個(gè)大腦”。
中山大學(xué)附屬第一醫(yī)院呼吸與危重癥醫(yī)學(xué)科副主任廖槐結(jié)合臨床工作實(shí)際情況指出,手術(shù)的難點(diǎn)往往不在操作技巧,而在決策能力。醫(yī)生碰到術(shù)中情況需要隨時(shí)調(diào)整策略,這種決策能力培養(yǎng)周期很長(zhǎng)?!靶g(shù)影”手術(shù)視頻大模型集成了海量數(shù)據(jù),可提供更好的決策依據(jù)。另外,高風(fēng)險(xiǎn)手術(shù)步驟不能出錯(cuò),AI可像“高級(jí)助手”一樣提醒流程,幫助團(tuán)隊(duì)協(xié)同,減少溝通誤差。它不替代醫(yī)生,而是輔助決策。
據(jù)易東介紹,“術(shù)影”手術(shù)視頻大模型支持13種人類(lèi)主要器官,并能處理6大類(lèi)手術(shù)理解任務(wù),包括工作流理解、動(dòng)作理解、深度估計(jì)、息肉分割、三元組識(shí)別和技能評(píng)估。在手術(shù)流程識(shí)別、器械交互理解、精細(xì)動(dòng)作建模等核心任務(wù)上,該模型大幅超越現(xiàn)有方法,展現(xiàn)出極強(qiáng)的泛化能力與精度。
中國(guó)科學(xué)院香港創(chuàng)新研究院人工智能與機(jī)器人創(chuàng)新中心主任劉宏斌介紹稱(chēng),在臨床能力上,該模型已實(shí)現(xiàn)標(biāo)準(zhǔn)化手術(shù)場(chǎng)景下病灶部位識(shí)別準(zhǔn)確率95%以上、病變性質(zhì)判斷準(zhǔn)確率90%以上,可自動(dòng)提煉4級(jí)手術(shù)關(guān)鍵步驟、生成結(jié)構(gòu)化手術(shù)報(bào)告,單一專(zhuān)業(yè)任務(wù)能力達(dá)到高年級(jí)醫(yī)學(xué)生水平,能在術(shù)中提供視覺(jué)輔助、步驟提示與決策依據(jù),還可充當(dāng)手術(shù)團(tuán)隊(duì)“指揮家”,協(xié)調(diào)操作流程、減少信息傳遞誤差,有效提升手術(shù)安全與效率。
香港大學(xué)深圳醫(yī)院神經(jīng)醫(yī)學(xué)中心名譽(yù)顧問(wèn)醫(yī)師潘偉生表示,香港大學(xué)深圳醫(yī)院作為神經(jīng)外科專(zhuān)科培訓(xùn)基地,一直致力于解決復(fù)雜手術(shù)教學(xué)中傳統(tǒng)“師帶徒”模式的標(biāo)準(zhǔn)化難題。憑借精準(zhǔn)的動(dòng)作解析與客觀的評(píng)估能力,該系統(tǒng)未來(lái)將成為可靠的教學(xué)輔助工具,幫助年輕醫(yī)生進(jìn)行規(guī)范化的手術(shù)復(fù)盤(pán),極大推動(dòng)專(zhuān)科培訓(xùn)的數(shù)字化與標(biāo)準(zhǔn)化發(fā)展。
《每日經(jīng)濟(jì)新聞》記者注意到,在發(fā)布推介環(huán)節(jié),易東還宣布10億參數(shù)量的“術(shù)影”手術(shù)視頻大模型全面開(kāi)源。
他表示,“術(shù)影”手術(shù)視頻大模型基本遵循主流開(kāi)源協(xié)議,既可商用也可用于科研,但使用者需標(biāo)注出處。
據(jù)透露,該模型訓(xùn)練數(shù)據(jù)中約75%為私有數(shù)據(jù),公開(kāi)數(shù)據(jù)部分將公布列表,私有數(shù)據(jù)的開(kāi)放仍在流程推進(jìn)中。
“我們希望通過(guò)開(kāi)源把社區(qū)建起來(lái),企業(yè)可以用,醫(yī)院可以用,大學(xué)也可以用。只有更多人參與進(jìn)來(lái),技術(shù)迭代和數(shù)據(jù)共享才會(huì)更快?!币讝|說(shuō)。
就未來(lái)商業(yè)化與落地方面,劉宏斌回應(yīng)稱(chēng),“術(shù)影”手術(shù)視頻大模型現(xiàn)階段將優(yōu)先聯(lián)合產(chǎn)業(yè)伙伴推進(jìn)臨床落地,由合作企業(yè)結(jié)合自身實(shí)際探索多元化商業(yè)模式。其核心商業(yè)化路徑將圍繞開(kāi)源生態(tài)構(gòu)建展開(kāi),通過(guò)吸引全行業(yè)參與,加速技術(shù)迭代與數(shù)據(jù)共享,先在三甲醫(yī)院開(kāi)展臨床試點(diǎn),再逐步向地市、縣級(jí)基層醫(yī)院下沉,通過(guò) “數(shù)字分身” 將頂級(jí)專(zhuān)家的手術(shù)經(jīng)驗(yàn)普及到基層,最終實(shí)現(xiàn)技術(shù)規(guī)模化普惠。
在應(yīng)用場(chǎng)景上,劉宏斌指出,“術(shù)影”手術(shù)視頻大模型現(xiàn)階段將重點(diǎn)落地外科教學(xué)、手術(shù)質(zhì)控與術(shù)中指導(dǎo)、基層醫(yī)療賦能三大領(lǐng)域,以標(biāo)準(zhǔn)化手術(shù)操作提升臨床教學(xué)效率,以實(shí)時(shí)監(jiān)控操作規(guī)范并輔助疑難病例決策,緩解優(yōu)質(zhì)醫(yī)療資源分布不均問(wèn)題。未來(lái)還將向具身智能手術(shù)機(jī)器人領(lǐng)域延伸,實(shí)現(xiàn)更深度的人機(jī)協(xié)作。
封面圖片來(lái)源:每經(jīng)媒資庫(kù)
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP