在全球AI技術(shù)競(jìng)賽日益激烈的今天,中國(guó)AI企業(yè)正在用實(shí)力證明自己的技術(shù)深度。近日, 在2025第三屆全國(guó)人工智能應(yīng)用場(chǎng)景創(chuàng)新挑戰(zhàn)賽(CICAS)姑蘇專項(xiàng)晉級(jí)賽中,明略科技(2718.HK)聯(lián)合北京大學(xué)的參賽項(xiàng)目《基于多模態(tài)大模型的品牌出海創(chuàng)意生成與情感鏈接智能平臺(tái)》從70余個(gè)參賽團(tuán)隊(duì)中脫穎而出,斬獲“特等獎(jiǎng)”殊榮,成功晉級(jí)全國(guó)總決賽。
全國(guó)人工智能應(yīng)用場(chǎng)景創(chuàng)新挑戰(zhàn)賽(CICAS)是在科學(xué)技術(shù)部戰(zhàn)略規(guī)劃司指導(dǎo)支持下,由中國(guó)人工智能學(xué)會(huì)與科技部新一代人工智能發(fā)展研究中心聯(lián)合主辦的綜合性年度賽事。自2023年辦賽以來(lái),共吸引4800余個(gè)國(guó)內(nèi)外優(yōu)秀科技人才團(tuán)隊(duì)和優(yōu)質(zhì)創(chuàng)新創(chuàng)業(yè)項(xiàng)目參與,目前已成為推動(dòng)AI與實(shí)體經(jīng)濟(jì)深度融合的重要平臺(tái)。
在此次比賽中,明略科技自研的Mano靈巧手和HMLLM(超圖多模態(tài)大語(yǔ)言模型)兩大核心技術(shù),分別在"數(shù)據(jù)獲取"和"主觀分析"領(lǐng)域?qū)崿F(xiàn)突破,獲得權(quán)威認(rèn)可。
明略科技Mano靈巧手在國(guó)際權(quán)威評(píng)估基準(zhǔn)OS-World榜單上,以54.0%的任務(wù)成功率刷新紀(jì)錄,在專有模型賽道排名第一,總榜僅次于Anthropic最新發(fā)布的Claude-Sonnet-4.5,位居第二。這一成績(jī)意味著,明略科技自研的72B參數(shù)大模型,在與Claude等國(guó)際頂尖大模型的同臺(tái)競(jìng)技中取得了領(lǐng)先。
OS-World是業(yè)界公認(rèn)的GUI(圖形用戶界面)智能體評(píng)估基準(zhǔn),測(cè)試模型在真實(shí)操作系統(tǒng)環(huán)境中完成復(fù)雜任務(wù)的能力。能夠在這一榜單上取得第二名的成績(jī),充分證明了Mano在"操作智能"領(lǐng)域的技術(shù)實(shí)力。
與此同時(shí),HMLLM超圖多模態(tài)大語(yǔ)言模型在ACM MM2024 (ACM Multimedia,CCF-A類國(guó)際頂級(jí)會(huì)議)上獲得最佳論文提名,提名率僅2%。ACM MM是多媒體領(lǐng)域的頂級(jí)學(xué)術(shù)會(huì)議,能夠獲得最佳論文提名,代表了國(guó)際學(xué)術(shù)界對(duì)HMLLM創(chuàng)新性的高度認(rèn)可。
Mano和HMLLM兩項(xiàng)技術(shù)的突破,不是孤立的。它們共同構(gòu)成了從數(shù)據(jù)獲取到主觀分析的完整閉環(huán),這是明略科技技術(shù)體系的核心競(jìng)爭(zhēng)力。
Mano靈巧手:從理解到操作的跨越
Mano靈巧手的創(chuàng)新,在于它突破了傳統(tǒng)大模型"只能對(duì)話不能操作"的局限。
傳統(tǒng)大模型擅長(zhǎng)理解和生成文本,但在實(shí)際操作層面存在明顯短板。比如,當(dāng)你要求大模型"幫我從這個(gè)網(wǎng)站采集數(shù)據(jù)"時(shí),它可以告訴你應(yīng)該怎么做,但無(wú)法真正去操作瀏覽器、點(diǎn)擊按鈕、填寫(xiě)表單、提取數(shù)據(jù)。Mano的突破,正是實(shí)現(xiàn)了從"理解"到"行動(dòng)"的跨越。
Mano具備四大核心能力:
第一,視覺(jué)理解能力。Mano能夠像人一樣"看"屏幕,精準(zhǔn)識(shí)別任何軟件界面元素——按鈕、輸入框、下拉菜單、圖標(biāo)等。這種視覺(jué)理解能力,使得Mano可以在多種瀏覽器環(huán)境中運(yùn)行,無(wú)需針對(duì)特定系統(tǒng)進(jìn)行改造。
第二,自動(dòng)化任務(wù)拆解能力。當(dāng)接到一個(gè)復(fù)雜任務(wù)時(shí),Mano能夠智能拆解為多個(gè)子任務(wù),并按照邏輯順序執(zhí)行。比如"采集某網(wǎng)站的產(chǎn)品信息",Mano會(huì)自動(dòng)拆解為:打開(kāi)網(wǎng)站→搜索產(chǎn)品→點(diǎn)擊詳情頁(yè)→提取信息→保存數(shù)據(jù)等步驟。
第三,高性能代碼生成能力。Mano實(shí)現(xiàn)了高HTML壓縮率和代碼生成成功率,支持動(dòng)態(tài)、靜態(tài)和SPA(單頁(yè)應(yīng)用)等主流網(wǎng)頁(yè)類型。這意味著,無(wú)論網(wǎng)頁(yè)結(jié)構(gòu)多么復(fù)雜,Mano都能生成有效的操作代碼。
第四,智能自主學(xué)習(xí)能力。Mano能夠自主適應(yīng)新網(wǎng)站,通過(guò)"探索→使用→自標(biāo)注→再訓(xùn)練"的循環(huán),持續(xù)進(jìn)化提升。這種自主學(xué)習(xí)能力,使得Mano不需要人工標(biāo)注大量訓(xùn)練數(shù)據(jù),就能快速適應(yīng)新場(chǎng)景。
更重要的是,Mano采用72B參數(shù)規(guī)模,實(shí)現(xiàn)了性能與部署成本的平衡。相比動(dòng)輒數(shù)千億參數(shù)的超大模型,72B參數(shù)的Mano可以私有化部署,既保證了性能,又解決了數(shù)據(jù)安全和成本問(wèn)題。
HMLLM:從客觀內(nèi)容到主觀感知的突破
如果說(shuō)Mano解決了"數(shù)據(jù)從哪來(lái)"的問(wèn)題,那么HMLLM則解決了"數(shù)據(jù)怎么分析"的難題,特別是如何分析消費(fèi)者的主觀感受。
傳統(tǒng)的多模態(tài)模型,通常融合視覺(jué)、文本、音頻等"客觀內(nèi)容"信號(hào)。HMLLM的創(chuàng)新在于,它首次將腦電、眼動(dòng)等"主觀感知"信號(hào)納入多模態(tài)建模,開(kāi)創(chuàng)了"生理信號(hào)+內(nèi)容信號(hào)"融合的新范式。
HMLLM的技術(shù)突破體現(xiàn)在三個(gè)層面:
第一,超大規(guī)模主觀個(gè)性化數(shù)據(jù)集。明略科技利用自研設(shè)備,采集了1萬(wàn)+真實(shí)受試者的腦電與注視點(diǎn)信號(hào),構(gòu)建了Video-SME與SPA-ADV兩大原創(chuàng)數(shù)據(jù)集,并已開(kāi)源發(fā)表。這些數(shù)據(jù)記錄了受試者在觀看不同內(nèi)容時(shí)的真實(shí)生理反應(yīng)——注意力集中在哪里、情緒如何波動(dòng)、認(rèn)知負(fù)荷有多大。
第二,超圖多模態(tài)架構(gòu)創(chuàng)新。HMLLM通過(guò)超圖結(jié)構(gòu)將視頻幀、音頻、人口特征與生理信號(hào)統(tǒng)一建模,彌合了不同模態(tài)之間的語(yǔ)義鴻溝,支持幀級(jí)邏輯推理與人群差異解讀。
傳統(tǒng)的多模態(tài)融合,通常采用簡(jiǎn)單的拼接或注意力機(jī)制。超圖結(jié)構(gòu)的優(yōu)勢(shì)在于,它能夠建模更復(fù)雜的跨模態(tài)關(guān)系。比如,某個(gè)視頻幀(視覺(jué))、某段音樂(lè)(聽(tīng)覺(jué))、某個(gè)文字(文本)、某個(gè)腦電模式(生理)之間,可能存在復(fù)雜的關(guān)聯(lián)關(guān)系,超圖結(jié)構(gòu)能夠有效捕捉這些關(guān)聯(lián)。
第三,秒級(jí)主觀指標(biāo)預(yù)測(cè)能力。HMLLM能夠?qū)崿F(xiàn)秒級(jí)粒度的注意力、情緒、認(rèn)知三維建模,預(yù)測(cè)結(jié)果與真人主觀感受的一致性(R2)超過(guò)89%。
雙技術(shù)協(xié)同:完整的智能分析閉環(huán)
Mano和HMLLM兩項(xiàng)技術(shù)的價(jià)值,不僅在于各自的突破,更在于它們的協(xié)同效應(yīng)。
在明略科技的技術(shù)架構(gòu)中,Mano負(fù)責(zé)前端的可信數(shù)據(jù)獲取,HMLLM負(fù)責(zé)后端的主觀感知分析,兩者共同構(gòu)成了從數(shù)據(jù)采集到洞察輸出的完整閉環(huán)。
具體而言,Mano通過(guò)MCP(Model Context Protocol)+CDP(Chrome DevTools Protocol)協(xié)議操作各類系統(tǒng),實(shí)現(xiàn)自動(dòng)化、可信化的數(shù)據(jù)采集。無(wú)論是網(wǎng)頁(yè)數(shù)據(jù)、社媒內(nèi)容,還是廣告后臺(tái)數(shù)據(jù),Mano都能像人一樣操作系統(tǒng),獲取所需信息。
獲取數(shù)據(jù)后,HMLLM對(duì)內(nèi)容進(jìn)行多模態(tài)分析:視覺(jué)層面識(shí)別場(chǎng)景、產(chǎn)品、表情;音頻層面分析語(yǔ)音、音樂(lè)、語(yǔ)氣;文本層面提取標(biāo)題、字幕、評(píng)論;生理層面預(yù)測(cè)注意力、情緒、認(rèn)知。
這種協(xié)同機(jī)制,解決了AI應(yīng)用的“第一公里”和“最后一公里”問(wèn)題。Mano解決了數(shù)據(jù)獲取的“第一公里”,HMLLM解決了洞察生成的“最后一公里”,兩者結(jié)合形成了端到端的智能系統(tǒng)。
更重要的是,系統(tǒng)配備了加密記憶系統(tǒng),能夠持續(xù)沉淀方法論。每次分析的結(jié)果、優(yōu)化的經(jīng)驗(yàn),都會(huì)被記錄下來(lái),用于改進(jìn)后續(xù)的分析。這種"持續(xù)使用、持續(xù)沉淀"的機(jī)制,使得系統(tǒng)越用越智能。
北大基因的技術(shù)深度
明略科技的技術(shù)突破,離不開(kāi)其深厚的學(xué)術(shù)基因。作為北大系A(chǔ)I企業(yè),明略科技的創(chuàng)始人、CEO兼CTO吳明輝畢業(yè)于北京大學(xué)數(shù)學(xué)系,后保送本校攻讀人工智能碩士。2006年,吳明輝在北大讀碩士期間創(chuàng)辦了秒針系統(tǒng),這是中國(guó)最早的互聯(lián)網(wǎng)用戶行為和營(yíng)銷數(shù)據(jù)分析平臺(tái)之一。
從北大校園走出的明略科技,將學(xué)術(shù)研究的嚴(yán)謹(jǐn)性與產(chǎn)業(yè)應(yīng)用的實(shí)戰(zhàn)性深度融合。在負(fù)責(zé)人吳明輝的帶領(lǐng)下,團(tuán)隊(duì)在國(guó)內(nèi)外高水平期刊、會(huì)議發(fā)表論文20余篇,其中:
Mano模型壓縮技術(shù)榮獲AAAI 2026(CCF A類)Oral口頭匯報(bào);
HMLLM的論文在ACM MM2024(CCF-A類)獲得最佳論文提名;
多篇項(xiàng)目支撐技術(shù)的論文均發(fā)表于計(jì)算機(jī)頂刊頂會(huì)。
此外,2019年,明略科技獲批建設(shè)"營(yíng)銷智能"國(guó)家新一代人工智能開(kāi)放創(chuàng)新平臺(tái),這一認(rèn)定標(biāo)志著其技術(shù)能力獲得了國(guó)家層面的權(quán)威認(rèn)可。明略科技還參與了科技創(chuàng)新2030"新一代人工智能"重大項(xiàng)目,在國(guó)家課題支撐下,將基礎(chǔ)研究與產(chǎn)業(yè)需求深度結(jié)合。
2025年,明略科技成功簽約為香港特區(qū)政府第五批重點(diǎn)企業(yè)伙伴,并擔(dān)任中國(guó)商務(wù)廣告協(xié)會(huì)AI營(yíng)銷應(yīng)用工委會(huì)理事長(zhǎng)兼秘書(shū)長(zhǎng)單位,展現(xiàn)了其在AI賦能營(yíng)銷領(lǐng)域的領(lǐng)軍地位。
從跟跑到領(lǐng)跑的技術(shù)躍升
明略科技此次獲得特等獎(jiǎng),是對(duì)其技術(shù)創(chuàng)新的權(quán)威認(rèn)可,更深刻證明了中國(guó)AI企業(yè)在多模態(tài)大模型領(lǐng)域的技術(shù)深度。
Mano在OS-World榜單上與Claude等國(guó)際頂尖大模型同臺(tái)競(jìng)技并取得領(lǐng)先,HMLLM在ACM MM2024獲得最佳論文提名,這些成績(jī)展現(xiàn)了中國(guó)AI技術(shù)從"跟跑"到"并跑"甚至"領(lǐng)跑"的實(shí)力躍升。
從學(xué)術(shù)研究到產(chǎn)業(yè)應(yīng)用,明略科技構(gòu)建了完整的創(chuàng)新鏈條。20余篇頂刊論文證明了學(xué)術(shù)深度,OS-World榜單第二名證明了工程能力,89%準(zhǔn)確率證明了創(chuàng)新突破,實(shí)際應(yīng)用案例證明了商業(yè)價(jià)值。
這一完整鏈條,正是中國(guó)AI技術(shù)從"跟跑"走向"領(lǐng)跑"的關(guān)鍵路徑:既能在國(guó)際頂級(jí)學(xué)術(shù)會(huì)議上發(fā)表論文,又能在國(guó)際權(quán)威評(píng)估基準(zhǔn)上與頂尖模型競(jìng)技,還能將技術(shù)轉(zhuǎn)化為實(shí)際應(yīng)用,創(chuàng)造商業(yè)價(jià)值。
明略科技的特等獎(jiǎng),不僅是對(duì)其技術(shù)創(chuàng)新的認(rèn)可,更是對(duì)中國(guó)AI企業(yè)技術(shù)實(shí)力的證明。在全球AI技術(shù)競(jìng)賽中,以明略科技為代表的北大系A(chǔ)I企業(yè),正在用實(shí)力證明:中國(guó)AI技術(shù),不僅能跟上,更能領(lǐng)跑。

