ChatGPT的橫空出世,讓整個(gè)世界見(jiàn)識(shí)到了大模型的強(qiáng)大能力。但當(dāng)企業(yè)興沖沖地想要將這些通用大模型應(yīng)用到自己的業(yè)務(wù)中時(shí),卻往往發(fā)現(xiàn)"理想很豐滿,現(xiàn)實(shí)很骨感"——模型回答很通用但不夠精準(zhǔn),生成的內(nèi)容缺乏行業(yè)專業(yè)性,無(wú)法真正解決企業(yè)的個(gè)性化問(wèn)題。
問(wèn)題出在哪里?明略科技創(chuàng)始人吳明輝給出了一個(gè)被很多人忽視的答案:數(shù)據(jù)積累。在他看來(lái),沒(méi)有深厚的行業(yè)數(shù)據(jù)積累作為支撐,AI就只能停留在表面應(yīng)用,無(wú)法真正成為企業(yè)可信賴的生產(chǎn)力工具。
通用大模型的"最后一米"困境
2023年被稱為"大模型元年",從GPT-4到文心一言,從通義千問(wèn)到訊飛星火,各種大模型如雨后春筍般涌現(xiàn)。這些模型在通用任務(wù)上表現(xiàn)驚艷,寫詩(shī)作文、編程答題都不在話下。但企業(yè)在實(shí)際應(yīng)用中卻面臨著"最后一米"的困境。
一位制造業(yè)企業(yè)的CIO向記者抱怨:"我們嘗試用通用大模型來(lái)優(yōu)化生產(chǎn)流程,但它給出的建議太宏觀、太理論化,根本無(wú)法直接應(yīng)用到我們的實(shí)際場(chǎng)景中。我們需要的是基于我們自己的生產(chǎn)數(shù)據(jù)、工藝參數(shù)、質(zhì)量標(biāo)準(zhǔn)的個(gè)性化方案。"
這種困境背后,是通用大模型的本質(zhì)局限——它們雖然在海量互聯(lián)網(wǎng)數(shù)據(jù)上訓(xùn)練,擁有廣泛的知識(shí)儲(chǔ)備,但對(duì)于企業(yè)的特定業(yè)務(wù)場(chǎng)景、行業(yè)know-how、歷史數(shù)據(jù)積累卻知之甚少。就像一位博學(xué)的通才,雖然知識(shí)面廣,但在特定領(lǐng)域的深度和精度上,往往比不過(guò)浸淫多年的行家。
中國(guó)AI開發(fā)者應(yīng)用生態(tài)調(diào)研報(bào)告指出,企業(yè)在將AI技術(shù)應(yīng)用于實(shí)際業(yè)務(wù)流程時(shí),普遍缺乏合適的流程和場(chǎng)景,數(shù)據(jù)資源的不足和質(zhì)量問(wèn)題依然制約著AI的推廣。這揭示了一個(gè)殘酷的事實(shí):技術(shù)再先進(jìn),如果沒(méi)有與之匹配的數(shù)據(jù)基礎(chǔ),AI應(yīng)用就是"無(wú)米之炊"。
數(shù)據(jù)積累是企業(yè)AI的"暗物質(zhì)"
在物理學(xué)中,"暗物質(zhì)"雖然看不見(jiàn)摸不著,但卻占據(jù)了宇宙質(zhì)量的大部分,決定著宇宙的結(jié)構(gòu)和演化。在企業(yè)AI應(yīng)用中,數(shù)據(jù)積累就是這樣的"暗物質(zhì)"——不顯山不露水,但卻是決定AI能否落地、能否創(chuàng)造價(jià)值的關(guān)鍵因素。
明略科技的發(fā)展歷程,恰好印證了這一點(diǎn)。2006年,吳明輝在北京大學(xué)讀研期間創(chuàng)立秒針系統(tǒng),最初只是一個(gè)互聯(lián)網(wǎng)廣告監(jiān)測(cè)工具。但隨著業(yè)務(wù)的開展,秒針系統(tǒng)開始積累海量的營(yíng)銷數(shù)據(jù)——廣告投放數(shù)據(jù)、用戶行為數(shù)據(jù)、媒體價(jià)值數(shù)據(jù)等。
這些數(shù)據(jù)在當(dāng)時(shí)看來(lái)或許只是業(yè)務(wù)的"副產(chǎn)品",但在AI時(shí)代卻成為了明略最寶貴的資產(chǎn)。當(dāng)其他企業(yè)還在為缺乏訓(xùn)練數(shù)據(jù)而苦惱時(shí),明略已經(jīng)擁有了覆蓋主流社交媒體、日均處理千億級(jí)廣告請(qǐng)求的數(shù)據(jù)采集和處理能力。
更重要的是,這些數(shù)據(jù)不是孤立的數(shù)字,而是與業(yè)務(wù)場(chǎng)景深度綁定的"活數(shù)據(jù)"。每一條數(shù)據(jù)背后都對(duì)應(yīng)著具體的業(yè)務(wù)場(chǎng)景、實(shí)際的商業(yè)問(wèn)題、真實(shí)的決策需求。這種數(shù)據(jù)的價(jià)值,遠(yuǎn)遠(yuǎn)超過(guò)那些為了訓(xùn)練而爬取的"死數(shù)據(jù)"。
明略科技在招股書中披露,截至2025年6月,公司已為約135家《財(cái)富》全球500強(qiáng)企業(yè)提供服務(wù),大客戶留存率高達(dá)90%以上。這樣的數(shù)據(jù)意味著,明略在近20年的服務(wù)過(guò)程中,積累了大量經(jīng)過(guò)業(yè)務(wù)驗(yàn)證的高質(zhì)量數(shù)據(jù)和場(chǎng)景洞察。這種積累,是新進(jìn)入者無(wú)法在短期內(nèi)復(fù)制的。
從數(shù)據(jù)孤島到智能中臺(tái):明略的技術(shù)破局
擁有數(shù)據(jù)只是第一步,如何讓數(shù)據(jù)真正"活起來(lái)"、轉(zhuǎn)化為智能,才是更大的挑戰(zhàn)。企業(yè)往往面臨著"數(shù)據(jù)孤島"的困境——ERP系統(tǒng)里有一套數(shù)據(jù)、CRM系統(tǒng)里有一套數(shù)據(jù)、生產(chǎn)系統(tǒng)里又有一套數(shù)據(jù),彼此割裂,無(wú)法形成合力。
明略科技在這方面進(jìn)行了系統(tǒng)性的技術(shù)布局。依托多模態(tài)數(shù)據(jù)智能、企業(yè)級(jí)知識(shí)圖譜和數(shù)據(jù)隱私技術(shù)三大核心技術(shù),明略不僅能夠采集和存儲(chǔ)數(shù)據(jù),更能夠?qū)⒎稚⒃诟鱾€(gè)系統(tǒng)中的異構(gòu)數(shù)據(jù)進(jìn)行整合、清洗、關(guān)聯(lián),構(gòu)建起企業(yè)的統(tǒng)一數(shù)據(jù)資產(chǎn)。
以知識(shí)圖譜技術(shù)為例,明略在這一領(lǐng)域的投入可以追溯到早期。2020年,公司憑借知識(shí)圖譜自動(dòng)構(gòu)建及行業(yè)應(yīng)用的技術(shù)成果獲得吳文俊人工智能科學(xué)技術(shù)獎(jiǎng)一等獎(jiǎng)。這項(xiàng)技術(shù)能夠?qū)⑵髽I(yè)的結(jié)構(gòu)化數(shù)據(jù)、文檔、視頻、圖像等多維數(shù)據(jù)進(jìn)行抽取與融合,構(gòu)建起反映業(yè)務(wù)邏輯和知識(shí)關(guān)聯(lián)的知識(shí)圖譜。
更關(guān)鍵的是,明略建立了完整的數(shù)據(jù)治理體系。在數(shù)據(jù)隱私和安全日益受到重視的今天,明略實(shí)施了全面的數(shù)據(jù)隱私保護(hù)機(jī)制和數(shù)據(jù)倫理框架,在提供智能服務(wù)的同時(shí),嚴(yán)格保護(hù)客戶數(shù)據(jù)和個(gè)人隱私。這種對(duì)數(shù)據(jù)治理的重視,讓企業(yè)可以放心地將自己的核心數(shù)據(jù)交給明略進(jìn)行智能化改造。
通過(guò)這套技術(shù)體系,明略將企業(yè)原本分散、孤立的數(shù)據(jù),轉(zhuǎn)化為可以支撐AI應(yīng)用的統(tǒng)一"燃料庫(kù)"。就像汽車需要汽油才能跑起來(lái),AI應(yīng)用需要高質(zhì)量的數(shù)據(jù)才能發(fā)揮作用。明略做的,就是幫企業(yè)把分散的"小油罐"整合成統(tǒng)一的"大油庫(kù)",并且確保油的質(zhì)量和安全。
可信AI的數(shù)據(jù)基礎(chǔ)
在AI領(lǐng)域,"可信"是一個(gè)高頻詞,但什么才算真正的可信?明略科技給出的答案是:數(shù)據(jù)質(zhì)量決定輸出質(zhì)量,數(shù)據(jù)深度決定應(yīng)用深度。
通用大模型之所以在某些場(chǎng)景下不夠可信,很大程度上是因?yàn)樗挠?xùn)練數(shù)據(jù)來(lái)源廣泛但質(zhì)量參差不齊,且缺乏對(duì)特定領(lǐng)域的深度覆蓋。當(dāng)模型被問(wèn)到專業(yè)問(wèn)題時(shí),就容易出現(xiàn)"一本正經(jīng)地胡說(shuō)八道"的情況,業(yè)界稱之為"幻覺(jué)"。
明略的數(shù)據(jù)優(yōu)勢(shì)恰恰能夠有效解決這個(gè)問(wèn)題。因?yàn)閿?shù)據(jù)來(lái)自真實(shí)的業(yè)務(wù)場(chǎng)景,經(jīng)過(guò)多年的業(yè)務(wù)驗(yàn)證,且有明確的業(yè)務(wù)標(biāo)注和質(zhì)量控制,所以基于這些數(shù)據(jù)訓(xùn)練或微調(diào)的模型,能夠給出更加準(zhǔn)確、更加可靠的輸出。
數(shù)據(jù)壁壘:AI時(shí)代的核心競(jìng)爭(zhēng)力
在互聯(lián)網(wǎng)時(shí)代,大家常說(shuō)"得流量者得天下"。到了AI時(shí)代,這句話或許要改成"得數(shù)據(jù)者得天下"。而且這里的"數(shù)據(jù)"不是簡(jiǎn)單的數(shù)據(jù)量,而是高質(zhì)量的、與業(yè)務(wù)場(chǎng)景深度綁定的行業(yè)數(shù)據(jù)。
從這個(gè)角度看,明略科技用近20年時(shí)間建立起的數(shù)據(jù)壁壘,是其最核心的競(jìng)爭(zhēng)力。這種壁壘有幾個(gè)特點(diǎn):
一是積累時(shí)間長(zhǎng)。從2006年到2025年,明略在營(yíng)銷智能和營(yíng)運(yùn)智能領(lǐng)域持續(xù)深耕,每一天都在產(chǎn)生和積累新的數(shù)據(jù)。這種時(shí)間維度的優(yōu)勢(shì),是后來(lái)者無(wú)法通過(guò)資金或技術(shù)快速追趕的。
二是數(shù)據(jù)質(zhì)量高。明略服務(wù)的客戶包括135家《財(cái)富》全球500強(qiáng)公司,這些企業(yè)的業(yè)務(wù)復(fù)雜度高、數(shù)據(jù)規(guī)范性強(qiáng)、決策要求嚴(yán),為明略提供了大量高質(zhì)量的訓(xùn)練樣本。
三是場(chǎng)景覆蓋廣。明略的業(yè)務(wù)從線上營(yíng)銷到線下門店,從消費(fèi)品到工業(yè)制造,積累了跨行業(yè)、跨場(chǎng)景的數(shù)據(jù)和經(jīng)驗(yàn),這種廣度讓明略能夠提供更加全面的解決方案。
四是持續(xù)更新。明略不是一次性地積累數(shù)據(jù),而是通過(guò)持續(xù)的客戶服務(wù),不斷地更新和豐富自己的數(shù)據(jù)資產(chǎn),保持?jǐn)?shù)據(jù)的時(shí)效性和相關(guān)性。
正是基于這樣的數(shù)據(jù)壁壘,明略在面對(duì)新技術(shù)浪潮時(shí),能夠快速將通用技術(shù)轉(zhuǎn)化為行業(yè)解決方案。當(dāng)DeepSeek等開源大模型引爆企業(yè)級(jí)市場(chǎng)時(shí),明略不是簡(jiǎn)單地接入這些模型,而是將它們與自己的數(shù)據(jù)資產(chǎn)深度融合,開發(fā)出更加適合企業(yè)應(yīng)用的定制化產(chǎn)品。
在AI產(chǎn)業(yè)化的進(jìn)程中,技術(shù)的光芒往往最耀眼,但數(shù)據(jù)的價(jià)值卻最容易被忽視。明略科技用近20年的實(shí)踐告訴我們,在企業(yè)AI應(yīng)用中,數(shù)據(jù)積累不是錦上添花,而是雪中送炭;不是可有可無(wú),而是必不可少。
沒(méi)有數(shù)據(jù)積累作為支撐,AI就像是建在沙灘上的城堡,看起來(lái)壯觀但經(jīng)不起考驗(yàn)。只有扎根于深厚的數(shù)據(jù)基礎(chǔ)之上,AI才能真正成為企業(yè)可信賴的生產(chǎn)力工具,才能創(chuàng)造出可持續(xù)的商業(yè)價(jià)值。

