文|IT時報 沈毅斌
編輯|郝俊慧 孫妍
一邊是二手市場炒至天價的“一機難求”,一邊又是微信、支付寶等大廠的“圍剿封鎖”;一邊是AI代勞的技術(shù)暢想,一邊又是隱私泄露與合規(guī)風(fēng)險的尖銳拷問……自亮相以來,豆包手機的爭議從未中斷。
讓各方反應(yīng)激烈的原因,是豆包觸及了手機系統(tǒng)底層的權(quán)限,就像AI長出一只“無形的手”,不依賴App和手機廠商,就能模擬人類點擊和滑動,且泛用性極強。
《IT時報》記者將從手機廠商、應(yīng)用開發(fā)者、國外AI手機三方面進行對比,探究豆包手機引發(fā)巨大爭議的深層邏輯。
12月16日,根據(jù)中興商城官網(wǎng)顯示,豆包手機助手及合作機型nubiaM153目前已重啟F碼候補申請通道,正式恢復(fù)產(chǎn)品購買資格。
不同模式同一個目的
《隔屏有手!AI手機自動點咖啡背后,是偷偷啟動的無障礙功能》報道半年后,《IT時報》記者再次對各大手機廠商新機進行測試發(fā)現(xiàn),AI助手的智能化程度得到“史詩級增強”,已經(jīng)不再局限于點咖啡。
“幫我在淘寶上選一條便宜的牛仔褲?!毕旅罱o榮耀新機Magic 8和華為新機Mate 80,不僅可以通過AI助手打開淘寶,搜索“牛仔褲”品類,還能自動比價,按照指令篩選出“便宜”的商品展現(xiàn)在眼前。如果能給出更詳細(xì)的尺碼和顏色,AI助手可以“一步到位”,用戶只需付款即可。
AI助手越來越智能的背后離不開“無障礙”權(quán)限的調(diào)用。在各類手機AI助手的《隱私政策》中,記者依舊發(fā)現(xiàn)了手機廠商在調(diào)用無障礙功能、模擬點擊、讀屏、輔助功能等輔助AI決策的說明。
例如,榮耀新機Magic 8的《關(guān)于榮耀AI基礎(chǔ)服務(wù)與隱私的聲明》中,關(guān)于“情景感知”條例明確寫道:“為準(zhǔn)確獲取應(yīng)用界面上的操作信息及屏幕內(nèi)容,我們會動態(tài)借助系統(tǒng)的無障礙功能來獲取上述信息?!毕啾壬弦淮鶰agic 7“為了準(zhǔn)確獲取應(yīng)用使用信息,我們會動態(tài)借助系統(tǒng)的無障礙功能來分析應(yīng)用使用情況”的表述,新機條例中著重提到“獲取應(yīng)用界面上的操作信息及屏幕內(nèi)容”。
小米和vivo則將模擬點擊作為單獨條例列出來,表示“該功能旨在將您的語音命令轉(zhuǎn)化成與用手指一樣的模擬操作,我們需要收集如下信息:界面控件、文本、圖像的位置、媒體影音數(shù)據(jù)、聯(lián)系人信息等。同時,需要開啟輔助功能權(quán)限,用以輔助獲取您輸入的信息以及屏幕上的內(nèi)容”。
安全團隊網(wǎng)絡(luò)尖刀創(chuàng)始人曲子龍曾向《IT時報》記者解釋,各種App之間為了防止互相讀取數(shù)據(jù),一般會設(shè)置隔離系統(tǒng),只有接入對應(yīng)的API(應(yīng)用程序編程接口)才能調(diào)用。無障礙功能屬于系統(tǒng)級的API,它可以讀取用戶與設(shè)備的交互信息,能夠代表應(yīng)用與用戶進行交互。比如,當(dāng)鼠標(biāo)指針懸停于屏幕上的關(guān)鍵區(qū)域時,不需要實際觸控屏幕,便可以給予用戶反饋,“它就像一張‘萬能卡’,能刷開各個App之間的‘門禁’”。
然而,在豆包手機面前,“無障礙權(quán)限”的調(diào)用也變得“低人一等”。據(jù)技術(shù)專家分析,豆包手機或是動用了系統(tǒng)底層權(quán)限INJECT_EVENTS(注入事件),而該權(quán)限是Android(安卓)系統(tǒng)里的一個系統(tǒng)級危險權(quán)限。
簡單理解,INJECT_EVENTS允許應(yīng)用向系統(tǒng)“偽造”用戶操作事件(按鍵、觸摸、軌跡球等),并且可以發(fā)送到任何窗口或任意App。在Android權(quán)限設(shè)計中,一般僅有手機廠商預(yù)裝的系統(tǒng)應(yīng)用或獲取與手機系統(tǒng)同套簽名key(密鑰)的應(yīng)用才有此權(quán)限,極少向外部開放,以防惡意程序批量操控設(shè)備。
曲子龍具體解釋道,手機如同沙盒,App無法控制其他App,除非獲取更底層的控制能力,豆包AI手機這次的主要突破就是“后臺喚醒”能力。
此次豆包手機助手選擇的合作方是中興,是市面上少有的暫時還沒有做自有AI助手的手機廠商,而華為、榮耀、小米、vivo、OPPO都有自己的AI助手,豆包手機助手相當(dāng)于為沒有AI助手的智能手機賦能。
有了更底層的系統(tǒng)權(quán)限,豆包手機助手不僅能夠在系統(tǒng)自帶的相機、相冊、記事本、日歷、行程等應(yīng)用上面互動,更擺脫了對“無障礙工具”的依賴,可以同時打開多個App,體驗更絲滑。
大廠、銀行集體說“不” 游戲類App影響不大
作為大模型企業(yè),智譜也讓AI學(xué)會了“使用手機”,其發(fā)布的大模型AutoGLM能力與豆包手機不相上下,但“聰明”的做法是將其開源,且優(yōu)先部署云端手機,把操控AI的“鑰匙”交到整個行業(yè)手中。
反觀豆包手機,其“去App化”的操作模式,讓用戶無需打開應(yīng)用就能完成任務(wù),直接動搖了超級App作為流量入口和商業(yè)變現(xiàn)基礎(chǔ)的地位。如今,微信、支付寶、淘寶、銀行等App都以安全風(fēng)控為由,強制出現(xiàn)彈窗警告或登錄限制來限制豆包手機的使用。
據(jù)《騰訊微信軟件許可及服務(wù)協(xié)議》第7.3條明確規(guī)定:禁止通過非騰訊開發(fā)、授權(quán)的第三方軟件、插件、外掛、系統(tǒng),登錄或使用本軟件及服務(wù),或者進行自動化操作。
騰訊對此回應(yīng):“沒有什么特別動作,可能是豆包手機助手觸發(fā)了微信的風(fēng)控機制,其模擬點擊操作被識別為‘自動化腳本’。”支付寶也與微信類似,將豆包手機助手的行為判定為“外掛腳本”。
從技術(shù)層面來看,風(fēng)控系統(tǒng)并不會直接“認(rèn)出”豆包,而是通過分析設(shè)備和用戶行為的異常特征,綜合判斷當(dāng)前操作并非真人。
在《2025反爬與反作弊技術(shù)全解:設(shè)備指紋到AI風(fēng)控的攻防實戰(zhàn)》一文中提到,設(shè)備指紋是識別終端設(shè)備的核心手段,風(fēng)控系統(tǒng)會采集設(shè)備的硬件、軟件、網(wǎng)絡(luò)等數(shù)百項參數(shù),生成一個獨特的“設(shè)備指紋”,檢測設(shè)備是否為模擬器;行為時序分析則會結(jié)合鼠標(biāo)軌跡、觸控壓力、滾動速度等行為數(shù)據(jù),構(gòu)建動態(tài)畫像,區(qū)分真人操作與自動化腳本。而豆包手機使用的INJECT_EVENTS本就屬于高危系統(tǒng)權(quán)限,因此會被識別為風(fēng)險標(biāo)簽。
生態(tài)層面,超級App們憑借多年積累的用戶流量和場景壁壘,入口是關(guān)鍵的商業(yè)變現(xiàn)陣地。阿里剛剛發(fā)布了夸克AI眼鏡,《IT時報》記者實測發(fā)現(xiàn),實現(xiàn)智能驅(qū)動的正是“千問大模型”,并開放了淘寶、高德、支付寶、飛豬等阿里系生態(tài)應(yīng)用,實現(xiàn)導(dǎo)航、比價、預(yù)訂機酒等功能。
不過,這種生態(tài)內(nèi)的AI協(xié)同模式,更像是在既有商業(yè)版圖上的“內(nèi)部賦能”,而非對現(xiàn)有流量格局的顛覆。豆包則試圖以“外部闖入者”的姿態(tài),直接繞過超級App的流量入口,這無疑觸動了大廠們的核心利益。
那么,小型App開發(fā)者對豆包手機接管App的行為又有何看法?
“游戲類、工具類還是觀望態(tài)度,但社交類和內(nèi)容類App反對會比較激烈?!睆氖率謾CApp開發(fā)的技術(shù)人員張晨(化名)告訴記者,對于操作性較強的App,豆包手機助手能做的也僅有“打開”這個步驟,用戶使用App的本意就是自己操控,而且愿意用豆包打開這類App的用戶,需要更加精準(zhǔn)的指令,這也意味著,其本身用戶黏性較高,功能相對獨立,AI助手的介入難以替代用戶的核心使用體驗。
但對于內(nèi)容類、社交類的小型App而言,收益往往依賴用戶停留時長、內(nèi)容曝光、廣告點擊等,豆包手機“一步到位”的操作模式,可能會讓用戶在無意識中快速跳過內(nèi)容推薦、廣告展示等環(huán)節(jié),直接抵達(dá)最終結(jié)果,無疑是“直擊要害”。
合規(guī)隱憂日益凸顯 國外手機走得更慢些
當(dāng)“國產(chǎn)賈維斯”刷屏?xí)r,國外的AI手機似乎還在隱私合規(guī)與生態(tài)兼容的平衡中謹(jǐn)慎試探。
9月,蘋果的Apple Intelligence已在海外全設(shè)備端上線,核心功能包括實時翻譯、解析屏幕內(nèi)容并實現(xiàn)圖片搜索、文本摘要的視覺智能,以及可生成專屬動態(tài)表情的Genmoji 2.0、結(jié)合健身數(shù)據(jù)提供個性化鼓勵的“Workout Buddy”等。但這些功能尚未像國產(chǎn)AI助手那樣,實現(xiàn)跨應(yīng)用的自動化操作,仍需用戶手動授權(quán)每一步操作。
谷歌Pixel 10系列主打的Magic Cue功能,雖號稱“預(yù)判用戶需求”,但實際僅停留在信息推送層面,比如通話時自動調(diào)取Gmail中的航班號、聊天時推薦對應(yīng)照片,全程無需用戶手動搜索,卻始終未突破“被動建議”的邊界,未涉及真正的跨App代操作;三星Galaxy系列的AI功能仍以基礎(chǔ)場景提醒和生態(tài)聯(lián)動為主,即便與百度等大模型合作,也未推出類似國產(chǎn)手機的“全局AI代理”。
反觀國內(nèi),用戶對效率工具的接受度高,從外賣比價下單、賬單自動記錄到文檔摘要提取、跨設(shè)備協(xié)同等高頻場景,都對AI代操作有強烈需求。IDC預(yù)計,2026年中國新一代AI手機出貨量將達(dá)到1.47億臺,同比增長31.6%,占據(jù)整體市場的53%。
不過,這種“狂飆突進”的發(fā)展模式下,合規(guī)性與安全性的隱憂正逐漸凸顯。豆包手機也許只是開始,隨著更多手機廠商在AI功能上發(fā)力,如何在提升用戶體驗的同時,確保用戶數(shù)據(jù)的安全使用、明確AI決策的責(zé)任邊界等問題,將成為整個行業(yè)必須面對的重要課題。
排版/ 季嘉穎

