文丨鏡相工作室 彭杰克
編輯丨諶巖
短短幾天 ,在各方質疑、爭論、限制下,豆包手機助手一退再退。
繼下線手機助手操作微信的功能后,12月5日上午,針對刷分、刷激勵,金融類App,部分游戲這三大使用場景,豆包手機助手放棄了操作權限。公告中,豆包方面的措辭顯得有些無奈——“這是為了讓技術走得更穩(wěn)、更遠的必要鋪墊,希望能得到大家的理解。”但就在昨天,阿里系App也集體“拉黑”了豆包手機助手,出于風控原因,淘寶、閑魚、大麥等App無法登陸,估計其他大廠的措施也都在路上了。
這樣的遭遇,放在整個移動互聯(lián)網(wǎng)行業(yè)的大環(huán)境下,再正常不過。
當年,移動互聯(lián)網(wǎng)讓人類第一次把時間塞進一塊小小的屏幕里,社交網(wǎng)絡、信息流、推薦算法……整套注意力經濟在過去十多年長成參天大樹。它要求用戶點擊、滑動、停留,讓每一秒都被平臺捕獲、計算、轉化,最終變成各家大廠的商業(yè)價值。如今,字節(jié)拿出AI手機助手,本來只是一次試水,卻被認為想掀桌子,改寫已有的規(guī)則,重塑早就劃分完畢的地盤格局,這是各家都無法容忍的。
于是,隱私保護和風控成了最合適的緣由,讓人無法反駁,字節(jié)也只能退讓。但是,這樣的嘗試不應該被否定,總有人要有膽量去撼動固化的利益格局,這是科技進步和范式轉移的開端,生態(tài)從注意力為中心轉向以需求和意圖為中心,也是大勢所趨。
這種可預見的變化會自然沖擊原有的信息孤島和商業(yè)邏輯,讓手機不再是承載應用、廣告的容器,而是成為一個隨時替用戶行動的代理、Agent。入口、路徑、停留都會重新分配。只不過這個過程會異常艱難,字節(jié)至少有敢為人先的勇氣,也有快人一步的野心,這次嘗試即便不成功,帶來的思考和影響也會是巨大的。
理想和現(xiàn)實存在差距
豆包手機助手的發(fā)布在字節(jié)跳動今年的計劃內。據(jù)晚點Latepost報道,這是一項從去年上半年就開始籌備的任務,字節(jié)負責大模型功能、部分操作系統(tǒng)相關的工作,硬件的設計、生產等主要由中興作為ODM(Original design manufacturer,原始設計制造商)負責。
12月的第一天,豆包手機助手發(fā)布技術預覽版,工程樣機nubia M153同步少量發(fā)售,官網(wǎng)售價3499元,很快售罄,二手平臺普遍加價超千元。
從官方演示視頻來看,這款AI手機確實吊足了胃口:它可以根據(jù)一篇小紅書種草筆記,識別出相應產品,幫用戶跨平臺比價并選擇最低價鏈接下單;能夠一一完成瀏覽并整理旅游攻略、在地圖App上標記用戶收藏的餐廳、根據(jù)出行計劃預定旅游目的地展覽等多項復雜任務;如果你足夠相信AI,授權它記憶屏幕內容,它將越來越了解你,在你需要的時候提醒你朋友推薦過什么餐廳,自動幫你下單孩子會喜歡的生日禮物……
這一切把動手操作降到最低,將手機從被動工具變成主動幫手。然而,發(fā)布次日,搶到樣機的用戶陸續(xù)發(fā)布反饋,豆包提醒的“大模型技術不可控”并沒有成為焦點,反而是App之間的“墻”影響了使用體驗。
先是有多位nubia M153用戶反映,其微信異常退出甚至無法登錄,并被提示“微信登錄環(huán)境存在異?!?。對此,騰訊相關人士回應上海證券報稱:“我們沒有什么特別的動作,這個不是二選一,不知道是不是中了安全風控措施?!?/p>
然后是銀行、支付類App使用受限,如有用戶用豆包手機助手網(wǎng)購,流程進行到人工輸入付款密碼時,被支付寶判定支付環(huán)境存在安全風險、中途截停了任務。還有用戶讓豆包手機助手代打了一把王者榮耀,游戲結束后,該用戶被判定使用外掛、被系統(tǒng)禁賽10分鐘。
豆包手機助手的技術原理是通過視覺識別用戶手機屏幕上的按鈕、文字等內容,把信息交給AI去推理,再輸出指令模擬人手去點擊屏幕。這個技術并不新鮮,原理有點類似于早年的“按鍵精靈”或“自動搶紅包”,只不過識別的內容和返回的操作都更復雜。
主要問題是,這樣的操作需要獲得很高的權限,才能識別出用戶屏幕上的內容。因此,許多App以保護用戶隱私和防止誤操作等為由,主動封禁。甚至有聲音指控豆包手機助手未經授權獲取操作系統(tǒng)高危權限、侵犯用戶隱私等。
但實際上,字節(jié)不可能給自己埋下這樣的隱患。面對質疑,他們做了兩件事情:一是將微信、金融、游戲等個人隱私更敏感,安全要求更高的App主動下線功能,AI無法識別操作;二是建立了透明、合規(guī)且完善的權限管理體系,保證用戶事前充分知情,事中隨時介入,事后數(shù)據(jù)清理的權利。
比如,豆包手機助手在幫用戶完成任務時,需要調用手機系統(tǒng)級權限,這需要用戶主動授權,這不是豆包率先這樣做,目前市場上的AI助手很多都會調用,才能提供自動操作手機的服務;像自動駕駛一樣,豆包調用權限操作手機時屏幕上也會明確提示,用戶隨時可以中斷;而在執(zhí)行一些敏感任務時,比如敏感權限授權彈窗、支付環(huán)節(jié)、身份驗證等,都會暫停操作,讓用戶二次確認后自己完成;整個過程中,豆包手機助手不會在云端存儲任何屏幕內容,后續(xù)也不會用相關數(shù)據(jù)進行模型訓練,必須把數(shù)據(jù)上傳到云端處理時,傳輸和處理過程均采取嚴格的保護措施保障?戶數(shù)據(jù)安全,數(shù)據(jù)使?完后會?即刪除。
隱私安全是普通用戶最關心的事情,也是國家法律嚴格規(guī)定的紅線。事實上,移動互聯(lián)網(wǎng)時代的算法推薦,不管是刷短視頻、逛購物網(wǎng)站、閱讀文章,還是各大App的開屏廣告、信息流廣告,都會使用用戶的行為數(shù)據(jù),也會用到很多的高敏感權限,很多人甚至覺得手機在“監(jiān)聽”自己,說了什么話、打了什么字、逛了什么網(wǎng)站都被追蹤了。但絕大多數(shù)時候,這些都是獲得用戶授權的,正規(guī)公司的產品會受到手機廠商和相關部門嚴格的監(jiān)管。
只不過“AI一邊替你操作手機,一邊瘋狂獲取你的隱私信息”的場景太過具象,激發(fā)出人們對隱私泄露的恐懼,有極好的傳播效果。因此,這也成了各大潛在對手,包括手機廠商、應用廠商抵制豆包手機助手最好的理由。
與手機、應用廠商的雙重矛盾
可以說,字節(jié)這次發(fā)AI手機助手,把市場上的人們得罪了個遍。
早在豆包手機助手發(fā)布之前,過去一整年,幾乎所有的手機廠商都在加班加點地研發(fā)自家的AI助手,一些大模型公司也想當AI Agent方案供應商,讓自家的Agent入駐用戶手機。但是,沒有哪家像字節(jié)這樣令所有人緊張。
如果是華米OV來做,威脅有限,因為彼此都無法把自家助手裝到友商手機里;如果是大模型公司做,更是毫無話語權,人家憑什么要用你的Agent;如果是應用大廠來做,比如那些坐擁國民App的大廠,騰訊、阿里、字節(jié),雖然手機廠商不敢不認真對待,但微信不可能讓豆包操作,支付寶也不可能讓元寶操作,美團也不可能讓千問操作,手機助手功能將十分有限。
但字節(jié)偏偏要試一試,還找來了中興。很明顯,雖然說是合作,但字節(jié)是主導,更像是中興給字節(jié)代工。這樣一來,字節(jié)又有硬件,又有技術和用戶規(guī)模都在前列的豆包,先發(fā)優(yōu)勢巨大,這讓手機大廠和應用大廠同時坐不住了。
對于手機廠商來說,雖然大模型技術不一定強,但和大模型創(chuàng)企合作是各取所需,關系可控。而在應用大廠看來,AI手機還處于“PPT階段”,體驗差,效率低,構不成太大威脅。但如果是字節(jié)聯(lián)合中興來做,就不一樣了,手機大廠會擔心中興會不會成為手機界的賽力斯,在字節(jié)的加持下一飛沖天,應用大廠則會擔心字節(jié)把技術和模式跑通后,騎到自己頭上,變成用戶流量總龍頭。
因此,字節(jié)的入局在戰(zhàn)略邏輯上本身就面臨雙重挑戰(zhàn):挑戰(zhàn)既有手機廠商對“AI手機+系統(tǒng)級入口”的封閉控制,也挑戰(zhàn)主流應用廠商對“流量、用戶使用時長、廣告變現(xiàn)”的路徑依賴。
手機廠商中,榮耀的危機感顯而易見。
先是榮耀首席影像工程師羅巍直言:“我不看好。因為字(節(jié))沒有硬件研發(fā)能力,或者硬件能力并不比中興領先。那么就是兩個矮子在一起,也不會生個高子。我預計如果堅持的話,三世而亡。否則一代死。”
然后是榮耀終端股份有限公司產品線總裁方飛,其稱豆包手機助手的演示視頻讓人眼熟,“基于UI Agent實現(xiàn)對通用場景的支持并自動執(zhí)行,這與榮耀AI從特定任務向通用化執(zhí)行的發(fā)展道路是一致的?!?/p>
如果說字節(jié)與手機廠商的競爭,還是新趨勢下的你追我趕,那么其與主流應用廠商間的沖突,則觸及了移動互聯(lián)網(wǎng)生態(tài)中最敏感、最根源的矛盾,是對AI時代下,誰控制入口、誰定義操作、誰分配流量、誰決定變現(xiàn)規(guī)則的爭奪。
當背靠全球最大獨角獸的豆包手機助手,獲取系統(tǒng)級高敏感權限,試圖跨應用自動化,在用戶的一句指令下完成瀏覽、提取、對比、交易等任務時,它實質上繞過了傳統(tǒng)App的界面與交互結構,讓用戶不必打開App,不必瀏覽、點擊、停留,這對依賴注意力經濟的應用廠商而言是最直接的沖擊。
這意味著,開屏廣告不再被用戶看到,提升用戶使用時長的小巧思可以被跳過,乃至平臺與平臺間的主視覺設計、差異化定位都將被消解。大眾最常用的App,從流量控制、用戶行為到推薦邏輯、商業(yè)模式,都可能被AIOS撼動。更不用說字節(jié)和其他大廠業(yè)務競爭廣泛,電商、短視頻、本地生活、社交、AI、游戲等全方位布局,騰訊、阿里、京東、美團、拼多多、攜程、快手、百度,沒有一家會放心豆包操作自家的App。
如果說華米OV們來做AI手機,應用廠商們還只是出于對范式轉移的擔憂而采取限制或保持沉默,但如果是字節(jié)來做,大廠們就會集體抵制了。這是一種本能的應激反應。
撞墻和拆墻的路
字節(jié)是激進的。突然搞出一個AI手機助手,無疑是在和手機大廠和應用大廠同時宣戰(zhàn)。但字節(jié)也是勇敢的,在利益固化嚴重,甚至字節(jié)自己就是舊范式的最大受益者之一時,主動走出舒適區(qū),探索新的可能性,這種創(chuàng)新精神是值得鼓勵的。
整個行業(yè)過去十幾年始終圍繞“注意力—流量—廣告”的邏輯構建生態(tài),用戶的操作越復雜、停留越久,平臺越受益。AI手機的出現(xiàn)從邏輯底層提出了新的方向:如果未來的終端更像個人助理,而不是內容入口,那么用戶停留時間、頁面點擊、跳轉深度,這些曾經主宰互聯(lián)網(wǎng)的指標都將被重塑。
實際上,豆包手機助手和過往那些手機廠商的AI助手類似,依舊停留在非常早期的階段。無論是字節(jié),還是榮耀、智譜,都在采用一種過渡性的GUI(Graphical User Interface)方案,通過“讀屏+模擬操作”來調用App。和更理想的意圖框架相比,它的最大優(yōu)勢是能繞過App后臺授權、從前臺直接操作,但難點在于適應界面變化,如果App突然更新設計、按鈕位置變了,AI又得重新學習。這些產品都有著成功率低、響應不穩(wěn)定、耗時長等共性問題,可能用起來還沒有人親自操作更高效,但萬事開頭難,走出這一步,后面才有機會變得更好。
但第一步就注定會撞到高墻——權限、利益、安全、生態(tài)秩序。這些問題無論誰先做,都會發(fā)生,字節(jié)做,更是會撞得頭破血流。
這也是為什么必須有人先來觸碰這些壁壘。壁壘越厚,創(chuàng)新者越痛,但如果沒有這一撞,用戶永遠不知道手機能不能變得更聰明,也無法判斷真正的“手機智能化”到底應不應該由消費者來決定,而不是由平臺利益來決定。
字節(jié)選擇在此刻站出來,冒著隱私保護、輿論傾向、體驗糟糕等風險,把大模型置于真實的手機使用場景里,是一次非常有意義的嘗試。
從第一代工程樣機三萬臺的備貨量來看,這本身就是一次工程測試,而不是全面商業(yè)化的發(fā)布。字節(jié)或許并不想與其他手機廠商拼體量,而是用最小規(guī)模、最可控的方式驗證一件事:當用戶能夠選擇更高效的決策方式時,原有的互聯(lián)網(wǎng)生態(tài)是否還能保持曾經的穩(wěn)定?從用戶的熱情、樣機加價,再到主流應用紛紛觸發(fā)風控,這臺小小的工程樣機其實已經給出了答案。
目前,豆包手機助手還遠遠稱不上成熟,它的能力受限于GUI的先天缺陷,也會繼續(xù)面對權限、系統(tǒng)兼容、風險控制等層層挑戰(zhàn)。但在這個初期階段,它至少證明了一件事:AI手機不是概念機,而是能夠通過真實用戶場景帶來效率提升的東西。
從這個角度看,字節(jié)撞上的每一道墻,其實都屬于行業(yè)必須面對、必須拆解的墻。繼續(xù)往前走,需要更強的模型、更穩(wěn)的系統(tǒng)、更嚴密的隱私邊界,也需要建立新的商業(yè)分配機制。
最重要的,是需要有對敢為人先的包容。
參考資料
晚點Latepost:《晚點獨家丨“豆包手機” 醞釀中,字節(jié)為大模型尋硬件載體》
21世紀經濟報道:《萬字詳解智能體:AI手機走“盲道”》
電廠:《“豆包手機”初戰(zhàn)遇阻,AI打不破互聯(lián)網(wǎng)生態(tài)壁壘》
中國企業(yè)家雜志:《豆包手機剛上線,就被微信淘寶“拉黑”了》

