背靠智能語音助手,大模型在手機上的競爭已經(jīng)開始。
在華為開發(fā)者大會2024上,華為相關(guān)負責人介紹了智能語音助手小藝接入盤古大模型能力后的表現(xiàn)。小藝可以與用戶語音交互,進行手機應(yīng)用間的協(xié)作,減少了此前業(yè)內(nèi)語音助手普遍具有的機械感。這與蘋果語音助手Siri將進行的更新頗有相似之處。
蘋果此前已在WWDC開發(fā)者大會上推出了與AI相關(guān)的更新,包括推出Apple Intelligence套件,該套件深度整合進蘋果產(chǎn)品中,可設(shè)置置頂推送等功能,適用于搭載A17 Pro芯片的手機和搭載M系列芯片的設(shè)備。蘋果還與OpenAI合作,蘋果將采用GPT-4o,蘋果用戶在不創(chuàng)建賬戶的情況下可免費使用ChatGPT。
AI時代的手機范式,已經(jīng)在用戶端展示出了冰山一角,而在蘋果Siri“換腦”接入GPT ,華為小藝靠盤古能扳回一局嗎?
蘋果之后又一個智能語音助手更新
華為開發(fā)者大會2024上,華為常務(wù)董事、終端BG董事長、智能汽車解決方案BU董事長余承東回顧了華為在端側(cè)AI方面的布局,包括2017年發(fā)布的搭載麒麟芯片的Mate 10手機在業(yè)界首次支持mobile(移動)AI。一開始,手機AI功能包括相機拍照增強和AI翻譯等,后續(xù)華為走向個人終端AI化,支持語音、視頻等能力,近兩年隨著產(chǎn)業(yè)進入大模型時代,小藝搭載的大模型變得更強大。
大模型基礎(chǔ)能力上,華為常務(wù)董事、華為云CEO張平安發(fā)布了盤古大模型5.0,包括面向跨領(lǐng)域多任務(wù)場景的萬億級參數(shù)Pangu S系列,適用于處理復(fù)雜任務(wù)的千億級參數(shù)Pangu U系列,面向低時延、低成本推理場景的百億級參數(shù)Pangu P系列以及支撐手機、PC等端側(cè)智能應(yīng)用的十億級參數(shù)Pangu E系列。華為云盤古大模型聚焦行業(yè)應(yīng)用,手機是應(yīng)用領(lǐng)域之一,小藝背后有盤古大模型5.0能力支撐。
大模型能力支撐下,小藝記憶能力有所增強,支持23類常用記憶類型,可以基于記憶自動填寫各種表格。此外,小藝也有更高的推理規(guī)劃能力,掌握萬億token的知識量。華為此次介紹的小藝功能,則與蘋果Siri將推出的新功能頗有相似性。
小藝的功能包括,可識別和處理文字、圖片等素材,例如一鍵生成表格、摘要、創(chuàng)建日程等。同時,小藝可在不同應(yīng)用間協(xié)作。例如,收到一個團建郵件后可以跟小藝說導(dǎo)航去這個地方,而不需重復(fù)說目的地,小藝便可規(guī)劃路線。跟小藝說將某日的日程安排短信發(fā)給某人,小藝就會從日歷中調(diào)取相應(yīng)安排并發(fā)送短信,而不需人為查詢操作。
蘋果此前推出Apple Intelligence個人智能系統(tǒng)并更新Siri功能,Siri也有相似的多模態(tài)能力,包括根據(jù)用戶描述搜索圖片并從圖片中提取相應(yīng)信息。蘋果此前重點介紹的Siri功能也包括不同應(yīng)用間協(xié)作和上下文理解能力。例如,當用戶詢問某地天氣后可要求Siri為該地的活動設(shè)置日程,而無需再強調(diào)地點,當朋友發(fā)來地址時,可直接要求Siri將地址加入朋友名片。
蘋果和華為先后推出更新,或意味著這種與語音助手更自然的交互方式,以及語音助手對應(yīng)用程序的調(diào)度能力,將是大模型給手機帶來的最主要改變之一。此外,蘋果和華為都以幾十億參數(shù)級別的大模型支持端側(cè)AI應(yīng)用,一定程度上避開數(shù)據(jù)上傳至外部服務(wù)器或公有云上的隱私泄露隱患。
據(jù)蘋果此前發(fā)布的大模型技術(shù)文檔,Apple Intelligence包含一個約30億參數(shù)的端側(cè)模型和一個云端模型,后者通過私有云計算并在Apple芯片服務(wù)器上運行,而不在公有云上。華為Pangu E系列也是十億級參數(shù)大模型,鴻蒙原生智能采用模型本地化的方式,不讓敏感數(shù)據(jù)上云。記者從手機業(yè)內(nèi)人士了解到,考慮到端側(cè)算力,目前適合在手機端側(cè)運行的大模型正是在幾十億參數(shù)級別。
手機端側(cè)AI是否有其他可能
除了通過本地部署模型支持語音助手等功能外,大模型在手機上應(yīng)用的其他路徑,似乎并未十分清晰。
除了在本地運行的端側(cè)大模型,此前蘋果還宣布iPhone將接入ChatGPT。ChatGPT由OpenAI開發(fā),微軟則是OpenAI的云供應(yīng)商。在用戶同意的情況下,ChatGPT可接入Siri,為用戶提供問答等服務(wù),蘋果承諾使用ChatGPT時用戶請求和信息不會被記錄。但外界對此做法并不都持贊許態(tài)度。特斯拉CEO馬斯克便質(zhì)疑用戶將數(shù)據(jù)交給蘋果的隱私風險,認為蘋果將用戶數(shù)據(jù)交給第三方人工智能公司的做法沒有保護用戶隱私。
是否接入第三方人工智能公司在外部服務(wù)器上運行的大模型,這可能是手機廠商面臨的一個難題。如果不接入外部大模型,本地運行的模型能力始終有限。而如果讓手機廠商自研能力能與ChatGPT最先進版本媲美的大參數(shù)模型并讓大模型在私有云上運行,似乎也不太現(xiàn)實。
目前手機廠商對于端側(cè)AI應(yīng)用形態(tài)還在探索中。一名國內(nèi)手機行業(yè)從業(yè)者告訴記者,公司正在研發(fā)大模型,但自研大模型還不能很快滿足所有業(yè)務(wù)需求,其所在的部門正在嘗試與外部大模型廠商合作,要求將外部閉源大模型運行在公司自有的服務(wù)器上,避免用戶數(shù)據(jù)泄露。
另有海外手機品牌員工告訴記者,公司自研的大模型偏重端側(cè)使用體驗,與外部大模型公司的側(cè)重點不同。為了有更豐富的AI體驗,未來接入外部公司的大模型是可能的,可能會以智能體的形式體現(xiàn),但與外部大模型公司合作的模式目前還在摸索階段。
除蘋果和華為,目前主要手機廠商也在發(fā)力端側(cè)AI。去年11月,vivo發(fā)布自研通用大模型矩陣藍心大模型,包含十億、百億、千億三個參數(shù)量級。今年1月,榮耀Magic6系列旗艦手機搭載榮耀自研70億參數(shù)端側(cè)平臺級AI大模型“魔法大模型”。今年5月,小米大語言模型MiLM通過大模型備案,將逐步應(yīng)用于小米汽車、手機、智能家居等產(chǎn)品。
據(jù)市場研究機構(gòu)Canalys預(yù)測,今年AI 手機出貨量預(yù)計占全球智能手機出貨量的16%,2028年這一比例預(yù)計為54%。