大模型“瘦身”進(jìn)手機(jī) 下一個(gè)iPhone時(shí)刻將至?
一股“端側(cè)大模型”浪潮正在涌來(lái)。華為、高通等芯片巨頭正探索將AI大模型植入端側(cè),讓手機(jī)實(shí)現(xiàn)新一代物種進(jìn)化。
(資料圖片)
相比ChatGPT、Midjourney等AI應(yīng)用依賴(lài)云端服務(wù)器提供服務(wù),端側(cè)大模型主打在本地實(shí)現(xiàn)智能化。它的優(yōu)勢(shì)在于能夠更好地保護(hù)隱私,同時(shí)讓手機(jī)能通過(guò)學(xué)習(xí)成為用戶的私人智能助手,還不必?fù)?dān)心云端服務(wù)器宕機(jī)等問(wèn)題。
不過(guò),現(xiàn)有技術(shù)條件下,手機(jī)性能遠(yuǎn)不足以支撐大模型運(yùn)行。業(yè)內(nèi)主流的技術(shù)方案是,通過(guò)剪枝、量化、蒸餾來(lái)給大模型“瘦身”,在盡可能少地減損精度的前提下,降低它所需的資源和能耗。
高通已經(jīng)開(kāi)始研發(fā)用于端側(cè)大模型的芯片。這預(yù)示著,部署AI模型的手機(jī)終端正在向我們走來(lái)。
手機(jī)廠商將大模型引向移動(dòng)端
AI大模型正在從云端向智能終端狂奔。
8月4日,在2023年華為開(kāi)發(fā)者大會(huì)上,華為對(duì)外發(fā)布HarmonyOS 4,相比前幾代操作系統(tǒng),它最顯著的一大變化是,將AI大模型能力內(nèi)置在了系統(tǒng)底層。華為正在拉開(kāi)AI模型走向“智能終端側(cè)”的序幕。
目前,人們使用ChatGPT、Midjourney等AI應(yīng)用提供的服務(wù),基本都是通過(guò)云端服務(wù)器來(lái)完成。以ChatGPT為例,它背后的大模型和計(jì)算資源都存儲(chǔ)在遠(yuǎn)程服務(wù)器上,用戶通過(guò)與服務(wù)器實(shí)時(shí)交互,被輸入的文本經(jīng)服務(wù)器處理后,獲得返回響應(yīng)。這樣的好處在于,可以確保模型的高效穩(wěn)定運(yùn)行,因?yàn)榉?wù)器通常配置了強(qiáng)大的計(jì)算資源,而且可以隨時(shí)擴(kuò)展以適應(yīng)高負(fù)載。
如今,新的支持邏輯出現(xiàn)了。華為正在嘗試將大模型引入終端,這意味著上述所有工作都能在本地完成,手機(jī)系統(tǒng)本身就具備了一定的AI能力,不需要接入AI云端服務(wù),也能實(shí)現(xiàn)智能化升級(jí)。
華為常務(wù)董事、終端BG CEO余承東介紹,HarmonyOS 4由華為盤(pán)古大模型提供底層支持,希望給用戶帶來(lái)智慧終端交互、高階生產(chǎn)力效率、個(gè)性化服務(wù)的全新AI體驗(yàn)變革。
HarmonyOS 4引入了AI大模型
HarmonyOS 4的AI能力目前主要由華為智慧助手“小藝”體現(xiàn)。大模型接入后,小藝在語(yǔ)音交互的基礎(chǔ)上,擴(kuò)展了文字、圖片和文檔等多種形式的輸入,自然語(yǔ)言理解能力得到提升。小藝還能根據(jù)指令,連接多種服務(wù)和場(chǎng)景,比如自動(dòng)提取圖片文字,生成各類(lèi)商業(yè)電子郵件內(nèi)容或生成圖像等。
更重要的改變是,小藝具備了記憶和學(xué)習(xí)能力,隨著不斷使用,它將變得越來(lái)越懂“主人”,能夠智能給出出行、活動(dòng)計(jì)劃等方案,并根據(jù)根據(jù)用戶習(xí)慣,實(shí)現(xiàn)個(gè)性化推薦。華為透露,小藝這些新的能力,將在8月下旬開(kāi)啟公開(kāi)測(cè)試體驗(yàn)。
將AI大模型內(nèi)置于手機(jī)系統(tǒng)底層,華為希望借此全盤(pán)提升手機(jī)的智能化程度。雖然小藝的上述功能并不“高深”,但要實(shí)現(xiàn)起來(lái),用戶往往需要同時(shí)調(diào)用ChatGPT、Midjourney等眾多應(yīng)用才能完成。當(dāng)手機(jī)本身有了AI能力后,它就像一個(gè)更全能的助手,提供全面的服務(wù)。
在HarmonyOS 4發(fā)布之前,華為其實(shí)已經(jīng)嘗試過(guò)將AI大模型接入移動(dòng)終端。今年3月,華為發(fā)布P60手機(jī),其中自帶的智慧搜圖功能就是基于多模態(tài)大模型技術(shù),通過(guò)在手機(jī)側(cè)對(duì)模型做小型化處理,實(shí)現(xiàn)了手機(jī)端的自然語(yǔ)言模型運(yùn)行。
將AI模型引入端側(cè),華為并不是頭一家。在2023世界人工智能大會(huì)上,高通展示了大模型進(jìn)入端側(cè)的操作實(shí)踐,將生成式AI模型Stable Diffusion放在搭載了第二代驍龍8的手機(jī)上運(yùn)行,15秒內(nèi)執(zhí)行了20步推理,并生成了一張512x512像素的圖像,且圖像效果與云端處理水平相差并不明顯。
在上海MWC 2023期間,榮耀CEO趙明也表示,榮耀將在智能手機(jī)端推動(dòng)部署端側(cè)大模型,以此實(shí)現(xiàn)多模態(tài)自然交互、精準(zhǔn)意圖識(shí)別、復(fù)雜任務(wù)的閉環(huán)服務(wù)等體驗(yàn)。
備受矚目的還有蘋(píng)果,一個(gè)月前,蘋(píng)果被曝出正在秘密研發(fā)“Apple GPT”,它是一款基于蘋(píng)果自研的Ajax框架開(kāi)發(fā)的人工智能工具。盡管具體的細(xì)節(jié)尚有待披露,但業(yè)內(nèi)普遍猜測(cè),蘋(píng)果很可能在系統(tǒng)層加入大模型,提升提升語(yǔ)音助手Siri的智力,讓Siri摘掉“人工智障”的帽子。
炒作還是新革命?
手機(jī)廠商盯上大模型不稀奇,但為啥他們要走“端側(cè)”路線?畢竟,華為小藝的交互、生成能力通過(guò)云端服務(wù)器也能提供,而且看起來(lái)成本更經(jīng)濟(jì)、技術(shù)實(shí)現(xiàn)更容易。
把AI大模型裝進(jìn)智能移動(dòng)端,是炒作還是確實(shí)有其必要性?在這一問(wèn)題上,無(wú)論是余承東還是趙明,都提到了兩個(gè)關(guān)鍵詞:隱私安全和個(gè)性化。
余承東強(qiáng)調(diào),華為主張所有AI體驗(yàn)創(chuàng)新和場(chǎng)景設(shè)計(jì)的第一原則是安全與隱私保護(hù),打造更負(fù)責(zé)任的AI,并承諾AI生成的內(nèi)容都會(huì)進(jìn)行標(biāo)識(shí)。
相比在云端處理數(shù)據(jù),智能終端側(cè)最明顯的優(yōu)勢(shì)在于隱私安全。此前,ChatGPT屢次陷入數(shù)據(jù)泄露風(fēng)波。今年3月,三星在內(nèi)部發(fā)布了ChatGPT使用禁令,起因是半導(dǎo)體員工疑似因使用ChatGPT泄露了公司機(jī)密;上個(gè)月,ChatGPT背后公司OpenAI及其股東微軟被16人匿名起訴,控訴他們?cè)谖唇?jīng)允許的情況下使用并泄露了個(gè)人隱私數(shù)據(jù),索賠金額高達(dá)30億美元。
當(dāng)數(shù)據(jù)處理都在端側(cè),用戶的個(gè)人數(shù)據(jù)將不會(huì)上傳至云端服務(wù)器,大幅降低了隱私泄露風(fēng)險(xiǎn)。這也為手機(jī)AI助手真正變成生活管家提供了先決條件——只有隱私得到保障,用戶才會(huì)放心將數(shù)據(jù)交給AI去學(xué)習(xí)。
在趙明的理解中,端側(cè)AI大模型的使命就是更好地理解用戶,“知道我?guī)c(diǎn)睡覺(jué),知道我喜歡吃什么,能解決我的即時(shí)需求,相當(dāng)于擁有洞察我需求的能力。”而要做到這些,就需要AI基于用戶的個(gè)人數(shù)據(jù)和習(xí)慣進(jìn)行訓(xùn)練,最終智能手機(jī)將有希望成為全能助手,或者說(shuō)是私人機(jī)器人秘書(shū),能夠幫助用戶解決餐飲、訂票、咨詢、娛樂(lè)、辦公等多場(chǎng)景的需求。
相比之下,無(wú)論是ChatGPT還是其他主流的AI應(yīng)用,都是標(biāo)準(zhǔn)化產(chǎn)品,在不加改造的情況下很難具備私人助手的能力,它并不了解用戶,只是根據(jù)用戶的輸入指令做出相應(yīng)的回應(yīng)。個(gè)人手機(jī)已經(jīng)是一個(gè)私有的個(gè)人智能設(shè)備,如果理解人類(lèi)語(yǔ)言的AI模型能跑在手機(jī)上,智能化程度無(wú)疑將得到大提升。
另外,依賴(lài)云端的應(yīng)用也存在不穩(wěn)定性,比如由于網(wǎng)絡(luò)或服務(wù)器原因,云端的響應(yīng)速度可能會(huì)變慢,甚至干脆宕機(jī),這在ChatGPT上已經(jīng)出現(xiàn)多次,本地化的大模型將大大削弱對(duì)云端的依賴(lài),從而避免“云卡頓”。
基于上述特點(diǎn),大模型的“端側(cè)革命”展現(xiàn)出了潛力,甚至有希望讓進(jìn)入發(fā)展瓶頸多年的手機(jī)再來(lái)一次激動(dòng)人心的物種進(jìn)化,就像當(dāng)年大屏智能手機(jī)的出現(xiàn)以及iPhone發(fā)布時(shí)刻一樣。
但大模型想在手機(jī)端發(fā)揮實(shí)力存在一個(gè)顯而易見(jiàn)的問(wèn)題:手機(jī)芯片頂?shù)米??由于大模型?dòng)輒包含上百億、千億的參數(shù),且需要天文級(jí)的訓(xùn)練,消耗龐大的算力,現(xiàn)有手機(jī)芯片的性能顯然無(wú)法滿足要求。
對(duì)此,業(yè)內(nèi)目前較主流的解決方案是“模型小型化”。
簡(jiǎn)單來(lái)說(shuō),當(dāng)模型網(wǎng)絡(luò)結(jié)構(gòu)確定后,在盡可能少地降低精度的前提下,給模型“瘦身”,從而降低它所需的資源和能耗。這一過(guò)程通常有三步,將模型中對(duì)精度影響非常小的參數(shù)裁剪掉,被稱(chēng)為“剪枝”;使用更低精度的數(shù)據(jù)類(lèi)型進(jìn)行推理,行話叫“量化”;而從復(fù)雜的模型中,提取出效果相近但更加簡(jiǎn)單的模型,被形象地稱(chēng)作“蒸餾”。最終目的,都是為了減小模型體積。
另一方面,高通等芯片廠商,也在針對(duì)AI大模型端側(cè)部署研發(fā)專(zhuān)用的芯片。此前,高通5G移動(dòng)平臺(tái)驍龍8 Gen2首度集成的AI專(zhuān)用Hexagon處理器,采用了獨(dú)立的專(zhuān)用供電系統(tǒng),支持微切片推理、INT4精度和Transformer網(wǎng)絡(luò)加速等,能在提供更高性能的同時(shí),降低能耗和內(nèi)存占用。
端側(cè)大模型正在掀起新一代智能終端革命。IDC預(yù)測(cè),到2026年,中國(guó)市場(chǎng)中近50%的終端設(shè)備的處理器將帶有AI引擎技術(shù)。AI帶給人類(lèi)科技生活的又一個(gè)巨變或?qū)⒊霈F(xiàn)。
標(biāo)簽:
搶先讀
- 國(guó)家發(fā)展改革委認(rèn)定新一批國(guó)家企業(yè)技術(shù)中心 博泰車(chē)聯(lián)網(wǎng)等8家上海企業(yè)上榜
- 周鴻祎:安全企業(yè)不能只想賣(mài)貨,未來(lái)靠服務(wù)業(yè)“說(shuō)話”
- 【環(huán)球新視野】新蔡縣棠村鎮(zhèn)召開(kāi)耕地和永久基本農(nóng)田劃定成果核實(shí)處置工作會(huì)
- 新蔡縣法院:細(xì)算“經(jīng)濟(jì)賬” 化解“氣官司” 世界動(dòng)態(tài)
- 大模型“瘦身”進(jìn)手機(jī) 下一個(gè)iPhone時(shí)刻將至?
- 房屋安全如何保障?住建部:擬建 “房屋養(yǎng)老金”
- 新蔡縣人民法院“護(hù)民生、優(yōu)環(huán)境”2023年第十三次集中執(zhí)行活動(dòng)持續(xù)發(fā)力_每日視訊
- 推進(jìn)全環(huán)境立德樹(shù)人 加強(qiáng)未成年人思想道德建設(shè)
- 平輿縣楊埠鎮(zhèn):致富西瓜產(chǎn)業(yè) 鋪好“鄉(xiāng)村振興路”|焦點(diǎn)要聞
- 天天熱點(diǎn)評(píng)!?農(nóng)行信陽(yáng)勝利路直屬支行:銀行服務(wù)無(wú)小事 零幣兌換暖人心
- 新蔡縣陳店鎮(zhèn):預(yù)防電信詐騙工作宣講 時(shí)刻繃緊防范之弦
- 新蔡縣磚店鎮(zhèn)積極開(kāi)展“反詐我先行”主題宣傳活動(dòng)培訓(xùn)會(huì)
- 駐馬店開(kāi)發(fā)區(qū)開(kāi)源辦事處開(kāi)展提升公眾安全感宣傳活動(dòng)
- 河南省生態(tài)環(huán)境廳專(zhuān)家組到遂平縣調(diào)研“美麗河湖”創(chuàng)建工作 全球快資訊
- 【環(huán)球速看料】新蔡縣磚店鎮(zhèn)開(kāi)展食品安全大檢查
- 環(huán)球熱訊:?羅山縣廟仙鄉(xiāng):貼心服務(wù),幫助困難學(xué)子圓夢(mèng)大學(xué)
- 世界滾動(dòng):?河南新縣:夏日黃毛尖 云海美如畫(huà)
- 江蘇:除南京、蘇州市區(qū)外擬全面取消落戶限制政策
- 黑龍江省臺(tái)辦募集30萬(wàn)元生活物資送洪澇災(zāi)區(qū)
- 今夜調(diào)油價(jià)!加一箱油將多花約9.5元
- 臺(tái)風(fēng)“卡努”“蘭恩”共舞,互相影響還是各走各的
- 美媒:美向?yàn)踉傤~已超662億美元
- 鐵路上海站官方微博,收到一條特殊的求助……
- 天津市藥監(jiān)局:深入開(kāi)展藥品安全鞏固提升行動(dòng) 全面系統(tǒng)排查治理各類(lèi)風(fēng)險(xiǎn)隱患
- 光伏板下種菌菇 江西廣昌“農(nóng)光互補(bǔ)”照亮鄉(xiāng)村振興路
- 中穎電子(300327.SZ):公司在研的MCU主要是32位元的產(chǎn)品
- (空×胡桃)抱著胡桃抱枕被胡桃本人看見(jiàn)了之后……(上)
- 吉林四名大學(xué)生自費(fèi)購(gòu)買(mǎi)2500余件礦泉水 駕車(chē)11小時(shí)護(hù)送至災(zāi)區(qū)
- 8月9日華南地區(qū)順酐市場(chǎng)行情下行
- 孟達(dá)是誰(shuí)的部下(孟達(dá)是誰(shuí))
- 鎮(zhèn)平縣人大常委會(huì)對(duì)林業(yè)局開(kāi)展工作評(píng)議
- 兩部門(mén):北京吉林四川等地部分地區(qū)發(fā)生地質(zhì)災(zāi)害的氣象風(fēng)險(xiǎn)較高
- 8月9日泰盛化工糠醇價(jià)格整理
- 蘇試試驗(yàn):上半年歸母凈利潤(rùn)1.36億元,同比增27.82%,設(shè)備銷(xiāo)售增長(zhǎng)明顯
- 8月9日金誠(chéng)石化石腦油價(jià)格平穩(wěn)
- 國(guó)家發(fā)改委等10部門(mén)印發(fā)《國(guó)家基本公共服務(wù)標(biāo)準(zhǔn)(2023年版)》
- 8月9日山東地區(qū)順酐市場(chǎng)行情下行
- 國(guó)管公積金:2023住房公積金年度月繳存基數(shù)上限為33891元
- 8月9日中馳新材料石油焦價(jià)格平穩(wěn)
- 阿拉丁: 西部證券股份有限公司關(guān)于上海阿拉丁生化科技股份有限公司2022年度持續(xù)督導(dǎo)工作現(xiàn)場(chǎng)檢查報(bào)告
- 7月我國(guó)中小企業(yè)發(fā)展指數(shù)繼續(xù)回升 專(zhuān)家解讀→
- 在ppt中加入視頻的格式(在ppt中加入視頻)
- 2023天津海河游船演出季演出兒童可以看嗎?
- 普京向俄杜馬提交法律草案,提議進(jìn)入戰(zhàn)時(shí)狀態(tài)無(wú)需再向歐洲委員會(huì)通報(bào)
- “兩高”聯(lián)合發(fā)布環(huán)境污染犯罪司法解釋 調(diào)整污染環(huán)境罪定罪量刑標(biāo)準(zhǔn)
- 資陽(yáng):做優(yōu)項(xiàng)目審批服務(wù) 打造一流營(yíng)商環(huán)境
- 中銀證券:預(yù)計(jì)CPI同比增速下半年有望波動(dòng)上行
- 譚雅玲:7月份民企外貿(mào)貢獻(xiàn)率達(dá)52.9%,我國(guó)與中亞五國(guó)貿(mào)易增長(zhǎng)35%
- PPI和CPI底將先后形成
- 優(yōu)酷注冊(cè)妙鴨相機(jī)商標(biāo)
- 從難點(diǎn)堵點(diǎn)出發(fā) 深化人臉信息保護(hù)
- 多管齊下提高居民可支配收入
- 我的世界信標(biāo)怎么激活最高級(jí)效果(我的世界信標(biāo))
- 融信中國(guó)(03301.HK)前七個(gè)月合約銷(xiāo)售額人民幣107.36億元
- 25國(guó)駐華使節(jié)參訪新疆紀(jì)事 | 蘇里南駐華大使張碧芬:我看到他們?nèi)绾螌鹘y(tǒng)與現(xiàn)代融合在一起
- 新消費(fèi)觀察丨Z世代年輕人下單代找理由“婉拒”無(wú)效社交:相親脫身、逃離聚會(huì)…
- 市場(chǎng)監(jiān)管總局:全面開(kāi)展汛期食品安全隱患風(fēng)險(xiǎn)排查
- 理想的雄心與摯肘:李想放言明年銷(xiāo)量超越BBA
- 新經(jīng)濟(jì)觀察丨一個(gè)月賣(mài)出近4萬(wàn)單,江蘇沭陽(yáng)姐弟倆賣(mài)火單品遮陽(yáng)網(wǎng)
- 買(mǎi)中南·智慧城二手房都要注意什么?
- 首個(gè)氫能標(biāo)準(zhǔn)建設(shè)指南出臺(tái),豪森股份已實(shí)現(xiàn)燃料電池產(chǎn)線全布局
- 圣暉集成業(yè)績(jī)快報(bào):上半年凈利7706.76萬(wàn)元 同比增21.88%
- 浙商證券(601878.SH):控股股東及其一致行動(dòng)人累計(jì)減持公司可轉(zhuǎn)債756萬(wàn)張
- “紅色物業(yè)”進(jìn)小區(qū)
- 對(duì)話潘向東:活躍資本市場(chǎng)“工具箱”豐富 T+0有優(yōu)先推出基礎(chǔ) |首席看市
- 有酒店書(shū)店還有托兒所!這家廣州互聯(lián)網(wǎng)企業(yè)“筑巢引鳳”|現(xiàn)場(chǎng)+料
- 索尼PlayStation 5主機(jī)第一財(cái)季銷(xiāo)量達(dá)到330萬(wàn)臺(tái)
- 過(guò)敏多發(fā) “元兇”就在身邊新華網(wǎng)
- 多主力現(xiàn)身龍虎榜,京能置業(yè)跌停(08-09)
- 底盤(pán)零件股票概念有哪些?底盤(pán)零件股票一覽
- 兒童健康智能與綠色生態(tài)圈融合發(fā)展高峰論壇隆重舉行
- 中國(guó)34歲老將惹爭(zhēng)議!張帥1-2被逆轉(zhuǎn),遭16連敗,球迷怒批快退役
- 今天見(jiàn)證歷史!一天10倍 最強(qiáng)新股盤(pán)中暴漲3700%
- 同和藥業(yè):公司獲得歐洲藥典適應(yīng)性證書(shū)
- 長(zhǎng)華集團(tuán):收到國(guó)內(nèi)車(chē)企項(xiàng)目定點(diǎn)通知書(shū)
- 鄭州高新區(qū)契稅補(bǔ)貼在哪里申報(bào)???需要帶什么材料?
- 中疾控:7月中國(guó)內(nèi)地新增猴痘確診491例,專(zhuān)家解讀為何增加這么多
- 廣達(dá)7月?tīng)I(yíng)收同比減少32.9%
- 《匹諾曹的謊言》開(kāi)發(fā)已正式完成 9月19日如期發(fā)售
- 三星新拍攝模式曝光 可折疊手機(jī)將帶新功能
- 宋朝和明朝之間相距不到100年,為什么給人一種恍如隔世的感覺(jué)!
- 紅旗C801:華麗登場(chǎng),挑戰(zhàn)奔馳S級(jí)的高端座駕!
- 如何與財(cái)會(huì)監(jiān)督貫通協(xié)作?山東省審計(jì)廳:深度融合、財(cái)審互動(dòng)、系統(tǒng)施治
- ISC 2023 之中小微數(shù)字安全云論壇即將召開(kāi) 業(yè)界將探討數(shù)字轉(zhuǎn)型新思路
- 公安部:各地出動(dòng)警力80.5萬(wàn)人次做好防汛救災(zāi)工作
- 輕薄無(wú)短板折疊旗艦!雷軍:小米MIX Fold 3轉(zhuǎn)軸突破性創(chuàng)新
- 油市依舊上行趨勢(shì),維持高位震蕩走勢(shì)
- 王毅將訪問(wèn)新加坡、馬來(lái)西亞和柬埔寨
- 江蘇新潮村:三代村居“同框”,道出振興“密碼”
- 青春與夢(mèng)想齊飛!蘇州金龍圓滿護(hù)航成都大運(yùn)會(huì)
- 8月9日鋅現(xiàn)期收盤(pán)行情
- 國(guó)內(nèi)商品期貨收盤(pán)漲多跌少 豆一等漲超2%
- 8月9日揚(yáng)州實(shí)友苯酚價(jià)格下調(diào)
- 河南醫(yī)科大學(xué)學(xué)院(河南醫(yī)科大學(xué)官網(wǎng))
- 8月第一周巴西出口玉米1318771噸
- 8月9日焦煤期貨行情上漲
- 內(nèi)蒙古大興安嶺林區(qū)發(fā)生森林火災(zāi) 正在緊張撲救
- 人臉識(shí)別技術(shù)應(yīng)用安全管理規(guī)定征求意見(jiàn):使用人臉識(shí)別應(yīng)取得個(gè)人同意
- 南京穩(wěn)樓市出實(shí)招:發(fā)放新房補(bǔ)貼 建立“安置房源超市”
- 回顧中國(guó)男網(wǎng)尷尬時(shí)刻,你會(huì)發(fā)現(xiàn),現(xiàn)在的球迷很幸福(二)