快資訊丨輕量化小模型興起,中小企業(yè)也能搭上AI“快車”
近兩年,人工智能快速發(fā)展迭代,大語言模型如雨后春筍般涌現(xiàn),文本生成、文生圖、語音處理、代碼處理、視頻處理等生成式人工智能走進人們的生活。同時,一些企業(yè)開始發(fā)力研發(fā)可在電腦、手機端訓練的輕量化小模型。
“我們需要高鐵、飛機、游輪等大型交通工具,也需要私家轎車、公交車,以及摩托車、自行車等小型交通工具。因為在不同場景下,不同人群有不同需求。”在青島自然語義公司聯(lián)合創(chuàng)始人、首席架構師孫燕群看來,滿足特定市場的需求,是專而精的小模型興起的重要原因及其存在的價值。
今年3月,自然語義研發(fā)的Euler模型通過中央網(wǎng)信辦生成式人工智能服務備案。不同于大模型動輒千億級的參數(shù)量,Euler的參數(shù)量只有2.5B(25億),是典型的輕量化小模型。相較于大模型,小模型有何特點?應用前景如何?記者對此進行了采訪。
【資料圖】
低成本、易調試的端側小模型興起
關于小模型,目前并沒有明確定義。孫燕群表示,在行業(yè)內,參數(shù)量低于100B的模型就算比較小的模型。在實際應用時,要想在筆記本電腦端實現(xiàn)微調,模型參數(shù)量一般在3B左右。
相較大模型,小模型在算力消耗、使用成本方面更具優(yōu)勢。具體來說,一是訓練和推理所需的硬件資源較少,使得成本較低;二是使用更便捷,可在手機、電腦、物聯(lián)網(wǎng)設備等計算場景中實時運行;三是結構簡單,開發(fā)者能快速定位問題,易于調試。
記者了解到,隨著大模型的比拼日益激烈,一些企業(yè)開始押注小模型。2024年8月,微軟和英偉達就相繼發(fā)布過小型語言模型。國內不少企業(yè)也開始研發(fā)在“斷網(wǎng)、弱網(wǎng)”環(huán)境下,讓各種智能終端具備自主思考能力的端側小模型。例如,在今年3月舉辦的中關村論壇年會期間,北京的面壁智能公司就發(fā)布了應用于汽車智能座艙的純端側超級智能助手。今年1月,廣東佛山移動牽頭聯(lián)合40家單位成立佛山市AI小模型產(chǎn)業(yè)聯(lián)合體,致力于通過人工智能小模型提供個性化服務,助力企業(yè)完成智能化升級。
“小模型讓我們實現(xiàn)了與科技巨頭們的錯位競爭。”提到小模型的具體應用場景,孫燕群舉例說,Euler通過備案后,已經(jīng)開始面向中小企業(yè)和個人用戶提供服務。如與山東某市級檔案館合作,上線了檔案模型;與青島當?shù)匾患覂x器儀表設備公司合作,開發(fā)了內網(wǎng)技術相關的模型。
退而求其次后的“主動作為”
“客觀來說,大模型的能力強于小模型,一個參數(shù)量2.5B的模型無論如何都不可能超過200B模型的算力。”孫燕群直言,這也是大公司都在做千億級模型的原因。模型小,神經(jīng)網(wǎng)絡參數(shù)就少,容納的知識量不夠,“體現(xiàn)在文本生成上,就是容易出現(xiàn)上下文不連貫的情況”。
自然語義最初的目標并不是小模型。2019年底,該公司考慮要做大模型,但由于發(fā)展方向不明朗,同時在購買高算力GPU上面臨資金和貨源壓力,因此未能實施。
“沒想到,僅過了兩年時間,國外的大模型就發(fā)布了。”孫燕群回憶說,后來隨著越來越多大企業(yè)涌入大模型賽道,作為基礎硬件的高算力GPU價格水漲船高。“那段時間,聽說哪里有GPU,我們就坐飛機去買,常常是提前交了定金也不一定能買到。”最終,公司用10多臺設備組成一個算力集群,能支撐做出7B參數(shù)的模型。
為了在現(xiàn)有設備基礎上盡可能提高參數(shù),自然語義公司工程師經(jīng)過頭腦風暴,想出了新的分詞方式,以及將向量計算從實數(shù)空間轉換到復空間等各種辦法。“經(jīng)過模型訓練,這些技術都達到了比較好的效果,能讓一個3B參數(shù)的模型,達到了150B參數(shù)模型60%左右的能力。”孫燕群表示。
中國信息通信研究院人工智能研究所副總工程師王蘊韜告訴記者,小模型之所以能在“瘦身”后仍保持可觀性能,得益于一系列成熟的模型壓縮與高效架構技術,包括剪枝、量化、知識蒸餾、設計先天高效的網(wǎng)絡架構等。
讓“小身材”跑出“大能量”
“小模型發(fā)展大有可為。”在王蘊韜看來,未來面向特定應用場景的小模型,潛力將會進一步釋放。以AI終端為代表的應用形態(tài)及產(chǎn)品服務,將成為小模型釋放大能力的主戰(zhàn)場。
關于小模型的應用前景,王蘊韜進一步解釋,一是為離線辦公、文檔摘要、私密對話等場景鋪平道路;二是隨著處理器架構和神經(jīng)處理單元技術的應用,手機、車載和物聯(lián)網(wǎng)設備將成為小模型的天然舞臺;三是在垂直領域與“專精特新”行業(yè),如金融、醫(yī)療、法律、教育等已出現(xiàn)6B及以下參數(shù)的定制模型,成本低、上線快,可在特定任務上反超通用大模型。
“市場關心的是能否解決實際問題,不關心背后模型細節(jié),能夠與場景深度結合,擁有行業(yè)知識,尤其是可信的小模型至關重要。”王蘊韜說。
從用戶端來看,在實際應用中,小模型的性價比優(yōu)勢也十分明顯。北京某互聯(lián)網(wǎng)公司算法工程師張先生向記者表示,在現(xiàn)有技術條件下,想要在本地部署大模型存在一定難度。“專業(yè)GPU芯片價格太高,無法應用到低價格的終端上,如手機、機器人等配備的芯片就無法撐起大模型。另外,這些終端所配備的電池,往往也支撐不了高性能芯片的耗電等。”張先生表示,這些硬件性能有限的終端,更適合小模型施展。
王蘊韜分析認為,未來將是大小模型混合的系統(tǒng)范式。“云端大模型負責通用推理,端側小模型承擔即時響應與私域數(shù)據(jù)處理。”他還強調,小模型并非“大模型的低配版”,而是面向資源受限環(huán)境與專用任務的高性價比解法。通過配合端云混合部署和行業(yè)數(shù)據(jù)精調,企業(yè)完全可以讓“小身材”跑出“大能量”,在AI商業(yè)落地的下一程中獲得確定性收益。
標簽:
搶先讀
- 快資訊丨輕量化小模型興起,中小企業(yè)也能搭上AI“快車”
- 熱門看點:網(wǎng)購商品退貨遭拒 “商品完好”責任誰擔
- 【時快訊】網(wǎng)購商品退貨遭拒 “商品完好”責任誰擔
- 2025年全國快遞業(yè)務量突破1000億件-當前資訊
- 洪水過后,這些飲食安全問題要警惕
- 精選!西藏吉隆山洪失聯(lián)人員搜救工作持續(xù)進行中
- 福建廣東等地有強降雨 華北四川盆地等地有分散性強降雨 動態(tài)焦點
- 《行政區(qū)劃代碼管理辦法》出臺 如何影響你我 熱點
- 應聘“中招”?這份求職防騙指南請查收
- 香格里拉秘境尼汝的新生活|焦點日報
- 焦點熱議:福建廣東等地有強降雨 華北四川盆地等地有分散性強降雨
- 韓國旅行商深度考察三亞:“海南對韓國游客有很大吸引力”-百事通
- 別被“白幼瘦”審美帶偏 超七成受訪青年力挺“自然美”
- 訊息:嫦娥六號月球樣品最新研究成果發(fā)布 為人類首次揭開月背演化史
- 當前熱訊:注意防范!北京市氣象臺發(fā)布暴雨藍色預警
- 海外華媒甘南行:拉卜楞寺保護有新章-即時焦點
- 防臺風“丹娜絲” 多部門多舉措?yún)f(xié)同配合 筑牢安全防線 守護群眾安全
- 網(wǎng)絡用語“屮艸芔茻”是什么意思?屮艸芔茻怎么讀? 最資訊
- 快播:為i做e是什么梗?為i做e是什么意思?
- 嘉禾望崗是什么意思?嘉禾望崗是什么梗?-速看料
- R星是什么梗?R星出品必屬精品什么梗?
- 能蟲李白是什么梗?能蟲李白是什么意思?|焦點報道
- 每日速訊:盲蟲是什么意思?盲蟲是什么梗?
- 水利部針對廣東啟動洪水防御Ⅳ級應急響應
- 文化中國行丨風從尼山來
- 文化中國行丨風從尼山來_熱消息
- (活力中國調研行)寶雞生物育種實驗室“定制”優(yōu)苗 為種子裝上“科技芯”-視焦點訊
- 臺灣科技大學師生一行到新疆參訪交流-今日訊
- 不斷嘗試新技術 新疆棉田中“成長”出勞動模范
- 福建終止防臺風應急響應并維持防汛Ⅲ級應急響應-熱議
- (活力中國調研行)寶雞生物育種實驗室“定制”優(yōu)苗 為種子裝上“科技芯”
- 最新資訊:四川宜賓山體滑坡失聯(lián)人員獲救
- 四川宜賓山體滑坡失聯(lián)人員獲救
- 海外華裔大學生海南研習行:在火山風情中感受鄉(xiāng)村振興 看熱訊
- 最資訊丨寧夏農(nóng)業(yè)農(nóng)村志出版發(fā)行
- 云南昭通遭遇特大暴雨 緊急轉移7000余名群眾
- 云南昭通遭遇特大暴雨 緊急轉移7000余名群眾
- 微頭條丨云南昭通遭遇特大暴雨 緊急轉移7000余名群眾
- 民政部:二季度加大民生保障力度 各困難群體服務持續(xù)提升
- 當前熱議!“變種”電子煙網(wǎng)絡售賣 專家建議壓實電商平臺責任
- 旅游列車加密開行 激活文旅消費潛能 今日熱文
- “變種”電子煙網(wǎng)絡售賣 專家建議壓實電商平臺責任 今日熱議
- 當前看點!如何選購安全放心的充電寶?市場監(jiān)管部門給你支招
- 焦點速遞!北京多家博物館調整暑期開放時間 錯峰延時開放成亮點
- 北京多家博物館調整暑期開放時間 錯峰延時開放成亮點 觀熱點
- 每日快訊!馬路地釘成“暗器”易絆腳傷人 殘留地釘安全隱患調查
- “夏日爆款”訂單激增 這款太陽能風扇帽席卷海外市場
- 當前熱訊:三部門:鼓勵各地區(qū)對零碳園區(qū)建設給予資金支持
- 天舟八號貨運飛船已受控再入大氣層|最新資訊
- “沒事!踩我背上!”西藏吉隆口岸遭遇山洪 警察以背為“橋”安全轉移一名孕婦
- 被指文創(chuàng)產(chǎn)品“不尊重歷史”?上海博物館回應
- “沒事!踩我背上!”西藏吉隆口岸遭遇山洪 警察以背為“橋”安全轉移一名孕婦
- 每日關注!中新人物 | 麥子熟了,仁德的兒回家了
- 每日看點!自主品牌霸榜 新能源車領跑上半年車市
- 報道:房地產(chǎn)代建市場規(guī)模持續(xù)擴大 頭部企業(yè)加速落子
- 資訊:自主品牌霸榜 新能源車領跑上半年車市
- 2025年高等學歷繼續(xù)教育擬招生專業(yè)和校外教學點公布
- 最新:(尋味中華|非遺)潮州木雕:伴潮水而生,隨潮商出海
- 【焦點熱聞】自主品牌霸榜 新能源車領跑上半年車市
- 2025年6月全國受理網(wǎng)絡違法和不良信息舉報1849.6萬件
- 每日短訊:2025年高等學歷繼續(xù)教育擬招生專業(yè)和校外教學點公布
- 【新要聞】2025年6月全國受理網(wǎng)絡違法和不良信息舉報1849.6萬件
- 微速訊:(鄉(xiāng)村行·看振興)“江南吐魯番”湖北公安:小葡萄串起大產(chǎn)業(yè)
- (鄉(xiāng)村行·看振興)“百草之王”撐起致富夢:小鎮(zhèn)打造人參產(chǎn)業(yè)黃金鏈 每日熱點
- 視點!“十四五”中國創(chuàng)新成績斐然
- 每日看點!全國每3度電就有1度是綠電
- 熱議:2021年至2024年我國經(jīng)濟增速平均達到5.5%
- 每日快播:2021年以來我國外商累計對華直接投資額已超“十三五”期間總額
- 402種藥品新增進入國家醫(yī)保藥品目錄
- 402種藥品新增進入國家醫(yī)保藥品目錄 速看
- 402種藥品新增進入國家醫(yī)保藥品目錄-前沿資訊
- 2024年全國海洋經(jīng)濟總量首次突破10萬億元|每日播報
- “十四五”以來每年城鎮(zhèn)新增就業(yè)穩(wěn)定在1200萬人以上
- 中國連續(xù)15年穩(wěn)居全球制造業(yè)第一|頭條
- 當前信息:2021年至2024年內需對經(jīng)濟增長的平均貢獻率為86.4%
- 今日要聞!我國連續(xù)15年穩(wěn)坐全球制造業(yè)首位
- 402種藥品新增進入國家醫(yī)保藥品目錄_當前熱訊
- 2024年全國海洋經(jīng)濟總量首次突破10萬億元_每日熱門
- 今日熱文:廣州累計建成分布式光伏發(fā)電項目裝機總量350萬千瓦
- 2021年至2024年我國經(jīng)濟增速平均達到5.5%
- 每日快訊!我國民營企業(yè)數(shù)量較“十三五”末增長超40%
- 數(shù)個“第一”!中國創(chuàng)新取得重大突破
- 快看:國家統(tǒng)計局:6月份工業(yè)生產(chǎn)者出廠價格同比下降3.6%
- (活力中國調研行)“關中糧倉”智造新名片 陜西渭南“印”就產(chǎn)業(yè)新生態(tài) 熱點聚焦
- 國家發(fā)展改革委:我國5年經(jīng)濟增量預計將超35萬億元-每日看點
- 當前熱訊:特朗普再次催促美聯(lián)儲主席立即辭職
- 商務部新聞發(fā)言人就將8家臺灣地區(qū)實體列入出口管制管控名單答記者問-焦點速遞
- 自主品牌霸榜 新能源車領跑上半年車市 焦點消息
- 離境退稅體驗升級“中國購”升溫 老字號、硬科技產(chǎn)品走俏 頭條焦點
- 百事通!特朗普關稅政策再成焦點,現(xiàn)貨黃金跌逾1%,前路何方?
- 焦點報道:國家統(tǒng)計局:6月份CPI同比由降轉漲 核心CPI繼續(xù)回升
- 純苯期貨上市首日運行平穩(wěn) 期貨與現(xiàn)貨價差相對合理 當前焦點
- 國家統(tǒng)計局:2025年6月份居民消費價格同比上漲0.1% 熱資訊
- 純苯期貨上市首日運行平穩(wěn) 期貨與現(xiàn)貨價差相對合理-即時
- 每日熱聞!房地產(chǎn)代建市場規(guī)模持續(xù)擴大 頭部企業(yè)加速落子
- 天津自貿區(qū)在全國率先推出公平競爭審查優(yōu)先通過工作機制
- 特朗普威脅對銅加征關稅 美國期貨銅價飆至新高 每日關注
- 每日快報!浙江發(fā)布促消費七大行動 釋放“暑期經(jīng)濟”活力
- 最新快訊!特朗普“點名”14國加稅懸而未決,但這一點已成定局
- 浙江發(fā)布促消費七大行動 釋放“暑期經(jīng)濟”活力