數(shù)據(jù)“中毒”會(huì)讓AI“自己學(xué)壞”
澳大利亞《對(duì)話》雜志日前報(bào)道稱(chēng),這是數(shù)據(jù)“中毒”的一個(gè)非常典型的例子。AI系統(tǒng)在學(xué)習(xí)過(guò)程中,如果輸入了錯(cuò)誤或誤導(dǎo)性數(shù)據(jù),可能會(huì)逐漸形成錯(cuò)誤認(rèn)知,作出偏離預(yù)期的判斷。與傳統(tǒng)的黑客入侵不同,數(shù)據(jù)“中毒”不會(huì)直接破壞系統(tǒng),而是讓AI“自己學(xué)壞”。隨著AI在交通、醫(yī)療、媒體等領(lǐng)域的普及,這一問(wèn)題正引起越來(lái)越多的關(guān)注。
AI系統(tǒng)在學(xué)習(xí)過(guò)程中,如果輸入了錯(cuò)誤或誤導(dǎo)性數(shù)據(jù),可能會(huì)逐漸形成錯(cuò)誤認(rèn)知,做出偏離預(yù)期的判斷。圖片來(lái)源:英國(guó)《新科學(xué)家》網(wǎng)站
AI“中毒”的現(xiàn)實(shí)風(fēng)險(xiǎn)
在火車(chē)站的例子中,假設(shè)一個(gè)技術(shù)嫻熟的攻擊者既想擾亂公共交通,又想收集情報(bào),他連續(xù)30天用紅色激光欺騙攝像頭。如果未被發(fā)現(xiàn),這類(lèi)攻擊會(huì)逐漸腐蝕系統(tǒng),為后門(mén)植入、數(shù)據(jù)竊取甚至間諜行為埋下隱患。雖然物理基礎(chǔ)設(shè)施中的數(shù)據(jù)投毒較為罕見(jiàn),但線上系統(tǒng),尤其是依賴(lài)社交媒體和網(wǎng)頁(yè)內(nèi)容訓(xùn)練的大語(yǔ)言模型中,它已是重大隱患。
一個(gè)著名的數(shù)據(jù)“投毒”案例發(fā)生在2016年,微軟推出的聊天機(jī)器人Tay上線數(shù)小時(shí)后,就被惡意用戶灌輸不當(dāng)言論,迅速模仿并發(fā)布到X(當(dāng)時(shí)的Twitter)平臺(tái)上,不到24小時(shí)就被迫下線并道歉。
據(jù)英國(guó)《新科學(xué)家》雜志報(bào)道,2024年,互聯(lián)網(wǎng)出現(xiàn)了一個(gè)標(biāo)志性事件,即AI爬蟲(chóng)的流量首次超過(guò)人類(lèi)用戶,其中OpenAI的ChatGPT-User占據(jù)了全球6%的網(wǎng)頁(yè)訪問(wèn)量,它本質(zhì)上是ChatGPT的“上網(wǎng)代理”,在用戶需要實(shí)時(shí)信息時(shí)替他們?cè)L問(wèn)網(wǎng)站。而Anthropic的ClaudeBot更是長(zhǎng)期大規(guī)模抓取網(wǎng)頁(yè)內(nèi)容,占到13%的流量。
互聯(lián)網(wǎng)上的大量?jī)?nèi)容正被AI模型不斷采集、吸收,用于持續(xù)訓(xùn)練。一旦有人故意投放有毒數(shù)據(jù),比如篡改的版權(quán)材料、偽造的新聞信息,這些大規(guī)模采集的爬蟲(chóng)就可能把它們帶進(jìn)模型,造成版權(quán)侵權(quán)、虛假信息擴(kuò)散,甚至在關(guān)鍵領(lǐng)域引發(fā)安全風(fēng)險(xiǎn)。
版權(quán)之爭(zhēng)中的“投毒”反擊
隨著AI爬蟲(chóng)的大規(guī)模抓取,許多創(chuàng)作者擔(dān)心作品被未經(jīng)許可使用。為了保護(hù)版權(quán),創(chuàng)作者采取了法律和技術(shù)手段。如《紐約時(shí)報(bào)》起訴OpenAI,稱(chēng)其新聞報(bào)道被模型學(xué)習(xí)再利用,侵犯了版權(quán)。
面對(duì)曠日持久的版權(quán)拉鋸戰(zhàn),一些創(chuàng)作者轉(zhuǎn)向技術(shù)“自衛(wèi)”。美國(guó)芝加哥大學(xué)團(tuán)隊(duì)研發(fā)了兩款工具。名為Glaze的工具可在藝術(shù)作品中加入微小的像素級(jí)干擾,讓AI模型誤以為一幅水彩畫(huà)是油畫(huà)。另一款工具Nightshade更為激進(jìn),它能在看似正常的貓的圖片中植入隱蔽特征,從而讓模型學(xué)到“貓=狗”這樣的錯(cuò)誤對(duì)應(yīng)。通過(guò)這種方式,藝術(shù)家們讓自己的作品在訓(xùn)練數(shù)據(jù)中成為“毒藥”,保護(hù)了原創(chuàng)風(fēng)格不被復(fù)制。
這種反擊方式一度在創(chuàng)作者群體中風(fēng)靡。Nightshade發(fā)布不到一年,下載量便超過(guò)一千萬(wàn)次。與此同時(shí),基礎(chǔ)設(shè)施公司Cloudflare也推出了“AI迷宮”,通過(guò)制造海量無(wú)意義的虛假網(wǎng)頁(yè),將AI爬蟲(chóng)困在假數(shù)據(jù)的循環(huán)中,消耗其算力和時(shí)間??梢哉f(shuō),數(shù)據(jù)投毒在某些領(lǐng)域已經(jīng)從一種反擊手段,演變?yōu)榘鏅?quán)與利益之爭(zhēng)中的防御武器。
去中心化成為AI的防護(hù)盾
這種局面讓人警覺(jué)。創(chuàng)作者的數(shù)據(jù)“投毒”是為了保護(hù)原創(chuàng),但一旦同樣的技術(shù)被用于大規(guī)模制造虛假信息,其后果可能比版權(quán)爭(zhēng)議嚴(yán)重得多。
面對(duì)這種隱蔽的威脅,研究者正在探索新的防御手段。在美國(guó)佛羅里達(dá)國(guó)際大學(xué)的Solid實(shí)驗(yàn)室,研究人員正著力用去中心化技術(shù)來(lái)防御數(shù)據(jù)投毒攻擊。其中一種方法叫聯(lián)邦學(xué)習(xí)。與傳統(tǒng)的集中式訓(xùn)練不同,聯(lián)邦學(xué)習(xí)允許模型在分布式設(shè)備或機(jī)構(gòu)本地學(xué)習(xí),只匯總參數(shù)而非原始數(shù)據(jù)。這種方式降低了單點(diǎn)中毒的風(fēng)險(xiǎn),因?yàn)槟骋粋€(gè)設(shè)備的“壞數(shù)據(jù)”不會(huì)立刻污染整個(gè)模型。
然而,如果在數(shù)據(jù)匯總環(huán)節(jié)遭遇攻擊,損害依然可能發(fā)生。為此,另一種工具——區(qū)塊鏈正被引入AI防御體系。區(qū)塊鏈的時(shí)間戳和不可篡改特性,使得模型更新過(guò)程可被追溯。一旦發(fā)現(xiàn)異常數(shù)據(jù),可追根溯源,定位投毒源頭。同時(shí),多個(gè)區(qū)塊鏈網(wǎng)絡(luò)還能互相“通報(bào)”,當(dāng)一個(gè)系統(tǒng)識(shí)別出可疑模式時(shí),可立刻警示其他系統(tǒng)。
任何依賴(lài)現(xiàn)實(shí)世界數(shù)據(jù)的AI系統(tǒng)都可能被操縱。利用聯(lián)邦學(xué)習(xí)和區(qū)塊鏈等防御工具,研究人員和開(kāi)發(fā)者正在打造更具韌性、可追溯的AI系統(tǒng),在遭遇欺騙時(shí)能發(fā)出警報(bào),提醒系統(tǒng)管理員及時(shí)介入,降低潛在風(fēng)險(xiǎn)。
標(biāo)簽:
搶先讀
- 我國(guó)空間站艙外服B實(shí)現(xiàn)“4年20次”延壽目標(biāo)
- 研究人員利用腦機(jī)接口嘗試解碼內(nèi)心獨(dú)白
- 焦點(diǎn)!央企加力布局人工智能賽道
- 數(shù)據(jù)“中毒”會(huì)讓AI“自己學(xué)壞”
- 中國(guó)空間站艙外航天服B累計(jì)保障20次出艙任務(wù) 實(shí)現(xiàn)“4年20次”延壽目標(biāo)_重點(diǎn)聚焦
- “清華火神隊(duì)”為何能斬獲機(jī)器人足球賽世界冠軍?|今日播報(bào)
- 快遞業(yè)規(guī)模效應(yīng)持續(xù)放大-熱訊
- 中國(guó)空間站艙外航天服B累計(jì)保障20次出艙任務(wù) 實(shí)現(xiàn)“4年20次”延壽目標(biāo)|觀天下
- 研究人員利用腦機(jī)接口嘗試解碼內(nèi)心獨(dú)白
- 記者手記:在“冰絲帶”見(jiàn)證機(jī)器人“超越自我”
- 海內(nèi)外學(xué)子山東共話醫(yī)學(xué)創(chuàng)新合作
- 廣電總局:鼓勵(lì)支持優(yōu)秀微短劇進(jìn)入電視播出
- 西北華北等地多降雨和對(duì)流天氣 黃淮江淮等地有持續(xù)性高溫
- 游客暑期都去哪兒了 焦點(diǎn)熱訊
- 一份加班通告何以被網(wǎng)友評(píng)價(jià)為“有人情味”? 今日視點(diǎn)
- 游客暑期都去哪兒了
- 孩子的機(jī)票為啥比爸媽的還貴
- 聚焦:兒童票優(yōu)惠變“水中月”
- 西北華北東北及華南西南部分地區(qū)有大到暴雨 北方降雨警惕強(qiáng)對(duì)流
- 志愿者的口袋里裝滿了來(lái)自世界的惦念
- 年均千場(chǎng)宣講 福建柘榮“小板凳+N”用鄉(xiāng)音土話聚民心
- “家門(mén)口就業(yè)致富”的奔頭從何而來(lái)? 觀察
- 【速看料】暑期托管:從單純“看護(hù)”走向“托育結(jié)合”
- 當(dāng)前關(guān)注:全民健身取得惠民新成效 我國(guó)常參加體育鍛煉人數(shù)比例超38.5%
- (走進(jìn)中國(guó)鄉(xiāng)村)“以竹造紙”數(shù)百年 古法技藝指引山村覓新機(jī)
- 南洋風(fēng)情邂逅新潮文創(chuàng) ??隍T樓老街煥發(fā)新生-今日熱訊
- 走進(jìn)中國(guó)最大國(guó)有林區(qū)里的“自然課堂” 開(kāi)啟生命探索
- 保護(hù)生物多樣性 山西陽(yáng)泉多只萌禽成功獲救
- 【快播報(bào)】走進(jìn)中國(guó)最大國(guó)有林區(qū)里的“自然課堂” 開(kāi)啟生命探索
- 保護(hù)生物多樣性 山西陽(yáng)泉多只萌禽成功獲救 天天資訊
- 自行車(chē)、小電驢,娃能騎嗎?暑期青少年騎行安全必看
- 重走抗戰(zhàn)路,一定要去一趟安徽云嶺新四軍軍部舊址! 每日視訊
- (活力中國(guó)調(diào)研行)福建文旅消費(fèi)成新亮點(diǎn) 2025年上半年接待旅游總?cè)藬?shù)3.29億人次 微動(dòng)態(tài)
- 2025年中國(guó)內(nèi)地電影暑期檔總票房破100億元
- 中國(guó)北方地區(qū)首次承修全球最大噸位集裝箱船 觀焦點(diǎn)
- “冰絲帶”上的機(jī)器人盛會(huì):未來(lái)已來(lái),你準(zhǔn)備好了嗎?
- 自然資源部對(duì)山西內(nèi)蒙古陜西啟動(dòng)地質(zhì)災(zāi)害防御Ⅳ級(jí)響應(yīng)
- 理響中國(guó)|多有貢獻(xiàn),這是白求恩的最后心聲
- 高溫、暴雨預(yù)警齊發(fā) 這些地方將有40℃高溫或雷暴大風(fēng)|精彩看點(diǎn)
- 當(dāng)前資訊!二季度銀行業(yè)運(yùn)行保持穩(wěn)健 不良貸款環(huán)比實(shí)現(xiàn)雙降
- 二季度銀行業(yè)運(yùn)行保持穩(wěn)健 不良貸款環(huán)比實(shí)現(xiàn)雙降|通訊
- 大慶油田推行油藏預(yù)警機(jī)制為杏南油田穩(wěn)產(chǎn) “造血”
- 70余項(xiàng)首單創(chuàng)新的背后_焦點(diǎn)快播
- 上半年全國(guó)廣播電視服務(wù)業(yè)總收入6884.14億元 同比增長(zhǎng)5.24%
- 西延高鐵全線冷滑試驗(yàn)正式啟動(dòng) 要聞
- 48萬(wàn)人干出444億!浙江最年輕縣級(jí)市沖刺500億-每日觀點(diǎn)
- 焦點(diǎn)熱文:大慶油田推行油藏預(yù)警機(jī)制為杏南油田穩(wěn)產(chǎn) “造血”
- 滬指近乎平開(kāi),兩融余額時(shí)隔10年突破2.1萬(wàn)億
- 焦點(diǎn)熱文:塑料“變廢為油”轉(zhuǎn)化效率超95%
- 綠色發(fā)展奇跡鋪就高質(zhì)量發(fā)展鮮明底色-熱門(mén)看點(diǎn)
- 每日視點(diǎn)!滬指近乎平開(kāi),兩融余額時(shí)隔10年突破2.1萬(wàn)億
- 貨幣政策逆周期調(diào)節(jié)效果明顯_訊息
- 青海新一輪以舊換新居家適老化改造補(bǔ)貼活動(dòng)火熱進(jìn)行|今日熱搜
- 每日快訊!塑料“變廢為油”轉(zhuǎn)化效率超95%
- 當(dāng)前聚焦:白瀨水利樞紐工程大壩主體工程完成超七成
- 《鯉城年鑒》入選福建省全域年鑒精品工程
- 綠色發(fā)展奇跡鋪就高質(zhì)量發(fā)展鮮明底色_新動(dòng)態(tài)
- 市場(chǎng)規(guī)模持續(xù)擴(kuò)大 我國(guó)冷鏈物流運(yùn)行上半年數(shù)據(jù)出爐
- 【獨(dú)家】市場(chǎng)規(guī)模持續(xù)擴(kuò)大 我國(guó)冷鏈物流運(yùn)行上半年數(shù)據(jù)出爐
- 擦亮新型工業(yè)化綠色底色_焦點(diǎn)日?qǐng)?bào)
- 【播資訊】世界最大跨徑不對(duì)稱(chēng)三塔斜拉橋主塔沖刺封頂
- 速看:“驢火”經(jīng)濟(jì)圈粉年輕一族
- 三對(duì)關(guān)鍵詞,感受服務(wù)貿(mào)易新精彩 焦點(diǎn)熱門(mén)
- A股昨日刷新多個(gè)歷史紀(jì)錄
- (活力中國(guó)調(diào)研行)“仙作”紅木家具:從“頂天立地”到“鋪天蓋地” 當(dāng)前關(guān)注
- 新資訊:“軟硬兼施”培育全國(guó)一體化數(shù)據(jù)市場(chǎng)
- 熱推薦:8月19日央行開(kāi)展5803億元7天期逆回購(gòu)操作
- 要聞:8月19日人民幣對(duì)美元中間價(jià)報(bào)7.1359元 下調(diào)37個(gè)基點(diǎn)
- 今日要聞!數(shù)字金融賦能工業(yè)信息化轉(zhuǎn)型
- 數(shù)字金融賦能工業(yè)信息化轉(zhuǎn)型-聚看點(diǎn)
- 央企加力布局人工智能賽道
- 訊息:數(shù)字金融賦能工業(yè)信息化轉(zhuǎn)型
- 在三重奏中打開(kāi)樂(lè)圣樂(lè)譜,三位音樂(lè)家上演“斗樂(lè)”派對(duì)
- 資訊:超10億!《浪浪山小妖怪》進(jìn)入中國(guó)動(dòng)畫(huà)電影票房榜前十
- 在三重奏中打開(kāi)樂(lè)圣樂(lè)譜,三位音樂(lè)家上演“斗樂(lè)”派對(duì)_通訊
- 在三重奏中打開(kāi)樂(lè)圣樂(lè)譜,三位音樂(lè)家上演“斗樂(lè)”派對(duì)
- 關(guān)注:陳奕迅:你不能控制人家寫(xiě)什么,但可以控制自己怎么看
- 前沿?zé)狳c(diǎn):超10億!《浪浪山小妖怪》進(jìn)入中國(guó)動(dòng)畫(huà)電影票房榜前十
- 【新要聞】歌劇《沃采克》中國(guó)首演,北京國(guó)際音樂(lè)節(jié)10月歸來(lái)
- 新華社快訊:第12屆世界運(yùn)動(dòng)會(huì)在成都閉幕
- 熱訊:成都世運(yùn)會(huì) | 記者手記:收官日的興隆湖沙灘賽場(chǎng)
- 世運(yùn)這一刻 | 今日閉幕 “蓉”光永駐
- 新華社快訊:第12屆世界運(yùn)動(dòng)會(huì)在成都閉幕
- 世運(yùn)這一刻 | 今日閉幕 “蓉”光永駐 獨(dú)家
- 【時(shí)快訊】成都世運(yùn)會(huì) | 世運(yùn)“朋友圈”:邂逅萬(wàn)千 回味無(wú)限
- 視訊! “成都為世運(yùn)會(huì)轉(zhuǎn)播設(shè)立了不可復(fù)制的標(biāo)桿”——專(zhuān)訪國(guó)際體育廣播公司首席執(zhí)行官烏爾蘇拉·羅梅羅
- “成都為世運(yùn)會(huì)轉(zhuǎn)播設(shè)立了不可復(fù)制的標(biāo)桿”——專(zhuān)訪國(guó)際體育廣播公司首席執(zhí)行官烏爾蘇拉·羅梅羅 精選
- 焦點(diǎn)觀察:競(jìng)逐高原濕地 第三屆若爾蓋國(guó)家公園自行車(chē)賽落幕
- 成都世運(yùn)會(huì) | 中國(guó)隊(duì)動(dòng)力沖浪板創(chuàng)世界大賽歷史最佳戰(zhàn)績(jī)|當(dāng)前熱門(mén)
- 成都世運(yùn)會(huì)|聚萬(wàn)千 愛(ài)無(wú)限——成都2025年第12屆世界運(yùn)動(dòng)會(huì)閉幕式側(cè)記
- 微頭條丨1分!亞洲杯中國(guó)男籃憾負(fù)澳大利亞
- 澳門(mén)賽區(qū)完成全國(guó)殘?zhí)貖W會(huì)羽毛球項(xiàng)目運(yùn)行測(cè)試
- 首個(gè)人形機(jī)器人“百米飛人”誕生 今日聚焦
- 追光丨成都世運(yùn)會(huì)上走紅的那些人和運(yùn)動(dòng)_今日快訊
- 捷報(bào)頻傳下一句諺語(yǔ)是什么?捷報(bào)頻傳的近義詞是什么? 今日快訊
- U21女排世錦賽:中國(guó)隊(duì)力克波蘭獲第五
- 英超 | 一球憾負(fù)阿森納 曼聯(lián)將帥心有不甘
- 英超 | 一球憾負(fù)阿森納 曼聯(lián)將帥心有不甘
- 農(nóng)機(jī)裝備產(chǎn)業(yè)加速升級(jí) 企業(yè)搶灘高端智能市場(chǎng)
- 西甲:馬競(jìng)首戰(zhàn)遭逆轉(zhuǎn)不敵西班牙人 焦點(diǎn)播報(bào)