熱點!解剖屎山,尋覓黃金之第二彈
大家好,我3y啊。由于去重邏輯重構了幾次,好多股東直呼看不懂,于是我今天再安排一波對代碼的解析吧。austin支持兩種去重的類型:N分鐘相同內(nèi)容達到N次去重和一天內(nèi)N次相同渠道頻次去重。
在最開始,我的第一版實現(xiàn)是這樣的:
publicvoidduplication(TaskInfotaskInfo){//配置示例:{"contentDeduplication":{"num":1,"time":300},"frequencyDeduplication":{"num":5}}JSONObjectproperty=JSON.parseObject(config.getProperty(DEDUPLICATION_RULE_KEY,AustinConstant.APOLLO_DEFAULT_VALUE_JSON_OBJECT));JSONObjectcontentDeduplication=property.getJSONObject(CONTENT_DEDUPLICATION);JSONObjectfrequencyDeduplication=property.getJSONObject(FREQUENCY_DEDUPLICATION);//文案去重DeduplicationParamcontentParams=DeduplicationParam.builder().deduplicationTime(contentDeduplication.getLong(TIME)).countNum(contentDeduplication.getInteger(NUM)).taskInfo(taskInfo).anchorState(AnchorState.CONTENT_DEDUPLICATION).build();contentDeduplicationService.deduplication(contentParams);//運營總規(guī)則去重(一天內(nèi)用戶收到最多同一個渠道的消息次數(shù))Longseconds=(DateUtil.endOfDay(newDate()).getTime()-DateUtil.current())/1000;DeduplicationParambusinessParams=DeduplicationParam.builder().deduplicationTime(seconds).countNum(frequencyDeduplication.getInteger(NUM)).taskInfo(taskInfo).anchorState(AnchorState.RULE_DEDUPLICATION).build();frequencyDeduplicationService.deduplication(businessParams);}
(資料圖)
那時候很簡單,基本主體邏輯都寫在這個入口上了,應該都能看得懂。后來,群里滴滴哥表示這種代碼不行,不能一眼看出來它干了什么。于是怒提了一波pull request重構了一版,入口是這樣的:
publicvoidduplication(TaskInfotaskInfo){//配置樣例:{"contentDeduplication":{"num":1,"time":300},"frequencyDeduplication":{"num":5}}Stringdeduplication=config.getProperty(DeduplicationConstants.DEDUPLICATION_RULE_KEY,AustinConstant.APOLLO_DEFAULT_VALUE_JSON_OBJECT);//去重DEDUPLICATION_LIST.forEach(key->{DeduplicationParamdeduplicationParam=builderFactory.select(key).build(deduplication,key);if(deduplicationParam!=null){deduplicationParam.setTaskInfo(taskInfo);DeduplicationServicededuplicationService=findService(key+SERVICE);deduplicationService.deduplication(deduplicationParam);}});}
我猜想他的思路就是把構建去重參數(shù)和選擇具體的去重服務給封裝起來了,在最外層的代碼看起來就很簡潔了。后來又跟他聊了下,他的設計思路是這樣的:考慮到以后會有其他規(guī)則的去重就把去重邏輯單獨封裝起來了,之后用策略模版的設計模式進行了重構,重構后的代碼 模版不變,支持各種不同策略的去重,擴展性更高更強更簡潔
確實牛逼。
我基于上面的思路微改了下入口,代碼最終演變成這樣:
publicvoidduplication(TaskInfotaskInfo){//配置樣例:{"deduplication_10":{"num":1,"time":300},"deduplication_20":{"num":5}}StringdeduplicationConfig=config.getProperty(DEDUPLICATION_RULE_KEY,CommonConstant.EMPTY_JSON_OBJECT);//去重ListdeduplicationList=DeduplicationType.getDeduplicationList();for(IntegerdeduplicationType:deduplicationList){DeduplicationParamdeduplicationParam=deduplicationHolder.selectBuilder(deduplicationType).build(deduplicationConfig,taskInfo);if(Objects.nonNull(deduplicationParam)){deduplicationHolder.selectService(deduplicationType).deduplication(deduplicationParam);}}}
到這,應該大多數(shù)人還能跟上吧?在講具體的代碼之前,我們先來簡單看看去重功能的代碼結(jié)構(這會對后面看代碼有幫助)
去重的邏輯可以統(tǒng)一抽象為:在X時間段內(nèi)達到了Y閾值,還記得我曾經(jīng)說過:「去重」的本質(zhì):「業(yè)務Key」+「存儲」。那么去重實現(xiàn)的步驟可以簡單分為(我這邊存儲就用的Redis):
通過Key從Redis獲取記錄判斷該Key在Redis的記錄是否符合條件符合條件的則去重,不符合條件的則重新塞進Redis更新記錄為了方便調(diào)整去重的參數(shù),我把X時間段和Y閾值都放到了配置里{"deduplication_10":{"num":1,"time":300},"deduplication_20":{"num":5}}。目前有兩種去重的具體實現(xiàn):
1、5分鐘內(nèi)相同用戶如果收到相同的內(nèi)容,則應該被過濾掉
2、一天內(nèi)相同的用戶如果已經(jīng)收到某渠道內(nèi)容5次,則應該被過濾掉
從配置中心拿到配置信息了以后,Builder就是根據(jù)這兩種類型去構建出DeduplicationParam,就是以下代碼:
DeduplicationParamdeduplicationParam=deduplicationHolder.selectBuilder(deduplicationType).build(deduplicationConfig,taskInfo);
Builder和DeduplicationService都用了類似的寫法(在子類初始化的時候指定類型,在父類統(tǒng)一接收,放到Map里管理)
而統(tǒng)一管理著這些服務有個中心的地方,我把這取名為DeduplicationHolder
/***@authorhuskey*@date2022/1/18*/@ServicepublicclassDeduplicationHolder{privatefinalMapbuilderHolder=newHashMap<>(4);privatefinalMap serviceHolder=newHashMap<>(4);publicBuilderselectBuilder(Integerkey){returnbuilderHolder.get(key);}publicDeduplicationServiceselectService(Integerkey){returnserviceHolder.get(key);}publicvoidputBuilder(Integerkey,Builderbuilder){builderHolder.put(key,builder);}publicvoidputService(Integerkey,DeduplicationServiceservice){serviceHolder.put(key,service);}}
前面提到的業(yè)務Key,是在AbstractDeduplicationService的子類下構建的:
而具體的去重邏輯實現(xiàn)則都在LimitService下,{一天內(nèi)相同的用戶如果已經(jīng)收到某渠道內(nèi)容5次}是在SimpleLimitService中處理使用mget和pipelineSetEX就完成了實現(xiàn)。而{5分鐘內(nèi)相同用戶如果收到相同的內(nèi)容}是在SlideWindowLimitService中處理,使用了lua腳本完成了實現(xiàn)。
LimitService的代碼都來源于@caolongxiu的pull request,建議大家可以對比commit再學習一番:https://gitee.com/zhongfucheng/austin/pulls/19
1、頻次去重采用普通的計數(shù)去重方法,限制的是每天發(fā)送的條數(shù)。
2、內(nèi)容去重采用的是新開發(fā)的基于redis中zset的滑動窗口去重,可以做到嚴格控制單位時間內(nèi)的頻次。
3、redis使用lua腳本來保證原子性和減少網(wǎng)絡io的損耗
4、redis的key增加前綴做到數(shù)據(jù)隔離(后期可能有動態(tài)更換去重方法的需求)
5、把具體限流去重方法從DeduplicationService抽取出來,DeduplicationService只需設置構造器注入時注入的AbstractLimitService(具體限流去重服務)類型即可動態(tài)更換去重的方法 6、使用雪花算法生成zset的唯一value,score使用的是當前的時間戳
針對滑動窗口去重,有會引申出新的問題:limit.lua的邏輯?為什么要移除時間窗口的之前的數(shù)據(jù)?為什么ARGV[4]參數(shù)要唯一?為什么要expire?
A: 使用滑動窗口可以保證N分鐘達到N次進行去重?;瑒哟翱诳梢曰仡櫹耇CP的,也可以回顧下刷LeetCode時的一些題,那這為什么要移除,就不陌生了。
為什么ARGV[4]要唯一,具體可以看看zadd這條命令,我們只需要保證每次add進窗口內(nèi)的成員是唯一的,那么就不會觸發(fā)有更新的操作(我認為這樣設計會更加簡單些),而唯一Key用雪花算法比較方便。
為什么expire?,如果這個key只被調(diào)用一次。那就很有可能在redis內(nèi)存常駐了,expire能避免這種情況。
推薦項目最后再叨叨吧,很多人可能會發(fā)一段截圖,跑來問我為什么要這樣寫,為什么要以這種方式實現(xiàn),能不能以這種方式實現(xiàn)。這時候,我更想看到的是:你已經(jīng)實現(xiàn)了第二種方式了,然后探討你寫的這種方案好不好,現(xiàn)有的代碼差在哪里。
畢竟問問題很簡單,我又不是客服,總不能沒誠意的問題我都得一一回答吧。
如果想學Java項目的,我還是強烈推薦我的開源項目消息推送平臺Austin,可以用作畢業(yè)設計,可以用作校招,可以看看生產(chǎn)環(huán)境是怎么推送消息的。
倉庫地址(可點擊閱讀原文跳轉(zhuǎn)):https://gitee.com/zhongfucheng/austin
我開通了股東服務內(nèi)容,感興趣可以點擊下方看看,主要針對的是項目喲
VIP服務
標簽:
搶先讀
- 熱點!解剖屎山,尋覓黃金之第二彈
- 紅酒最佳伴侶是指什么? 世界速讀
- 阿里P9下崗再就業(yè) 世界百事通
- 環(huán)球簡訊:吢丕的另一個情侶網(wǎng)名(吢)
- 中國合格評定體系互認范圍覆蓋全球經(jīng)濟總量95%以上的經(jīng)濟體|每日精選
- 世界播報:固體藥品存放在什么里使用固體藥品一邊用(固體藥品存放在)
- 環(huán)球最新:發(fā)繁體 滿江紅(發(fā)繁體)
- 微笑小香香在哪里看(微笑小香香)-世界看熱訊
- 每日熱門:北京德云社地址門票(北京德云社地址)
- 全球?qū)崟r:傅雷家書1954年讀后感70字(傅雷家書1954年讀后感)
- 明確的近義詞是什么詞(明確的近義詞是什么) 今日報
- 天天新動態(tài):是的英文單詞怎么寫(是的英文單詞)
- 虞書欣方否認與吳建豪戀情:不再陷入自證危機
- 世界觀速訊丨奧運會運動項目簡筆畫(奧運會運動項目)
- 【全球新視野】桃花寓意和象征意義 祝福語(桃花寓意和象征意義)
- 《有利的詐欺》綠葉搶眼,尹博再次伙拍金東旭斗戲 環(huán)球熱頭條
- 動畫電影《瘋狂小世界》金日全國影院點映,本周末全國點映
- 低密度脂蛋白偏高的原因及危害有哪些(低密度脂蛋白偏高的原因及危害)
- 全球百事通!上海海港排名榜首,主教練為何被喊下課?
- 2023世界動力電池大會在宜賓開幕
- 數(shù)字化是方向——打造數(shù)字孿生是謀劃縣鄉(xiāng)發(fā)展的現(xiàn)實契機(十九)|焦點播報
- 學制苗族銀飾 傳承非遺之美
- 世界熱議:善待“大姨媽”,就是善待自己,這些食物經(jīng)期就別再吃了
- 考生用分數(shù)投出來的電氣工程專業(yè)排名,你覺得對嗎?
- “這些空姐,立即停飛!”網(wǎng)友怒了 要聞速遞
- 合同的字體要求以及格式 合同的格式字體_天天最新
- 頭狼:黃金下周1970-73區(qū)域布局空|環(huán)球報資訊
- 實時焦點:取四朵用石蕊溶液染成紫色的紙花(取四朵用石蕊溶液)
- 世界即時:李少紅劉斯逸胡先煦亮相上影節(jié)開幕紅毯,9月9日看《三貴情史》尋真愛破詛咒
- 當前快看:繁花嫩葉的意思在《春》(繁花嫩葉的意思)
- 口腔材料app(口腔材料網(wǎng))
- 精彩看點:《仙劍三》翻拍:情懷有多不值錢?
- 環(huán)球觀速訊丨重溫《藍色生死戀》才懂,死去,才是恩熙無望人生的救贖和圓滿
- 二十碳五烯酸需求量(二十碳五烯酸)
- 莫扎特的一句話(關于莫扎特的話例如說他天真)
- 京東幾天到貨河北(京東一般幾天到貨)
- 《壞媽媽》大結(jié)局,李到晛&安恩真求婚合照超甜|環(huán)球觀察
- 世界短訊!手機系統(tǒng)清理軟件哪個好(系統(tǒng)清理軟件哪個好)
- 法網(wǎng)綜合 | 阿爾卡拉斯意外抽筋 焦科維奇晉級決賽
- geya手表怎么調(diào)日期視頻教程(geya手表)
- 長三角跨境電商交易會上演采與供的雙向奔赴-全球即時看
- 貴州發(fā)現(xiàn)國家重點保護野生植物圓葉天女花
- 確認行政行為違法的起訴期限是怎么規(guī)定的
- 每日訊息!公司停車費計入什么科目(車費計入什么科目)
- 下個月,三大屬相得到偏財神指路,福祿壽財星紛紛前來!
- 七月桃花香,舊愛回頭忙,死灰復燃不是夢,真愛一生永相隨的星座
- 【全球熱聞】街頭瓜果飄香 邕城盛夏“風景誘人”
- 視焦點訊!生態(tài)環(huán)境好,好經(jīng)濟來“落腳”
- 計劃今年完成4座,浦東“十四五”期間將改造16座環(huán)上公園-環(huán)球熱訊
- 每日熱文:秋冬想要曼妙的身材,讓三木教你用一條腰帶來提升氣質(zhì),時髦高級
- 朋友晚上10點被警察帶走,警察也沒有出示任何證件,說要問點事情-速看
- 國內(nèi)首條“絲路海運”電商快線開通首年進出口破100億
- 國際銳評丨剝開美英澳的層層“核謀”|環(huán)球簡訊
- 1000萬元家電補貼!先報名再現(xiàn)場選購,報名截至6月17日!2023齊魯工惠·三源家電“家電惠工”活動啟動
- 橡膠走勢解析 天天微頭條
- 深度解讀 Vision Pro:蘋果在發(fā)布會上沒說的 18 個細節(jié)-全球資訊
- 曾經(jīng)狂奔的藍月亮有些跑不動了?
- 最新:恭喜!香港知名女星宣布二胎產(chǎn)子,富豪丈夫抱著兒子像抱著孫子
- 上海數(shù)據(jù)交易所“數(shù)商生態(tài)”服務平臺上線 加快培育數(shù)商發(fā)展
- 美國一列車脫軌,23節(jié)車廂嚴重損毀-世界通訊
- 一無人機在俄羅斯沃羅涅日州墜毀 3人受傷,樓房受損 當前消息
- 馬英九邀大陸生7月訪臺遭阻擋? 她提1事喊“蔡英文怕了”
- 深圳一大學摘10萬斤荔枝請全校免費吃 網(wǎng)友稱這才是最好的招生簡章
- 北京通州區(qū)與廊坊北三縣294項涉企政務服務實現(xiàn)區(qū)域通辦
- 環(huán)球通訊!全自動馬桶水箱蓋怎么打開(馬桶水箱蓋怎么打開)
- 電影《灌籃高手》官宣再次延長上映至7月19日 實時票房高達6.48億元
- 俄方再次呼吁對“北溪”管道爆炸進行公開透明的國際調(diào)查-當前時訊
- 《三伏》最新定檔預告公布 為中式懸疑驚悚解謎游戲
- 世界實時:美國前總統(tǒng)特朗普面臨37項指控
- 廣汽埃安副總經(jīng)理:原來車廠不是為電池廠打工 而是為材料廠打工且還是打長工
- 2023年青島市新時代文明實踐集體婚禮舉行 共同倡樹新型婚慶新風
- 【環(huán)球報資訊】學制苗族銀飾 傳承非遺之美
- “文根”何以“深種”?看文博會如何尋找?guī)X南新坐標 天天精選
- 環(huán)球簡訊:2023重慶車展:阿維塔發(fā)布ADS高階功能包訂閱 將于6月30開啟
- 今日熱訊:申萬宏源:下周MLF利率是否調(diào)整將影響短期匯率走勢
- 數(shù)字化是方向——打造數(shù)字孿生是謀劃縣鄉(xiāng)發(fā)展的現(xiàn)實契機(十九)
- 國產(chǎn)大飛機C919的16年“飛天路” 熱點聚焦
- 第七史詩不凋零的回憶有什么用 獲取方法介紹 最新
- 今年,水果為什么成了漲價之王?
- 天天觀天下!93總決賽喬丹場均41分NBA歷史最高,當時巴克利、皮蓬什么數(shù)據(jù)?
- 之江實驗室發(fā)表研究成果 用計算模型理解大腦視覺機制
- 今日熱門!拍賣史上最大紅寶石拍出 約合2.48億,創(chuàng)下同類寶石的最高拍賣價格紀錄
- 美國亞裔高考近滿分被六大名校拒絕 怎么回事?
- 蘋果、亞馬遜涉嫌串通壟斷iPhone定價,美國法官裁定消費者可起訴
- 何處招魂香草還生三戶地說的是誰(何處招魂香草還生三戶地)_視訊
- 世界熱推薦:3800畝土地商改工、商改綠 順德容桂“讓利”400億支持制造業(yè)
- 海南招286人!2023軍校招生計劃公布
- 剛子哥(剛子)|全球速看料
- 當前焦點!相術小說神作(相術小說)
- 【全球新要聞】蜀中有杜處士好書畫的翻譯(蜀中有杜處士好書畫所寶以百數(shù)翻譯)
- 環(huán)球速看:柳巖的衣服真“擠”,一襲抹胸連衣裙高級時髦,大方展現(xiàn)曼妙身姿
- 今日報丨堅守“可靠”坦克Hi4-T 當下新能源越野的更優(yōu)解
- 全球看熱訊:白宮再拋“橄欖枝”、競爭對手接連“投誠”,特斯拉充電有望“一統(tǒng)北美”
- 最資訊丨日本羽田機場兩架飛機疑似發(fā)生碰撞
- 這些大膽的古早綜藝,真的是不付費就能看的嗎?_視訊
- 市場復蘇后 旅游企業(yè)們緩過勁了嗎?_世界視點
- 沙區(qū)舉辦首屆創(chuàng)意美食購物節(jié) 邀市民品嘗美食盛宴-環(huán)球快報
- 周末重磅!李云澤最新發(fā)聲 要求用心用力支持實體經(jīng)濟!|天天觀速訊
- 證監(jiān)會就公募基金投顧業(yè)務管理規(guī)定公開征求意見 環(huán)球時快訊
- 國家鄉(xiāng)村振興局開展農(nóng)村廁所革命“提質(zhì)年”