蜘蛛池出租蜘蛛池出租

13年專注蜘蛛池收錄技術(shù)

黑帽SEO:基于網(wǎng)絡(luò)語(yǔ)義的黑產(chǎn)推廣技術(shù)檢測(cè)與分析

引言

網(wǎng)絡(luò)黑產(chǎn)是互聯(lián)網(wǎng)各類地下產(chǎn)業(yè)的簡(jiǎn)稱。2017年網(wǎng)絡(luò)安全生態(tài)峰會(huì)1發(fā)布的《電子商務(wù)生態(tài)安全白皮書(shū)》 指出,我國(guó)網(wǎng)絡(luò)黑產(chǎn)從業(yè)人數(shù)已超過(guò)150萬(wàn),市場(chǎng)規(guī)模高達(dá)千億元,每年由黑產(chǎn)直接或間接造成的經(jīng)濟(jì)損失估算高達(dá)915億元[1]。典型的網(wǎng)絡(luò)黑產(chǎn)包括網(wǎng)絡(luò)欺詐、網(wǎng)絡(luò)色情、網(wǎng)絡(luò)賭博和違禁品買賣等,這些不僅是我國(guó)法律明令禁止的行業(yè),還會(huì)給社會(huì)穩(wěn)定帶來(lái)威脅。

網(wǎng)絡(luò)黑產(chǎn)一方面需要躲避監(jiān)管平臺(tái)的檢測(cè),另一方面卻又需要擴(kuò)散信息、尋找潛在客戶群以獲取利益。在躲避監(jiān)管方面,黑產(chǎn)目前多采用快速頻繁更換行業(yè)關(guān)鍵詞的方式,例如氣狗”“汽狗指氣槍,狗糧指子彈,溜冰壺代表吸毒用品等。在信息擴(kuò)散方面,主要采用惡意互聯(lián)網(wǎng)推廣模式來(lái)尋找客戶進(jìn)行交易,最終實(shí)現(xiàn)獲利。這其中主要模式就是黑帽SEO,即通過(guò)攻擊搜索引擎算法提高黑產(chǎn)關(guān)鍵詞在搜索結(jié)果中的曝光率,使?jié)撛诳蛻裟軌蚩焖僬业浇灰灼脚_(tái)。長(zhǎng)期以來(lái),搜索引擎與黑產(chǎn)開(kāi)展了一輪又一輪的檢測(cè)與反檢測(cè)技術(shù)對(duì)抗與升級(jí)。

黑帽SEO與黑產(chǎn)

黑帽SEO

對(duì)普通用戶而言,搜索引擎是其獲取各類互聯(lián)網(wǎng)資源的入口,每日從搜索引擎產(chǎn)生的訪問(wèn)流量數(shù)量巨大。以Google為例,其每秒查詢量超過(guò)66000次 [2]。對(duì)于一個(gè)特定網(wǎng)站,如何提升其在搜索引擎上的排名、以獲得更大的訪問(wèn)流量,是至關(guān)重要的事情。

SEO(Search Engine Optimization),即搜索引擎優(yōu)化,是通過(guò)對(duì)網(wǎng)站內(nèi)部結(jié)構(gòu)、內(nèi)容調(diào)整及外部鏈接關(guān)系進(jìn)行優(yōu)化,幫助搜索引擎對(duì)該網(wǎng)站快速定位特征、提取重要信息,使網(wǎng)站滿足搜索引擎收錄要求,并逐步提高在搜索結(jié)果中的排名。

根據(jù)優(yōu)化手段和側(cè)重點(diǎn)不同,SEO又分為白帽SEO黑帽SEO。其中,白帽SEO是根據(jù)搜索引擎發(fā)布的網(wǎng)站優(yōu)化指南,合理優(yōu)化網(wǎng)站,提高用戶體驗(yàn),并改善與其他網(wǎng)站的鏈接關(guān)系,獲得搜索引擎較好的權(quán)重判定,使網(wǎng)站排名逐步提升。其特點(diǎn)是關(guān)注長(zhǎng)遠(yuǎn)利益,優(yōu)化周期長(zhǎng)但效果穩(wěn)定,適合于正常網(wǎng)站長(zhǎng)期使用。與之相反,黑帽SEO更注重實(shí)現(xiàn)排名短期快速提升,使被推廣網(wǎng)站短時(shí)間內(nèi)獲得較大的訪問(wèn)量,因此往往采用被搜索引擎認(rèn)為是作弊或攻擊的方法。黑帽SEO主要被黑產(chǎn)用于推廣與之相關(guān)的關(guān)鍵詞或網(wǎng)站信息。這種方式一旦被搜索引擎廠商發(fā)現(xiàn),將面臨嚴(yán)厲的懲罰,一般情況下搜索引擎廠商會(huì)將該網(wǎng)站所有內(nèi)容從搜索結(jié)果中直接刪除,即俗稱的“K(kill site)”。

傳統(tǒng)的黑帽SEO技術(shù)包括關(guān)鍵詞堆砌(keyword stuffing)、頁(yè)面障眼法(cloaking)、偽原創(chuàng)(article spinning)、暗鏈(hidden links)等。伴隨著每個(gè)黑帽SEO技術(shù)的大規(guī)模使用,搜索引擎廠商也開(kāi)發(fā)了相應(yīng)的檢測(cè)系統(tǒng)。

目前有關(guān)黑帽SEO的研究主要集中在對(duì)于分散技術(shù)點(diǎn)的分析與檢測(cè),因此存在著檢測(cè)技術(shù)滯后、無(wú)法進(jìn)行主動(dòng)監(jiān)控、監(jiān)控實(shí)時(shí)性不強(qiáng)等問(wèn)題,導(dǎo)致搜索引擎廠商在與黑帽SEO的技術(shù)對(duì)抗中始終處于不利的境地。

黑產(chǎn)

為了在推廣非法物品的同時(shí)逃避監(jiān)管部門及安全廠商的檢測(cè),黑產(chǎn)的買賣雙方多會(huì)通過(guò)其專有的黑產(chǎn)網(wǎng)絡(luò)語(yǔ)義體系進(jìn)行溝通,掩蓋其真實(shí)的商業(yè)意圖。黑產(chǎn)網(wǎng)絡(luò)語(yǔ)義體系很大程度上由黑產(chǎn)關(guān)鍵詞(black keyword)構(gòu)成,而這些關(guān)鍵詞又多通過(guò)自創(chuàng)新詞、舊詞新用、同音詞替換、形似詞替換等獲得。例如,在網(wǎng)絡(luò)黑產(chǎn)中,出肉代表賣出毒品,鐵算盤代表六合彩彩票,菠菜代表博彩,杏彩娛樂(lè)代表原有賭博平臺(tái)吉彩娛樂(lè)等。這類關(guān)鍵詞很難通過(guò)一般的語(yǔ)義環(huán)境推測(cè)其真實(shí)含義,因此增加了黑產(chǎn)的檢測(cè)難度。

深入挖掘黑產(chǎn)網(wǎng)絡(luò)語(yǔ)義體系對(duì)于追蹤和打擊黑產(chǎn)具有非常重要的意義,但同時(shí)也是一項(xiàng)極具挑戰(zhàn)性和耗時(shí)巨大的工作。傳統(tǒng)的挖掘方法主要通過(guò)滲透進(jìn)入地下論壇、獲取黑產(chǎn)從業(yè)人員溝通交流記錄,通過(guò)人工觀察提取特征詞的方式不斷完善對(duì)該語(yǔ)言體系的理解。這種方法存在許多困難:需要較大的人工和時(shí)間成本投入,而產(chǎn)出不可預(yù)期;當(dāng)面臨大規(guī)模擴(kuò)展應(yīng)用時(shí),無(wú)法有效支撐應(yīng)用環(huán)境;對(duì)研究人員素質(zhì)要求比較高,需要深入了解黑產(chǎn)語(yǔ)義體系,對(duì)于非母語(yǔ)的研究對(duì)象將存在更高的難度。同時(shí),隨著黑產(chǎn)網(wǎng)絡(luò)語(yǔ)義體系的不斷升級(jí),黑產(chǎn)關(guān)鍵詞的語(yǔ)義信息更加難以從上下文文本中直接推理獲得,因此研究難度更大。

目前有關(guān)黑產(chǎn)網(wǎng)絡(luò)語(yǔ)義體系的研究主要集中在黑產(chǎn)關(guān)鍵詞的自動(dòng)挖掘與分析方面,對(duì)于深層次網(wǎng)絡(luò)語(yǔ)義的理解仍存在較大的改進(jìn)空間。

對(duì)黑產(chǎn)的研究

網(wǎng)絡(luò)語(yǔ)義是指一個(gè)網(wǎng)絡(luò)內(nèi)多數(shù)計(jì)算機(jī)包含內(nèi)容的規(guī)律性、內(nèi)在解釋,以及在表達(dá)方面的共性。這里的網(wǎng)絡(luò)語(yǔ)義包括域名語(yǔ)義、鏈接語(yǔ)義、內(nèi)容語(yǔ)義和視覺(jué)語(yǔ)義等。本文所描述的網(wǎng)絡(luò)語(yǔ)義既包括正常網(wǎng)站、正常頁(yè)面表達(dá)的正常網(wǎng)絡(luò)語(yǔ)義,也包括黑產(chǎn)網(wǎng)站、黑產(chǎn)頁(yè)面表達(dá)的黑產(chǎn)網(wǎng)絡(luò)語(yǔ)義。

我們?cè)谘芯恐邪l(fā)現(xiàn),網(wǎng)絡(luò)黑產(chǎn)是個(gè)相對(duì)封閉的體系,直接基于自然語(yǔ)言處理和關(guān)鍵詞處理的檢測(cè)方法很難形成有效、準(zhǔn)確率高的檢測(cè)方法。而通過(guò)網(wǎng)絡(luò)語(yǔ)義對(duì)黑產(chǎn)進(jìn)行檢測(cè),是一個(gè)高效、有針對(duì)性的手段。

有明確語(yǔ)義背景的黑產(chǎn)

通過(guò)對(duì)黑帽SEO技術(shù)的跟蹤分析,我們發(fā)現(xiàn)黑帽SEO經(jīng)常通過(guò)攻擊高權(quán)重網(wǎng)站2、在被攻擊的網(wǎng)站上放置黑產(chǎn)關(guān)鍵詞、欺騙搜索引擎索引黑產(chǎn)關(guān)鍵詞的方法,使黑產(chǎn)關(guān)鍵詞快速進(jìn)入搜索結(jié)果索引列表并在搜索結(jié)果中顯示。這類SEO技術(shù)的明顯特征是通過(guò)網(wǎng)絡(luò)攻擊或其他手段獲得權(quán)威網(wǎng)站操作權(quán)限,并以該網(wǎng)站為基礎(chǔ),搭建SEO的基礎(chǔ)設(shè)施,達(dá)到推廣的目的。這類方法運(yùn)維成本低,且聚焦在利用高權(quán)重網(wǎng)站配置、運(yùn)行漏洞上,手段隱蔽,效果很好。

針對(duì)這類攻擊技術(shù),我們研究了:使用自然語(yǔ)言處理方法,對(duì)含有明確語(yǔ)義信息的頂級(jí)域名(Top Level Domain,TLD,如“.edu”代表教育、“.gov”代表政府等)提取正常網(wǎng)站的域名語(yǔ)義、文本語(yǔ)義,并轉(zhuǎn)換為基本向量。在搜索結(jié)果中查找高權(quán)重網(wǎng)站出現(xiàn)的包含黑產(chǎn)關(guān)鍵詞的頁(yè)面,將這些頁(yè)面的域名語(yǔ)義、文本語(yǔ)義同樣做特征提取,并轉(zhuǎn)換為基本向量。對(duì)比兩個(gè)向量之間的距離,如果超過(guò)一定的閾值,將視為高權(quán)重網(wǎng)站中出現(xiàn)了與原語(yǔ)義不相符的內(nèi)容,記錄并報(bào)警。按照這個(gè)思路,我們構(gòu)建了基于網(wǎng)絡(luò)語(yǔ)義的自動(dòng)檢測(cè)系統(tǒng)SEISE[3]并對(duì)141個(gè)國(guó)家的403個(gè)贊助頂級(jí)域名(sponsored TLD, sTLD)進(jìn)行檢測(cè),發(fā)現(xiàn)超過(guò)11000個(gè)被攻擊的高權(quán)重網(wǎng)站。通過(guò)SEISE的研發(fā)、部署和對(duì)檢測(cè)結(jié)果的分析,我們發(fā)現(xiàn)了多個(gè)利用高校、教育機(jī)構(gòu)、政府等高權(quán)重網(wǎng)站進(jìn)行惡意推廣的地下組織及其所采用的黑帽SEO特征,初步探索了對(duì)黑產(chǎn)網(wǎng)絡(luò)語(yǔ)義的挖掘方法,為后續(xù)研究提供了參考性思路。

目前該研究成果已經(jīng)被2016年信息安全領(lǐng)域四大頂級(jí)會(huì)議之一的Oakland Security S&P錄用,該檢測(cè)系統(tǒng)已經(jīng)部署在清華大學(xué)網(wǎng)絡(luò)科學(xué)與網(wǎng)絡(luò)空間研究院,近期完成了對(duì)我國(guó)中小學(xué)網(wǎng)站的安全性檢測(cè),取得了很好的檢測(cè)結(jié)果。

沒(méi)有明確語(yǔ)義背景的黑產(chǎn)

黑帽SEO的推廣方式中,還有一種通過(guò)購(gòu)買域名、服務(wù)器等基礎(chǔ)設(shè)施,自主搭建網(wǎng)站進(jìn)行搜索引擎優(yōu)化的方法,對(duì)黑產(chǎn)網(wǎng)站或黑產(chǎn)關(guān)鍵詞進(jìn)行惡意優(yōu)化推廣。該類方法的運(yùn)維成本相對(duì)較高,優(yōu)化周期相對(duì)較長(zhǎng),但由于全部組件均由黑產(chǎn)從業(yè)者掌控,具有生存能力強(qiáng)、技術(shù)變化快的優(yōu)勢(shì)。目前這種推廣方式叫做蜘蛛池[4]

 “蜘蛛池采用DNS泛域技術(shù)創(chuàng)建無(wú)數(shù)個(gè)三級(jí)以上的子域名,導(dǎo)致域名沒(méi)有明確的語(yǔ)義;同時(shí)采用惡意文本填充的方式,即自動(dòng)爬取高權(quán)重網(wǎng)站內(nèi)容、替換其中一部分為黑產(chǎn)推廣的關(guān)鍵字,在文本語(yǔ)義方面進(jìn)行混淆。然而,從鏈接結(jié)構(gòu)的分析中我們發(fā)現(xiàn),蜘蛛池的目標(biāo)在于構(gòu)建相互鏈接的封閉池,使搜索引擎爬蟲(chóng)一旦進(jìn)入將很難跳出,始終在池子內(nèi)爬取精心構(gòu)造的推廣內(nèi)容,實(shí)現(xiàn)惡意推廣。因此,對(duì)于這類黑帽SEO方法,我們采用了基于鏈接語(yǔ)義的檢測(cè)方法。

在構(gòu)建檢測(cè)系統(tǒng)的過(guò)程中,我們主要完成了以下幾個(gè)方面的工作:(1)實(shí)現(xiàn)了針對(duì)蜘蛛池的自動(dòng)挖掘、檢測(cè)系統(tǒng)。該系統(tǒng)利用蜘蛛池鏈接語(yǔ)義的特征,從DNS端和網(wǎng)頁(yè)結(jié)構(gòu)端出發(fā),對(duì)22個(gè)TLD/SLD下的超過(guò)1300萬(wàn)個(gè)域名進(jìn)行檢測(cè),最終發(fā)現(xiàn)了超過(guò)45萬(wàn)個(gè)被用于黑帽SEO的域名。(2)深入挖掘蜘蛛池的結(jié)構(gòu)特征,對(duì)所涉及的基礎(chǔ)設(shè)施特點(diǎn)、客戶類別及其對(duì)搜索引擎的影響進(jìn)行分析,分析了蜘蛛池的實(shí)際推廣效果。(3)與搜索引擎廠商合作,將檢測(cè)系統(tǒng)部署在實(shí)際生產(chǎn)環(huán)境中,對(duì)蜘蛛池的技術(shù)變化進(jìn)行實(shí)時(shí)跟進(jìn)。

目前該項(xiàng)研究成果已經(jīng)被信息安全領(lǐng)域四大頂級(jí)會(huì)議之一的Usenix Security 2017錄用,同時(shí)檢測(cè)系統(tǒng)部署在百度公司,累計(jì)檢測(cè)出超過(guò)500萬(wàn)個(gè)蜘蛛池域名(201853日與百度確認(rèn),具體數(shù)字是5046806個(gè)),取得了良好的檢測(cè)效果。

黑產(chǎn)網(wǎng)絡(luò)

黑產(chǎn)關(guān)鍵詞是黑產(chǎn)推廣的核心要素。然而黑產(chǎn)關(guān)鍵詞不同于普通的關(guān)鍵詞,具有如下特點(diǎn):(1)隱蔽性。為了逃避檢測(cè),黑產(chǎn)關(guān)鍵詞都是自然語(yǔ)言無(wú)法正常理解的詞,例如平馬二中一”“丁香五月天,目前沒(méi)有可用的處理系統(tǒng)能夠?qū)⑦@類關(guān)鍵詞的語(yǔ)義屬性正確地歸類。(2)實(shí)時(shí)性。黑產(chǎn)關(guān)鍵詞具有很強(qiáng)的時(shí)間特性,一些關(guān)鍵詞只出現(xiàn)在特定時(shí)間背景下。如微信紅包 尾數(shù),這是2017年春節(jié)前后伴隨著微信紅包的流行出現(xiàn)的新型網(wǎng)絡(luò)賭博關(guān)鍵詞,通過(guò)押注微信隨機(jī)紅包的尾數(shù)進(jìn)行賭博。(3)依賴性。黑產(chǎn)關(guān)鍵詞對(duì)其前后內(nèi)容的語(yǔ)義環(huán)境比自然語(yǔ)言有更強(qiáng)的依賴性,如菠菜”“鐵算盤,如果沒(méi)有前后的語(yǔ)義環(huán)境,很難將其與博彩聯(lián)系起來(lái)。

針對(duì)以上特點(diǎn),我們對(duì)黑產(chǎn)網(wǎng)絡(luò)語(yǔ)義進(jìn)行了體系化的研究,并研發(fā)出自動(dòng)分析、挖掘工具。
(1)構(gòu)建針對(duì)網(wǎng)絡(luò)黑產(chǎn)關(guān)鍵詞的自動(dòng)挖掘與檢測(cè)系統(tǒng)KDES[5],該系統(tǒng)能夠從已知的黑產(chǎn)SEO站點(diǎn)出發(fā),自動(dòng)挖掘、提取其中的關(guān)鍵詞,并在所挖掘黑詞的基礎(chǔ)上,結(jié)合搜索引擎的相關(guān)搜索功能,對(duì)黑產(chǎn)關(guān)鍵詞進(jìn)行自動(dòng)擴(kuò)展。(2)對(duì)黑產(chǎn)網(wǎng)絡(luò)語(yǔ)義的核心詞的自動(dòng)篩選,實(shí)現(xiàn)對(duì)黑產(chǎn)網(wǎng)絡(luò)語(yǔ)義的實(shí)時(shí)監(jiān)測(cè)分析。(3)評(píng)估了黑產(chǎn)關(guān)鍵詞在實(shí)際網(wǎng)絡(luò)流量中的保有量及其覆蓋范圍,揭示了長(zhǎng)尾關(guān)鍵詞在其中的重要作用,并重點(diǎn)就黑產(chǎn)關(guān)鍵詞對(duì)搜索引擎的實(shí)際影響進(jìn)行測(cè)量。(4)對(duì)黑產(chǎn)網(wǎng)絡(luò)語(yǔ)義特征進(jìn)行系統(tǒng)性的梳理,就黑產(chǎn)關(guān)鍵詞在推廣過(guò)程中所涉及的關(guān)鍵技術(shù)進(jìn)行分類,從實(shí)際操作層面分析了黑產(chǎn)網(wǎng)絡(luò)語(yǔ)義的形成過(guò)程。(5)針對(duì)黑產(chǎn)的具體細(xì)分領(lǐng)域進(jìn)行探究,為后續(xù)對(duì)網(wǎng)絡(luò)黑產(chǎn)不同領(lǐng)域的深度挖掘提供了指導(dǎo)性思路。

目前該項(xiàng)研究成果已經(jīng)被收錄在Oakland Security S&P 2017,檢測(cè)系統(tǒng)部署在百度公司,在協(xié)助百度分析、獲得最新流行的黑產(chǎn)關(guān)鍵詞方面取得了良好的實(shí)際效果。

黑帽SEO的趨勢(shì)

互聯(lián)網(wǎng)黑色產(chǎn)業(yè)具有產(chǎn)業(yè)規(guī)模龐大、業(yè)務(wù)紛繁復(fù)雜、技術(shù)迭代迅速、語(yǔ)言體系封閉等特點(diǎn),對(duì)于這類產(chǎn)業(yè)實(shí)現(xiàn)有效的檢測(cè)和監(jiān)管都是非常大的挑戰(zhàn)。從網(wǎng)絡(luò)語(yǔ)義出發(fā)的黑產(chǎn)推廣技術(shù)研究,幫助我們抓住了黑產(chǎn)推廣的根源和本質(zhì),為我們不斷深入開(kāi)展后續(xù)研究工作提供了基礎(chǔ)的研究思路。

黑帽seo技術(shù)與檢測(cè)技術(shù)

目前網(wǎng)絡(luò)空間檢測(cè)與反檢測(cè)的技術(shù)對(duì)抗不斷升級(jí)演化,通過(guò)對(duì)黑帽SEO技術(shù)近幾年發(fā)展特點(diǎn)分析,未來(lái)黑帽SEO技術(shù)演化可能會(huì)在以下幾個(gè)方面進(jìn)行:(1)多種黑帽SEO手段的綜合運(yùn)用。之前已經(jīng)研究的黑帽SEO手段包括泛域名、惡意關(guān)鍵詞填充、構(gòu)建惡意鏈接等,而對(duì)蜘蛛池的研究使我們發(fā)現(xiàn),黑帽SEO將以上多個(gè)技術(shù)進(jìn)行了綜合應(yīng)用,構(gòu)建了一個(gè)圍困搜索引擎的推廣池。同時(shí),最新的技術(shù)跟蹤表明,黑帽SEO傾向于將泛域名、泛目錄、泛端口等技術(shù)結(jié)合起來(lái),構(gòu)建一個(gè)能夠產(chǎn)生無(wú)數(shù)子域名、無(wú)數(shù)URL路徑和擁有相對(duì)豐富開(kāi)放端口的推廣池,與現(xiàn)有檢測(cè)技術(shù)進(jìn)行對(duì)抗。(2)降低每個(gè)頁(yè)面的惡意推廣閾值?;趯?duì)多種惡意推廣技術(shù)的結(jié)合,黑帽SEO在構(gòu)建無(wú)數(shù)頁(yè)面的同時(shí),降低每個(gè)頁(yè)面中的惡意推廣內(nèi)容出現(xiàn)的頻率,使其在自然語(yǔ)言處理和語(yǔ)義分析的范疇內(nèi)降低到理論上不可識(shí)別的程度,躲避黑產(chǎn)檢測(cè)。

對(duì)于黑帽SEO的檢測(cè)技術(shù)研究有幾個(gè)方面:
(1)系統(tǒng)性分析。當(dāng)前針對(duì)黑帽SEO技術(shù)的研究大多局限于具體的案例,針對(duì)該類技術(shù)的系統(tǒng)性分析較少,相應(yīng)的防范措施也缺乏完善的防護(hù)體系,因此,如何系統(tǒng)性地加強(qiáng)針對(duì)該類技術(shù)的分析檢測(cè)將是一個(gè)很有意義的研究方向。(2)實(shí)時(shí)性分析。當(dāng)前針對(duì)黑帽SEO技術(shù)的探索多為被動(dòng)發(fā)現(xiàn)式研究,很大程度基于人工對(duì)海量數(shù)據(jù)的分析,很多新的惡意推廣技術(shù)都是在投入使用相當(dāng)一段時(shí)間后才被發(fā)現(xiàn),導(dǎo)致業(yè)界已經(jīng)受到一定危害。如何加強(qiáng)對(duì)該類技術(shù)的實(shí)時(shí)性跟蹤,進(jìn)一步預(yù)測(cè)技術(shù)的變化路線,是黑帽SEO檢測(cè)領(lǐng)域的一個(gè)重要問(wèn)題。(3)完善性分析。通過(guò)研究探索完善搜索引擎排名算法,盡可能減少存在的漏洞,提高黑帽SEO攻擊的技術(shù)難度。

黑產(chǎn)網(wǎng)絡(luò)語(yǔ)義體系

語(yǔ)義是黑產(chǎn)要表達(dá)給用戶的最終目標(biāo)。無(wú)論黑產(chǎn)采用何種技術(shù)手段進(jìn)行欺騙、仿冒,目標(biāo)用戶所看到的內(nèi)容將是黑帽SEO所想要表達(dá)的最終內(nèi)容。因此,需要對(duì)黑產(chǎn)網(wǎng)絡(luò)語(yǔ)義進(jìn)行研究。

主要研究?jī)?nèi)容有:(1)黑產(chǎn)語(yǔ)義的自動(dòng)理解:現(xiàn)階段已初步實(shí)現(xiàn)基于各類黑產(chǎn)網(wǎng)頁(yè)內(nèi)容的關(guān)鍵詞自動(dòng)挖掘,并可以針對(duì)最新的黑產(chǎn)頁(yè)面進(jìn)行檢測(cè)。但當(dāng)前僅能對(duì)黑產(chǎn)關(guān)鍵詞所屬的大類(如博彩、色情等)進(jìn)行分析,暫時(shí)無(wú)法自動(dòng)挖掘黑產(chǎn)關(guān)鍵詞自身的含義,故如何自動(dòng)理解黑產(chǎn)關(guān)鍵詞的深層含義將是未來(lái)一個(gè)很重要的研究方向。(2)黑產(chǎn)語(yǔ)料庫(kù)的構(gòu)建:在了解黑產(chǎn)關(guān)鍵詞語(yǔ)義的基礎(chǔ)上,不斷完善和豐富黑產(chǎn)關(guān)鍵詞語(yǔ)料庫(kù),預(yù)測(cè)黑產(chǎn)關(guān)鍵詞的變化趨勢(shì)。同時(shí),在完善語(yǔ)料庫(kù)的基礎(chǔ)上,還可以充分利用新的語(yǔ)料庫(kù)進(jìn)一步對(duì)黑產(chǎn)檢測(cè)平臺(tái)給予反饋,形成良性循環(huán)。(3)多元素語(yǔ)義信息的挖掘分析:在黑產(chǎn)相關(guān)的線上平臺(tái)中,很多重要內(nèi)容均以圖片或JS動(dòng)態(tài)渲染的形式呈現(xiàn)并逃避常規(guī)檢測(cè)。然而,該類資源在當(dāng)前的研究中并沒(méi)有得到充分的挖掘利用。同時(shí),不規(guī)范的第三方支付,為黑產(chǎn)的最終獲利提供了便捷的渠道。如何充分挖掘這類黑產(chǎn)相關(guān)的多元素語(yǔ)義信息,也是非常值得研究探討的問(wèn)題。 

 

參考文獻(xiàn)

[1] 人民網(wǎng).“網(wǎng)絡(luò)黑產(chǎn)市場(chǎng)規(guī)模高達(dá)千億[OL].(2017-07-28).http://legal.people.com.cn/n1/2017/0728/c42510-29434169.html,2015

[2] Thomas K, Huang D, Wang D, et al. Framing Dependencies Introduced by Underground Commoditization[C]// Proceedings of the Workshop on the Economics of Information Security. 2015.

[3] STATS, I.L. http://www.internetlivestats.com/google-search-statistics/, 2018.

[4] Liao X, Yuan K, Wang X F, et al. Seeking Nonsense, Looking for Trouble: Efficient Promotional-Infection Detection through Semantic Inconsistency Search[C]// ser. IEEE Security and Privacy. IEEE, 2016:707-723.

[5] Du K, Yang H, Li Z, et al. The ever-changing labyrinth: A large-scale analysis of wildcard dns powered blackhat seo[C]//Proceedings of the 25th USENIX Security Symposium (USENIX Security 16). Austin, TX: USENIX Association, 2016: 245-262.

[6] Yang H, Ma X, Du K, et al. How to Learn Klingon without a Dictionary: Detection and Measurement of Black Keywords Used by the Underground Economy[C]//Proceedings of the  2017 IEEE Symposium on Security and Privacy. IEEE, 2017: 751-769.


|轉(zhuǎn)載請(qǐng)注明來(lái)源地址:蜘蛛池出租 http://www.wholesalehouseflipping.com/
專注于SEO培訓(xùn),快速排名黑帽SEO https://www.heimao.wiki

版權(quán)聲明:本文為 “蜘蛛池出租” 原創(chuàng)文章,轉(zhuǎn)載請(qǐng)附上原文出處鏈接及本聲明;

原文鏈接:http://www.wholesalehouseflipping.com/post/48717.html

相關(guān)文章

評(píng)論列表

發(fā)表評(píng)論:

◎歡迎參與討論,請(qǐng)?jiān)谶@里發(fā)表您的看法、交流您的觀點(diǎn)。

?    2026年3月    ?
1
2345678
9101112131415
16171819202122
23242526272829
3031

搜索

控制面板

您好,歡迎到訪網(wǎng)站!
  查看權(quán)限

網(wǎng)站分類

最新留言

標(biāo)簽列表

最近發(fā)表

作者列表

站點(diǎn)信息

  • 文章總數(shù):12487
  • 頁(yè)面總數(shù):3
  • 分類總數(shù):7
  • 標(biāo)簽總數(shù):40
  • 評(píng)論總數(shù):985
  • 瀏覽總數(shù):3931875

友情鏈接

免费国产亚洲天堂AV,国产又粗又猛又黄又爽视频,亚州国产精品一线北,国产线播放免费人成视频播放