發(fā)布于 2017-02-16 10:52:29 741次瀏覽,搜索引擎的主要工作過程包括:抓取、存儲、頁面分析、索引、檢索等幾個主要過程。此章簡要介紹一下索引系統(tǒng)。,百度搜索引擎工作原理之一-外部投票
, 在以億為單位的網(wǎng)頁庫中查找特定的某些關鍵詞猶如大海里面撈針,怎樣才能做到毫秒級別的查找以滿足用戶的需求呢?, 如果能知道查找的關鍵詞都出現(xiàn)在哪些頁面,那么檢索處理過程即可想象為頁面的集合求交過程,檢索即是:頁面名之間的比較和求交,這樣的話,毫秒級的檢索就成為了可能。這樣的過程就是搜索引擎常說的倒排索引和求交檢索的過程。, 建立倒排索引的基本過程:,
,
,
,第一步:Query串切詞分詞,以“10號線地鐵故障”為例,可能的分詞如下(同義詞問題暫時略過):,
10 0x123abc, 號 0x13445d, 線 0x234d, 地鐵 0x145cf, 故障 0x354df,第二步:查出包含每個分詞對應的文檔集合,舉例如下:, 0x123abc 1 2 3 4 7 9….., 0x13445d 2 5 8 9 10 11……, ……, ……,第三步:
求交,第二步的舉例中文檔2和文檔9可能是需要找的。,
第四步:各種過濾,舉例:死鏈、重復數(shù)據(jù)、色情、垃圾結果以及敏感詞等等都可能被過濾掉。,
第五步:最終排序,將最能滿足用戶需求的結果排序在最前,可能包括的有用信息如:網(wǎng)站的整體評價、網(wǎng)頁質量、內容質量、資源質量、匹配程度、分散度、時效性等等。,
, 百度搜索引擎決定搜索結果排序的六大原則,
,以上是百度搜索引擎的檢索排序原理,其實大家最關心的是影響綜合排序的因素:, 1 相關性:網(wǎng)頁內容與檢索需求的匹配程度,如網(wǎng)頁包含關鍵詞的個數(shù)和出現(xiàn)的位置;外部網(wǎng)頁指向該頁面所用的錨文本等, 2 權威性:百度搜索引擎更相信優(yōu)質權威站點提供的內容。, 3 時效性:指的是新出現(xiàn)的網(wǎng)頁而且網(wǎng)頁內是新鮮的內容。時效性在搜索引擎中日趨重要。, 4 重要性:網(wǎng)頁內容與檢查需求匹配的重要程度或受歡迎程度。, 5 豐富度:一個覆蓋范圍非常廣的命題??梢岳斫鉃榫W(wǎng)頁內容豐富,可以完全滿足用戶需求;不僅可以滿足用戶單一需求,還可以滿足用戶的延展需求。, 6 受歡迎程度:判斷是否受歡迎,比如日訪問量,
網(wǎng)頁的停留時間,跳出率,轉載行為等等都可以看出頁面是否受歡迎。, 那么六大原則的側重點是怎樣的呢?我們也沒用一個確切的答案,其中相關性是基本要素不管什么頁面都需要滿足相關性,也許不同類型的關鍵詞還有不同的側重點,新聞類的詞應該注重時效性和權威性,知識類的詞應該注重權威性和重要性,其中豐富度和受歡迎程度也會在排名里進行加分,我們的頁面要盡量要盡量滿足以上的六大原則,這樣搜索引擎會更加青睞你的網(wǎng)站的。,SEO快速排名最新刷法,實現(xiàn)整站排名快速百度首頁
, 百度的石榴算法 旨在打擊含有大量妨礙用戶正常瀏覽的惡劣廣告的頁面,尤其是彈出大量低質廣告、存在混淆頁面主體內容的垃圾廣告的頁面。所以如果我們的網(wǎng)站在搜索引擎上已經(jīng)有較好的排名之后,引入廣告是無可厚非的,不過切記廣告也是有優(yōu)劣之分,盡量引入跟網(wǎng)站主題相關的廣告,廣告不要太多,太雜,干擾用戶的訪問,或者好不容易做上來的排名很可能付之一炬。,
,
,轉載請注明: 愛推站 ? 百度搜索引擎工作原理之二-檢索排序
|轉載請注明來源地址:蜘蛛池出租 http://www.wholesalehouseflipping.com/百度前三優(yōu)化 網(wǎng)站SEO分析一目了然
專注于SEO培訓,快速排名黑帽SEO https://www.heimao.wiki
