Hilltop算法

Hilltop算法是由Krishna Baharat在200(!年左右所研究的，于2001年申請了專利，并且把專利授權給Google使用，后來Krishna Baharat本人也加入了Google. Hilltop算法可以簡單理解為與主題相關的PR值.傳統(tǒng)PR值與特定關鍵詞或主題沒有關聯(lián)，只計算鏈接關系。這就有可能出現某種漏洞。比如一個PR值極高的關于環(huán)保內容的大學頁面，上面有一個鏈接連向一個兒童用品網站。這個鏈接出現的原因可能僅僅是因為這個大學頁面維護人是個教授.他太太在那個賣兒童用品的公司工作.這種與主脫無關、卻有著極高PR值的鏈接，有可能使一些網站獲得很好的排名，但其實相關性并不高。 Hilltop算法就嘗試矯正這種可能出現的疏漏.Hilltop算法同樣是計算鏈接關系，不過Hilltop算法是由Krishna Baharat在200(!年左右所研究的，于2001年申請了專利，并且把專利授權給Google使用，后來Krishna Baharat本人也加入了Google. Hilltop算法可以簡單理解為與主題相關的PR值.傳統(tǒng)PR值與特定關鍵詞或主題沒有關聯(lián)，只計算鏈接關系。這就有可能出現某種漏洞。比如一個PR值極高的關于環(huán)保內容的大學頁面，上面有一個鏈接連向一個兒童用品網站。這個鏈接出現的原因可能僅僅是因為這個大學頁面維護人是個教授.他太太在那個賣兒童用品的公司工作.這種與主脫無關、卻有著極高PR值的鏈接，有可能使一些網站獲得很好的排名，但其實相關性并不高。 Hilltop算法就嘗試矯正這種可能出現的疏漏.Hilltop算法同樣是計算鏈接關系，不過它更關注來自主題相關頁面的鏈接權重。在Hilltop算法中把這種主題相關頁面稱為專家文件。顯然.針對不同主鹿或搜索詞有不同的專家文件。根據Hilltop算法.用戶搜索關鍵詞后.Google先按正常排名算法找到一系列相關頁面并排名，然后計算這些頁面有多少來自專家文件的、與主壓相關的鏈接.來自專家文件的鏈接越多，頁面的排名分值越高.按Hilltop算法的初構想.一個頁面至少要有兩個來自專家文件的鏈接，才能返回一定的Hilltop值，不然返回的Hilltop值將為零. 根據專家文件鏈接計算的分值被稱為LocalRank.排名程序根據LocalRank值，對原本傳統(tǒng)排名算法計算的排名做重新調整，給出后排名。這就是前面討論的搜索引擎排名階段后的過濾和調整步驟. Hilltop算法初寫論文和申請專利時對專家文件的選擇有不同描述。在初的研究中.Krishna Baharat把專家文件定義為包含特定主甩內容，并且有比較多導出鏈接到第三方網站的頁面.這有點類似于HITS算法中的樞紐頁面。專家文件鏈接指向的頁面與專家文件本身應該沒有關聯(lián).這種關聯(lián)指的是來自同一個主域名下的子域名，來自相同或相似 IP地址的頁面等。常見的專家文件經常來自于學校、政府及行業(yè)組織網站. 在初的Hilltop算法中，專家文件是預先挑選的.搜索引攀可以根據常見的搜索詞. 預先計算出一套專家文件，用戶搜索時.排名算法從事先計算的專家文件集合中選出與搜索詞相關的專家文件子集.再從這個子集中的鏈接計算LocalRank值. 不過在2001年所申請的專利中.Krishna Baharat描述了另外一個挑選專家文件的方法。專家文件并不預先選擇。用戶搜索特定查詢詞后.搜索引攀按傳統(tǒng)算法挑出一系列初始相關頁面，這些頁面就是專家文件.Hilltop算法在這個頁面集合中再次計算哪些網頁有來自于集合中其他頁面的鏈接，賦予比較高的LocalRank值。由于傳統(tǒng)算法得到的頁面集合已經具備了相關性。這些頁面再提供鏈接給某一個特定頁面。這些鏈接的權重自然應該很高。這種挑選專家文件的方法是實時進行的。通常認為Hilltop算法對2003年底的佛羅里達更新有重大影響。不過Hilltop算法是否真的已經被融入進Googl。排名算法中，沒有人能夠確定。Googic從來沒有承認、也沒有否認自己的排名算法中是否使用了某項專利.不過從排名結果觀察及招攬Krishna Baharat 至魔下等跡象看，Hilltop算法的思想得到了Googl。的極大重視。

在線咨詢

上一篇：李彥宏超鏈分析專利
下一篇：高級搜索指令

您的項目需求

*請認真填寫需求信息，我們會在24小時內與您取得聯(lián)系。

整合營銷服務商

Hilltop算法

您的項目需求