Hilltop算法是由Krishna Baharat在200(!年左右所研究的,于2001年申請了專利,并 且把專利授權給Google使用,后來Krishna Baharat本人也加入了Google. Hilltop算法可以簡單理解為與主題相關的PR值.傳統(tǒng)PR值與特定關鍵詞或主題沒 有關聯(lián),只計算鏈接關系。這就有可能出現某種漏洞。比如一個PR值極高的關于環(huán)保內 容的大學頁面,上面有一個鏈接連向一個兒童用品網站。這個鏈接出現的原因可能僅僅是 因為這個大學頁面維護人是個教授.他太太在那個賣兒童用品的公司工作.這種與主脫無 關、卻有著極高PR值的鏈接,有可能使一些網站獲得很好的排名,但其實相關性并不高。 Hilltop算法就嘗試矯正這種可能出現的疏漏.Hilltop算法同樣是計算鏈接關系,不過Hilltop算法是由Krishna Baharat在200(!年左右所研究的,于2001年申請了專利,并 且把專利授權給Google使用,后來Krishna Baharat本人也加入了Google. Hilltop算法可以簡單理解為與主題相關的PR值.傳統(tǒng)PR值與特定關鍵詞或主題沒 有關聯(lián),只計算鏈接關系。這就有可能出現某種漏洞。比如一個PR值極高的關于環(huán)保內 容的大學頁面,上面有一個鏈接連向一個兒童用品網站。這個鏈接出現的原因可能僅僅是 因為這個大學頁面維護人是個教授.他太太在那個賣兒童用品的公司工作.這種與主脫無 關、卻有著極高PR值的鏈接,有可能使一些網站獲得很好的排名,但其實相關性并不高。 Hilltop算法就嘗試矯正這種可能出現的疏漏.Hilltop算法同樣是計算鏈接關系,不過 它更關注來自主題相關頁面的鏈接權重。在Hilltop算法中把這種主題相關頁面稱為專家文 件。顯然.針對不同主鹿或搜索詞有不同的專家文件。 根據Hilltop算法.用戶搜索關鍵詞后.Google先按正常排名算法找到一系列相關頁 面并排名,然后計算這些頁面有多少來自專家文件的、與主壓相關的鏈接.來自專家文件 的鏈接越多,頁面的排名分值越高.按Hilltop算法的初構想.一個頁面至少要有兩個來 自專家文件的鏈接,才能返回一定的Hilltop值,不然返回的Hilltop值將為零. 根據專家文件鏈接計算的分值被稱為LocalRank.排名程序根據LocalRank值,對原 本傳統(tǒng)排名算法計算的排名做重新調整,給出后排名。這就是前面討論的搜索引擎排名 階段后的過濾和調整步驟. Hilltop算法初寫論文和申請專利時對專家文件的選擇有不同描述。在初的研究 中.Krishna Baharat把專家文件定義為包含特定主甩內容,并且有比較多導出鏈接到第三 方網站的頁面.這有點類似于HITS算法中的樞紐頁面。專家文件鏈接指向的頁面與專家 文件本身應該沒有關聯(lián).這種關聯(lián)指的是來自同一個主域名下的子域名,來自相同或相似 IP地址的頁面等。常見的專家文件經常來自于學校、政府及行業(yè)組織網站. 在初的Hilltop算法中,專家文件是預先挑選的.搜索引攀可以根據常見的搜索詞. 預先計算出一套專家文件,用戶搜索時.排名算法從事先計算的專家文件集合中選出與搜 索詞相關的專家文件子集.再從這個子集中的鏈接計算LocalRank值. 不過在2001年所申請的專利中.Krishna Baharat描述了另外一個挑選專家文件的方 法。專家文件并不預先選擇。用戶搜索特定查詢詞后.搜索引攀按傳統(tǒng)算法挑出一系列初 始相關頁面,這些頁面就是專家文件.Hilltop算法在這個頁面集合中再次計算哪些網頁有 來自于集合中其他頁面的鏈接,賦予比較高的LocalRank值。由于傳統(tǒng)算法得到的頁面集 合已經具備了相關性。這些頁面再提供鏈接給某一個特定頁面。這些鏈接的權重自然應該 很高。這種挑選專家文件的方法是實時進行的。 通常認為Hilltop算法對2003年底的佛羅里達更新有重大影響。不過Hilltop算法是否 真的已經被融入進Googl。排名算法中,沒有人能夠確定。Googic從來沒有承認、也沒有 否認自己的排名算法中是否使用了某項專利.不過從排名結果觀察及招攬Krishna Baharat 至魔下等跡象看,Hilltop算法的思想得到了Googl。的極大重視。