PageRank(文本相关性)

名词解释

PageRank,又称网页排名、谷歌左侧排名、PR,是 Google 公司所使用的对其搜索引擎搜索结果中的网页进行排名的一种算法。目前 Page 排名算法已不再是谷歌公司用来给网页进行排名的唯一算法,不过它是谷歌最早的,也是最著名的算法。

LeanCloud 解读

以前的搜索引擎并不像今天的 Google 一样高效,像 Yahoo 和 Altavista 这样的早期搜索引擎在结果的相关性方面有很多不足之处。为了提高网络搜索引擎质量,Google的联合创始人Sergey Brin 和 Larry Page 于1997 年设计了PageRank。

Google 在计算网页的 PageRank 时通过入站链接页面数量和质量、每个链接页面的出站链接数、每个链接页面的网页排名来决定网页的相对重要性。

参考示例图

假设 C 页面有两个指向它的链接,一个为 A 页面,一个为 B 页面,A 页面比 B 页面权重更高,出站链接更少,将这些信息输入至 PageRank 算法中,我们就能得到 C 页面的网页排名。

参考链接:

Google PageRank is NOT Dead: Why It Still Matters

评论

Loading comments ...