zoukankan      html  css  js  c++  java
  • Mining of Massive Dataset----PageRank的两种问题spider traps和dead ends

    PageRank的两种问题

    •   spider traps(蛛网陷阱)

          在几个网页的节点之间跳转,经过一段很长的时间之后,只能在节点n来回跳转(也就是说不嫩访问到其他的网页,只能点击访问节点n这个网页)。

      解决方法:

        在访问节点n的几率接近于1的时候,让他随机的跳转到任意一个网页(唉网页可以不在这些几点网页中)。

    •      dead ends 

        在几个网页的节点之间跳转,经过一段很长的时间之后,没有出路了,连几点n这个网页也不能访问。

      解决方法:

        判断网页节点矩阵M中是否有一列全部是0,如果有,则将这一列的值全部替换成1/n。

        

      

    注释:

      设有n个网页作为节点,这些网页之间的链接作为线,构成的图是一个有向图。矩阵M表示这些点和线之间的关系。

      拿第一个例子来说,点y可以到达点y自己和点a,不能到达点m,所以第一列的值是1/2,1/2,0。点a可以到达点y和点m,不嫩到达点a自己,所以第二列的值是1/2, 0 ,1/2。而点m的出度是0,所以第三列的值全部是0。(是按照列来看的,不知道为什么要这样~)

      

      如下是一个dead ends的例子.

      下面是一个spider traps的例子。

  • 相关阅读:
    排查程序死循环,死锁的方法 ——pstack
    可变参数使用
    snprintf 返回值陷阱 重新封装
    linux 查看cpu个数,内存情况,系统版本
    nginx取结构体地址
    fuser命令使用心得
    Linux中dos2unix批量转换
    rpm中config,config(noreplace)区别
    slowhttptest慢攻击工具介绍
    jmeter性能测试
  • 原文地址:https://www.cnblogs.com/z-j-n-2015/p/4960319.html
Copyright © 2011-2022 走看看