一、对Twitter神经网络的个案分析
上周从玩聚SR上看到一篇《作为神经网络存在的Twitter(数据篇)》,作者对自己的一个Twitter消息的传播路径做了详尽的分析,并配发了节点图、时间线、延迟时间图、Followings数量图等5张图,罗列出了消息传播过程中涉及的:
- 用户;
- 转发时间;
- 用户的Followings/Followers数字;
- 谁传递给谁;
的数据。
数据挖掘功课做得非常足,作者并没有给出明确的结论,但大致可以得知:
- 某些核心节点虽然可以加快信息传播的速率和广度,但核心节点引发的RT行为数量与核心节点的Followers数量未必成正比;
- 当后续传播用户的Followers/Followings数值大幅度下降时,传播也就快要结束了。也就是说,当消息传播到圈子的边缘用户时,基本上也就不会再继续传播了。
作者的这张MindMap引起了我的兴趣:
它简明扼要地给出了传播的路线。玩聚RT作为中文微博客世界唯一追踪锐推行为的应用,掌握着大量的锐推行为真实数据,完全可以计算出类似的图形。
二、中文锐推榜上榜消息的传播路线图
大家都知道,中文锐推榜 是可以追踪微博客中文世界中最流行的锐推、语录和段子,每一条上榜消息都可以查询到对应的所有 Twitter或饭否 用户转发的消息。那么,从每一次转发中提取转发用户名以及转发顺序,加以合并统计,即可得到每一条上榜消息的传播总路线图。
下面是 @keso 作为核心传播的例子:
可以看出 @keso 后续的两个节点 @rtmeme(又传播给了5个人) 和 @secretaryzhang(又传播给了4个人) 是又一组核心节点。
有的时候,一个消息是由两个或多个渠道分别传播出去的。可能是传播中隐去了原作者的ID,比如这条饭否避难手册的广播 。也有可能是某个惊爆新闻由多个敏感人士第一时间各自独立发起,比如这个坐直升飞机上学的新闻:
这种热门新闻,自然会有不同的用户发起传播。我们拥有语义计算能力的做法,可以把某一个消息的大范围内传播进行合并,而不仅仅是追踪某一个人发布的消息如何传播。
三、Javascript Mind Map效果
这种传播路线图,大家应该可以看出来,属于脑图(Mind Map)的画法。
它是由javascript绘制于一个Canvas(画布)上的,不仅拥有动态自动漂移效果,而且每一个节点都可以自由拖拽。
这套javascript脚本是 Kenneth 的杰作,名叫“JavaScript MindMap”,你也可以叫它“SpiderMap”。
代码:
http://code.google.com/p/js-mindmap
Demo:
http://kenneth.kufluk.com/google/js-mindmap/
参考阅读: