前天QQ圈子上线,昨晚我试了一下。
最初的反应是惊恐。各种陈年的关系,万年不联系的朋友,都冒出来了。包括去澳洲留学的外甥女(我从不知她的QQ),11年前跳槽离开的公司同事,8年前把我甩掉后不再联系的ex。
非 死不可出来得晚,里面的关系都是一群师弟师妹,我之前没有用过Google+,而且我不爱在网上多留个人真实信息。所以这次QQ准确地识别了我的社交圈 子,并帮助我精准定位了这个圈子里的、我之前无联系的、真实成员,让我感到毛骨辣然。相比G+和非死不可,QQ的最大优势就是积存了一大堆社交关系网络。
研究了一晚上,我觉得QQ圈子主要依赖于一个是算法,一个是真实信息。
我 不爱在网上留个人真实信息,但是架不住朋友当中有不少喜欢在网上实名暴光的。QQ圈子应该是利用了朋友留下的真实个人信息,在一个圈子里如果在统计上有显 著性,就会去寻找相同信息的人来推荐到这个圈子里来,同时把这个信息也在我头上打一个tag……真是可怕,哪怕我不填真实信息,都能被QQ一抓一个准。
至 于算法,QQ都不必需要我填真实信息,只要我与N个人有M个共同好友,这N个人的其它X个共同好友,以及这N+X个人的Y个共同好友,都会被加到这个圈子 里来。这N、M、X、Y都很小,按说在统计上还不够显著性的。我的人际关系被分析得一清二楚,即使QQ不知道现实中这个圈子究竟是什么,比如说西西河的河 友。很多年以前玩山口山时混过两个公会,在我的QQ好友分组里,所有游戏网友都是归成一组的,而QQ圈子却识别成了两个圈子。
QQ圈子的主要问题就是速度有点慢……大概是计算量有点大的缘故。虽然试用的人只有几十万,但是每个人的圈子数据不晓得是不是动态生成的,还是先生成一张表,然后打开后再临时补充计算,追加变化。
惊 恐过后再回想,QQ圈子的算法并没有什么了不起,就象“豆瓣猜”、Amazon和Gmail广告、zygna游戏一样,这些数据分析并没有用上向量机之类 的高深玩意。当我觉得自己身份不会被识别时,个人偏好等信息被识别出来,并无所谓。但是当我的真实身份有遭到暴光的危胁时,个人信息暴露得太多就会害怕, 因为这些程序比我自己更了解我自己。