zoukankan      html  css  js  c++  java
  • 腾讯用户画像——如何为QQ画像和代理IP画像

    腾讯用户画像

    画像,实质

    上就是给账号、设备等打标签。

    用户画像 = 打标签

    我们这里主要从安全

    的角度动身
    来打标签,比如

    IP画像,我们会标注IP是不是代理IP,这些对我们做战略
    是有辅佐

    的。

    以QQ的画像为例,比如

    ,一个QQ只登录IM、不登录其他腾讯的业务、不聊天、频繁的加好友、被好友删除、QQ空间要么没开通、要么开通了QQ空间但是评论多但回复少,这种号码我们普通
    会标注QQ养号(色情、营销),相似

    的我们也会给QQ打上其他标签。

    标签的类别和明细,需求
    做风控的人自己

    去设定,比如

    :天文
    位置,按省份标志
    。性别,安男女标志
    。其他细致规则以此规律自己

    去设定。

    我们看看腾讯的IP画像,沉淀的逻辑如下图:

    腾讯防刷担任人:基于用户画像大数据的电商防刷架构

    普通
    的业务都有针对IP的频率、次数限制的战略
    ,那么黑产为了对立
    ,必然会大量采用代理IP来绕过限制。

    既然代理IP的辨认

    如此重要,那我们就以代理IP为例来谈下腾讯辨认

    代理IP的过程。

    辨认

    一个IP是不是代理IP,技术不外乎就是如下四种:

    1. 反向探测技术:扫描IP是不是开通了80,8080等代理效劳
      器经常开通的端口,显然一个普通的用户IP不太可能开通如上的端口。
    2. HTTP头部的X_Forwarded_For:开通了HTTP代理的IP能够

      经过
      此法来辨认

      是不是代理IP;假定

      带有XFF信息,该IP是代理IP无疑。

    3. Keep-alive报文:假定

      带有Proxy-Connection的Keep-alive报文,该IP毫无疑问是代理IP。

    4. 查看IP上端口:假定

      一个IP有的端口大于10000,那么该IP大多也存在问题,普通的家庭IP开这么大的端口简直

      是不可能的。

    以上代理IP检测的办法

    简直

    都是公开的,但是盲目

    去扫描全网的IP,被拦截不说,效率也是一个很大的问题。

    因而

    ,我们的除了应用
    网络爬虫爬取代理IP外,还应用
    如下办法

    来加快代理IP的搜集
    :经过
    业务建模,搜集
    歹意

    IP(黑产运用
    代理IP的可能性比较

    大)然后再经过
    协议扫描的方式来判别
    这些IP是不是代理IP。每天腾讯都能发现千万级别的歹意

    IP,其中大部分

    还是代理IP。

  • 相关阅读:
    钱到用时方恨少(随记)
    Ring0 打印log文件
    Mutation Testing(变异测试)
    GitHub
    常用js收藏
    ASP.NET初学者常用知识
    ASP.NET页面刷新方法总结
    C#中抽象类和接口的区别
    GridView 72般绝技
    55种网页常用小技巧
  • 原文地址:https://www.cnblogs.com/bonelee/p/13345146.html
Copyright © 2011-2022 走看看