zoukankan      html  css  js  c++  java
  • 物联网应用中实时定位与轨迹回放的解决方案 – Redis的典型运用(转载)

    物联网应用中实时定位与轨迹回放的解决方案 – Redis的典型运用(转载) 
      2015年11月14日|    by: nbboy|    Category: 系统设计, 缓存设计, 高性能系统
    摘要 我们解决某个问题,很多时候并不在于你掌握了某个工具或某项技术,而在于你对该场景下该问题的本质理解。 这则博文,针对物联网应用中实时定位与轨迹回放的问题,阐述最为简要的解决之道。 



    目录[-] 

        1. 系统需求 
        2. 应用场景 
        3. 数据量估算 
        4. 项目难点及解决 
        4.1如何存储千亿级的坐标记录且便于检索? 
        4.1.1 关系型数据库的不足 
        4.1.2 NoSql产品选型 
        4.1.3 数据存储结构设计 
        4.1.3 高性能、高可靠性的部署 
        4.1.4 数据定期维护设计 
        4.2 如何实现标签定位的实时性与可靠性? 
        5. 最终方案示意 
        6. 补充(2015-11-13)–注意啦! 

    1. 系统需求 

        实时监控:系统能实时接收2000个超rfid标签的坐标信息, 然后在3D模型界面展示各标签的实时位置。 
        轨迹回放:系统可查询任一标签在最近1个月内的坐标信息, 然后在3D模型界面回放该标签在这个时间段内的运动轨迹。 

    2. 应用场景 

        监狱监管:给犯人配戴腕表或工牌,在腕表或工牌中嵌入rfid标签,实现对犯人行踪的实时监控、事先预警、事后回查等。如图: 

    输入图片说明 

    3. 数据量估算 

    1个超rfid标签在1秒内会产生10条80byte的坐标信息,即1个标签1秒的数据量是约0.8kb(坐标信息的结构为:标签id, x坐标,y坐标,z坐标,时间),以此推算: 

        1个标签 1分钟会产生记录数是 600条, 约54 KB 
        1个标签 1小时会产生记录数是3.6万条, 约3.2 MB 
        1个标签 1天会产生记录数是86.4万条, 约76.8 MB 
        1个标签 1个月会产生记录数是2.6亿条, 约2.3 GB 
        … 
        2000个标签 1天产生的记录数是172亿条, 约150 GB 
        2000个标签 1个月产生的记录数是5200亿条, 约4.4 TB 

    4. 项目难点及解决 

    4.1如何存储千亿级的坐标记录且便于检索? 

    如何存储海量的坐标信息,且能快速地从其中检索出指定犯人(也即标签)在某个时间范围内的坐标? 

    4.1.1 关系型数据库的不足 

    把千亿级的记录存储在关系型数据库,肯定要分库分表。如果按标签、按天分表存放,每个表存放一个标签的一天的坐标信息,那么每个表只有84.6万条记录,但有多达6万张表(=2000 X 30)。 由于轨迹回放时,是选定标签后才进行的,也即必然会根据标签检索,而从一张84.6万条记录的表中找出某个时间范围内的坐标是不成问题的。 

    但这方案实现起来很繁锁,因为每当新的一天来到,系统就要自动为所有标签创建新的表、并删除掉30天前创建的表;每当有新的标签加入时,也要立即为这个标签创建表。 而且,每当系统自动创建一个表后,还要为这个表创建索引,使得根据时间范围检索时能达到相应的性能要求。 

    以上方案,系统做了太多的DDL操作,显然不合适; 另外,由于对坐标信息的写入并没有事务方面的要求,多写或少写一条对系统几乎没有影响。 所以我们考虑用NoSql产品。 

    4.1.2 NoSql产品选型 

    NoSql产品有很多,典型的列式存储有Hbase,Key-Value型存储有Redis,文档型存储有MongoDB。 

        Hbase,其部署、维护较为复杂,是基于分布式文件系统的数据库。它通常不会用于仅存储某类或几类的数据,而会存储大量的各类数据,以用作分布式计算的基础。 
        Redis,其部署、维护都很简单,适合于对结构简单的数据提供高速缓存和持久存储。 
        MongoDB,其部署、维护比Redis稍复杂,其优点在于对结构不固定、不规则的数据提供存储。 

    由于Redis的数据结构很适合对本系统的坐标信息进行高效读写,最终选定了Redis。 

    4.1.3 数据存储结构设计 

    Redis的数据结构有以下几种: 

        String, 类似于java的 Map<key, String>。采用jedis的客户端代码示例: 

        jedis.set("key001", "value01")); 

        List, 类似于java的 Map<key, List<String>>。采用jedis的客户端代码示例: 

        jedis.lpush("key001", "定远");   
        jedis.lpush("key001", "致远"); 

        List warshipList= jedis.lrange("key001", 0, -1);//从"key001" 取得所有数据项 

        Set, 类似于java的 Map<key, Set<String>>。采用jedis的客户端代码示例: 

        jedis.sadd("key001", "定远");   
        jedis.sadd("key001", "致远"); 

        Set warshipSet = jedis.smembers("key001");//从"key001" 取得所有数据项 

        SortedSet, 与Set类似, 但提供一列属性score,用于排序。采用jedis的客户端代码示例: 

        //将北洋舰队的舰只名称、吨位写入"key001" 
        jedis.sadd("key001", 7335, "定远");   
        jedis.sadd("key001", 2300, "致远"); 

        //从"key001"取得吨位在3000~8000之间的舰只名称 
        Set warshipSet = jedis.zrangeByScore("key001", 3000, 8000); 

        Hash, 类似于java的 Map<key, Map<String,String>>。采用jedis的客户端代码示例: 

        //将北洋舰队各舰只的基本信息写入"key001" 
        jedis.hset("key001", "定远", "铁甲舰,吨位7335,马力6200,1882,德国") 
        jedis.hset("key001", "致远", "巡洋舰,吨位2300,马力7500,1886,英国") 

        //从"key001" 取得所有舰只名称 
        List warshipList = jedis.hkeys("key001"); 

        //从"key001" 取得"定远"的描述 
        String warshipDesc= jedis.hget("key001", "定远"); 

    以上6种数据结构,第1种用来存储单个字符串,后面5种用于存储List,Set对象,但只有SortedSet提供了根据数据值的范围进行查找的功能。很显然,我们应该采用SortedSet来存储坐标信息。 

    如果每个key只存放一个标签的一天的坐标信息,那么就会有多达6万(=2000 X 30)个key,而Redis最多只支持 10万个key。考虑到以后可能需要支持更多标签,让每个key存放一个标签的连续三天的坐标信息,那么就只需要2万个key,于是key命名可设计为: lableId + 起始日yyyyMMdd + 终止日yyyyMMdd。 

    比如,可将编号为“rfid1002023”的标签的11月1日~11月3月的坐标信息写入到key: “rfid1002023-20151101-20151103″,并且把坐标时间(dd hh:mi:ss.SSS)作为score: 

    //标签“rfid1002023” 在11月1日17时20分21秒内,其坐标从位置(20.3, 34.0, 0.05)移动到(21.7, 34.5, 0.05).. 
    //则系统会以如下方式往redis写入: 
    jedis.sadd("rfid1002023-20151101-20151103", "01 17:20:21.008", "20.3, 34.0, 0.05");     
    jedis.sadd("rfid1002023-20151101-20151103", "01 17:20:21.395", "21.7, 34.5, 0.05"); 

    //如果要查询标签“rfid1002023” 在11月1日17:15分~17:25分的记录,以便回放其在这段时间内的轨迹,则调用如下代码: 
    Set xyzSet = jedis.zrangeByScore("rfid1002023-20151101-20151103", "01 17:15:00", "01 17:25:00"); 

    4.1.3 高性能、高可靠性的部署 

    现采用4台计算机部署两组主从模式的redis server: 

        A组:A-Master, A-Slave; 每台机配置1块3T的硬盘、8G以上的内存; 
        B组:B-Master, B-Slave; 每台机配置1块3T的硬盘、8G以上的内存; 

    另外采用一台计算机做监控,安装redis sentinel,以达到主从切换的目的;再将A-Master和B-Master设置为集群,就实现了读写的负载均衡。 

    Redis有两持久化的方式:RDB,AOF。由于RDB能更灵活地控制写入的频率,我们选择RDB方式,并将4台redis server按如下方式设置: 

    save 10  1   #当有1条Key的数据被改变时,10秒持久化一次 
    save 5   2   #当有2条Key的数据被改变时,5秒持久化一次 
    save 3  10   #当有10条Key的数据被改变时,3秒持久化一次 

    4.1.4 数据定期维护设计 

    Redis提供为每个key设定生命周期的功能,一旦key的存活时间超过生命周期,则这个key以及相应的数据都会都清除。所以不需要编写程序定时删除数据,让我们省了不少事。 

    回到本项目,我们在创建key: “rfid1002023-20151101-20151103″或者说首次写入这个key后,通过以下代码指定保存时间为1个月: jedis.expire("rfid1002023-20151101-20151103", 3600*24*31) 。 就这么简单! 

    4.2 如何实现标签定位的实时性与可靠性? 

    原始坐标信息来自基站,经路由器等网络设施传给WEB服务器,由WEB服务器对原始坐标进行相应转换,传给3D模块展现。那么,使这些坐标信息尽可能实时地、可靠地传给3D模块,是做好实时定位的关键。 

    前面的存储设计已经采用了Redis, 现在可以再次利用Redis的内存数据库特性。 我们再部署一组主从模式的redis server, 关闭持久化,配置主从切换。 

    我们应该采用Hash结构来存每个标签的最新的坐标信息,只需要设计一个key,可命名可为:“the-newest-xyz”。假如当前标签“rfid1002023”的坐标为“20.3, 34.0, 0.05”,那么以下代码就把这个坐标写入到了redis内存: 

    jedis.hset("the-newest-xyz", "rfid1002023", "20.3, 34.0, 0.05");   
    jedis.expire("the-newest-xyz",10)//将生命周期设为10s, 用于标签损坏或越防区后报警  

    //其它标签 
    jedis.hset("the-newest-xyz", "rfid1069551", "80.3, 36.0, 10.2"); 

    这样,3D模块从这组redis server取得所有标签的坐标即可,代码如下: 

    List labelList = jedis.hkeys("the-newest-xyz");//取所有标签 
    String xyz= jedis.hget("the-newest-xyz", "rfid1069551");//取标签“rfid1069551”的坐标 

    5. 最终方案示意 

    输入图片说明 

    本文着重描述了系统中最为关键的坐标存储与实时读取的方案。但整个系统的实现,还需要许多基础模块的辅助,如警员信息管理、犯人信息管理、标签管理、标签绑定、楼层管理、基站管理、监区管理、坐标转换、菜单及权限管理等, 上图中的mysql就是用于存放警员信息、犯人信息、标签信息、楼层信息、权限及菜单等数据的。 

    6. 补充(2015-11-13)–注意啦! 

    感谢网友”Frank_mc”和”JavaGG”! 经他俩指出,在这里采用redis做持久存储是不可行的,因为redis启动时会加载整个数据文件到内存,这里的数据文件相对内存来说是远不够用的。 

    本文上述的持久化存储方案,是我预想的以为更理想的方案,也是当时(2013年)我做的备选方案。而实际项目中的存储方案是采用分目录写文件的,但由于这个方案很传统而没兴趣介绍。所以关于坐标存储这块,我没有按实际方案介绍,而是阐述我以为的理想方案。 

    下面,我介绍”坐标存储” 这块实际所采用的方案: 

    1 分目录存放文件: 

    - 1级目录名:年月(yyyyMM)  
    - 2级目录名:天(dd) 
    - 3级目录名:标签id 

    这样1级目录就1~2个,每个1级目录下有30个2级目录,每个2级目录下有2000个3级目录,每个3级目录下有24个文件。每个文件是只存放1个标签的1个小时的数据量,约3.2MB。 

    2 提供查询接口:设计相应算法定位到要查找的文件,载入文件内容,再进行相应的汇总、过滤。 

    3 定时删除文件:只保留1个月内创建的文件。 

    4 读写可靠性:磁盘做raid。 
  • 相关阅读:
    echarts 立体图
    css 设置边框边角
    PS2020 快速设置文字渐变
    idea 2019 永久破解
    使用VUE+element ui 实现输入框 占位符自动补全功能
    纯css 设置隔行样式
    CSS 设置float:left 导致后面元素错乱问题
    c primer plus 4编程练习
    c语言中以八进制数表示字符、并输出
    c语言中printf()函数的返回值
  • 原文地址:https://www.cnblogs.com/Zhaols/p/6237525.html
Copyright © 2011-2022 走看看