概念
POI(一般作为Point of Interest的缩写,也有Point of Information的说法),通常称作兴趣点,泛指互联网电子地图中的点类数据,基本包含名称、地址、坐标、类别四个属性;源于基础测绘成果DLG(Digital Line Graphic,数字线划地图)产品中点类地图要素矢量数据集;在GIS(Geographic Information System,地理信息系统)中指可以抽象成点进行管理、分析和计算的对象。
解读
随着互联网电子地图服务与LBS应用的普及,POI无论从概念范畴,还是从信息纵深都有了长足发展,已成长为信息空间的参天大树。甚至可以说目前如日中天的互联网各个风口或火山口都和POI有一定关系,如O2O、电商、社交、互联网金融、共享经济等。(风口=飞上天的猪,火山口=飞上天的炮灰)
一方面各行各业把越来越多的内容包装成POI供其用户消费,如互联网电子地图提供的周边搜索服务中的各类商家门店,网约车平台提供的上车点,O2O行业提供的推荐收货地址等等;
另一方面POI所包含的属性也越来越多,如商家信息、服务介绍、点评信息、排行榜、推荐、状态、社交互动信息、消费金融信息等等。以高德地图为例,其POI数据中对外开放的基础字段就有45个之多。
因此POI也具备了跨行业、跨部门整合数据,基于空间位置进行大数据挖掘的天然优势。非GIS行业做空间大数据挖掘接触到的第一份空间大数据极有可能就是一份POI,从POI开始,到行政区划结束。(此处应该有掌声,这是目前空间大数据挖掘的极简总结。)
从另一个角度理解,POI之所以有这样的能力,是因为POI是一种顶级抽象的产物,三维的、二维的、真实的、虚拟的万事万物抽象成一个零维的点,大到一个城市,小到数学世界中的一个高程点。当我们真正领悟了抽象便不再有抽象,真正的抽象就是当下。此处致敬抽象电影鼻祖The Matrix,期待沃卓斯基姐妹能够超越沃卓斯基兄弟,再续经典:
注:
(1)据滴滴2016年底公布的数据,滴滴在全国范围目前有超过3000万个推荐上车点,并根据出行大数据每天更新大约8万个推荐上车点。基于推荐上车点,滴滴平台上超过30%的司机和乘客,按照小绿点不需要通话就可以找到对方,司机的通话量平均下降10%,乘客等候时间平均减少1分钟。
(2)O2O行业提供的推荐收货地址能够有效提升用户地址输入速度,杜绝问题收货地址,降低整体派送成本。
整体分类
从GIS应用层次看,POI整体可以分为两类:基础框架类POI,业务应用类POI。
基础框架类POI用于表达真实世界的基本组成要素,如城市部件、地名数据等,主要来源于作为国家基础测绘成果之一的DLG数据产品;
业务应用类POI根据应用场景的需要,将一些事、物进行统一建模,以带有属性信息的地理位置点的方式进行管理、分析和计算,如网约车平台系统中的上车推荐点、O2O行业中的各类门店点、导航服务中的门牌地名点等,该类POI数据随相关的GIS应用系统进行设计、采集、更新维护。
大家接触最多的互联网电子地图POI数据其实是上述两类POI数据的融合产物,既有基础框架类POI数据(该类数据主要来源于基础测绘成果),又有根据互联网电子地图产品需要而建立的业务应用类POI(该类数据主要由各互联网平台自行规划设计、采集、更新维护。关于这事业界有许多故事,喜欢互联网考古或感兴趣的可以自行搜索,毕竟每个大佬都有那么一段不愿被人提及的往事)。
目前在国内互联网电子地图POI数据在数据量、覆盖面、准确性、更新频率方面都是领先的,基本能够满足不同行业GIS应用场景对基础类POI数据的需求。以高德地图为例,其官方对外公布的POI数据如下:
注:
目前网络上有许多能够提供互联网电子地图POI数据的组织和个人,号称有上亿的POI数据,大家需要注意,目前高德对外宣称其POI搜索服务在国内有超过6000万POI数据,估计实际6500万左右,上亿的POI数据极有可能是较长时间段内POI数据的集合,其中有大量已无效或重复的POI数据。POI数据一是重数量,另外一个重要的指标就是时效性,目前国内互联网电子地图都基本能够做到每天更新POI数据,因此大家在获取POI数据时不要只看数量,更要看时效。
分类体系
互联网电子地图POI数量大,包罗万象,想要恰到好处的管理和使用,一个良好的分类体系是必不可少的,此处推荐高德地图的POI分类体系,继承和发扬了基础测绘关于点类要素分类体系的优点,分为大、中、小三类,覆盖全面,能够较好的适应不同的应用场景,建议大家在规划自有POI数据库时在此基础上进行扩展,高德地图最新的POI分类体系说明可以从以下地址下载:
https://lbs.amap.com/api/webservice/download
应用与获取
POI数据有广泛的应用场景,较强的计算和表达能力。即可以用于分析计算,如导航定位、地理编码、周边搜索、热度分析、密度分析、选址决策分析等;也可以用于可视化展示,如灯光图、聚簇图等。
目前国内主流的互联网电子地图服务提供商都提供开放平台,上面提供了基本的POI应用服务API,如POI搜索(包含关键字搜索、区域搜索、周边搜索)、地理编码/逆地理编码服务、地址输入智能补全和建议列表服务等,基本能够满足POI相关的应用需求,并且具有和官方基本一致的时效性(百度地图开放平台中的POI相关服务在数量和时效性上和百度地图官网具有一定的差异,具体参考官方说明:http://lbsyun.baidu.com/index.php?title=webapi/guide/webservice-placeapi)
因此大多数场景下大家不需要获取POI数据到本地。除非需要将业务数据和互联网电子地图POI数据进行关联、整合分析计算、离线或内网应用时,需要获取互联网电子地图POI数据矢量数据。
目前获取互联网电子地图POI数据的技术已经比较成熟,大家需要注意的是POI数据的时效性、坐标系一致性(高德地图和腾讯地图采用GCJ-02坐标系,百度地图采用BD09坐标系)、数据完整性几个方面;
出于尊重版权的考虑,对于互联网电子地图POI数据获取技术或工具,只提示大家按需获取、分区域获取、分类获取、随用随取、多用Python、不迷信1000元左右卖License的各类采集工具。
此处贴一张购物服务全国范围的分区域获取网格,以供参考
由内到外动态看一下