针对计算 metrics 的平均值的时候,最终结果都是 nan,需要提前判断,然后剔除掉。
pandas 里面 NaN 判断,如下:
bm_waybill_id | arrive_lat | arrive_lng | recipient_lng | recipient_lat | recipient_address | addr | building | aoi | poi | apart | bdname | unit | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | 1605416228578281385 | 22761864 | 113802781 | 113802970 | 22761484 | 新恒大厦 (2055) | 新恒大厦 | NaN | NaN | 新恒大厦 | NaN | NaN | NaN |
1 | 1608785988487281632 | 22761906 | 113802311 | 113802502 | 22761873 | 新恒大厦 (2021) | 新恒大厦 | NaN | NaN | 新恒大厦 | NaN | NaN | NaN |
2 | 1603621364281281748 | 22761972 | 113802969 | 113802898 | 22761959 | 共和北方永发工业大厦 (管理处(亿安家园)) | 亿安家园 | NaN | 亿安家园 | 共和北方永发工业大厦 | NaN | NaN | NaN |
3 | 1603801575162281822 | 22762342 | 113802576 | 113802582 | 22762356 | 北方永发科技园 (B栋宿舍楼424房) | 北方永发科技园 | 宿舍楼 | 北方永发科技园 | NaN | NaN | 宿舍楼 | NaN |
4 | 1603025458596281274 | 22761689 | 113801481 | 113801524 | 22761670 | 益源休闲会所 (新和大道路边绿化带集装箱) | 益源休闲会所 | NaN | NaN | 益源休闲会所 | NaN | NaN | NaN |
通过下面判断:pd.isnull()
for i in range(len(df)): if pd.isnull(df.loc[i, 'poi']): has_poi_name[i] = False