今天继续数据处理的设计,有一部分数据需要进行机器识别的提取算法,进行处理,但是这一块还没有做好。
为了支持界面设计数据必须完整,所以先使用原数据提供的部分,后期进行更新替换。
在关系分类处理完成后,导入neo4j的过程中因为编码格式的问题可以难道我了。
python csv库
with open("","","encoding=“utf-8")明明设置了encoding为utf-8但是得到的并不是utf-8
导入乱码
更神奇的是7个csv有的是,有的不是utf-8,所以有的乱码,有的不乱。
标头也是出现了很多难以想象的问题,导入报错,做查看是发现有一些奇怪的标注(小三角),有的还没有,也报错,做了手动替换后就好了(也许又是编码格式的问题)。
可是我明明是使用writerow写入了一行['index:ID','name',':LABEL']这样的数组,搞到很晚也没有搞好,还有很多问题,这个csv库是不是有很多的bug?明天再说吧。