从Neo4j2.2版本开始,系统就自带了一个大数据量的导入工具:neo4j-import,可支持并行、可扩展的大规模csv数据导入(本例版本为:3.4.7版本)
1.前提条件
关闭neo4j
无法在原有数据库添加,只能重新生成一个数据库
导入文件格式为csv
2.参数说明
--into:数据库名称
--id-type string 指明生成节点、关系的主键类型为string类型
--bad-tolerance:能容忍的错误数据条数(即超过指定条数程序直接挂掉),默认1000
--multiline-fields:是否允许多行插入(即有些换行的数据也可读取)
--nodes:插入节点
--relationships:插入关系
3.例子
node.csv
id:ID(Company),name
100000001,戴上国
100000003,戴治宇
100000004,游振武
relation_header.csv
:START_ID(Company),relation,type:IGNORE,:END_ID(Company)
relation.csv
714362,股东,法人股东,100409508
6769709,股东,法人股东,114116132
3560046,股东,法人股东,107407670
20109212,股东,法人股东,134342172
20657888,股东,法人股东,135224137
neo4j-import --multiline-fields=true --bad-tolerance=1000000 --into graph.db --id-type string --nodes:person node.csv --relationships:related relation_header.csv,relation.csv
运行完成后可以在看到在当前目录下生成了graph.db,将其放入data/databases,覆盖原有数据库(必须先关闭数据库),启动运行即可