PASS
spark中repartition什么分区最合适1.节点*每台核数2.hdfs块数/1283.goal文件切片那边 分区数接近2000,写2000
如果核数少,task数用2到3倍,文件朵的更碎,有效利用核资源2 300 ~ 1000 节点*每台核数太大了,>2000,写2000