# 原始需求: # 我想把这个文件按车牌 id 分成若干小文件(小文件是一个车一天的出行) # 我想提取它停车时间最长的点(将停车时长也计算出来)汇总在一个文件里面
个人理解
# 需求解读: # 1、按照2列分组,找出3列最大值,存为一个文件 # 2、按照2列分组,每组数据存为一个文件
分析过程
客户给的数据(大小340.3M)存在大量乱码,其次没有列名,应该是加密过
根据需求统计最大值
id分组统计
输出文件
后面只需要循环上面两步,由于文件比较多,大概6404个,不再展开