应用场景:
3kw行url+ +html记录 【网站混合】
需要:按照网站来源分桶输出
执行shell
cat */*pack.html|awk -F ' ' '{ split($1,arr,"/"); site=arr[3]; print $0 > site }'