pig脚本就是一个文件,保存了多条pig命令,通常后缀是.pig(不强制)。
多行注释:/**/
单行注释:--
下面是一个名字是test.pig的脚本的例子:
/* test.pig 测试脚本 */ data = load '/xx.data' using PigStorage(','); --加载数据 filtered_data = filter data by $0 > 18; --过滤数据 foreached_data = foreach filtered_data generate $0 as age; --提取age字段 dump foreached_data; --显示数据
执行test.pig:
pig test.pig
pig脚本可以保存在本地,也可以保存在HDFS、Amazon S3等分布式文件系统上
pig hdfs://hadoop1:8020/pig/test.pig