spark sql 的function中有一个 instr
可以判断其中一列是否是另外一列的子字符
新增字段 判断一个字段是否包含另一个字段的字符串,如果包含值为1否则是0
Df.withColumn("newColumn",when(instr(col("aColumn"),col("bColumn"))===0,0).otherwise(1))
如果是判断一列是否包含一个字符串,可以先用lit
方法将字符串变成Column
,然后再进行判断。
Df.withColums("bColumn",lit("bstr"))
.withColumn("newColumn",when(instr(col("aColumn"),col("bColumn"))===0,0).otherwise(1))