zoukankan      html  css  js  c++  java
  • spark dataframe 正则表达式匹配

    val fake_data=hivecontext.read
    .format("com.databricks.spark.csv")
    .option("header","true") //这里如果在csv第一行有属性的话,没有就是"false"
    .option("inferSchema",true.toString)//这是自动推断属性列的数据类型。
    .option("delimiter", ",")
    .load("file:///C:\Users\csv\fix_price.csv")//文件的路径
    import org.apache.spark.sql.functions.regexp_extract
    fake_data.show()
    val data =fake_data.select(regexp_extract(fake_data("gid"),"^\d{2}",0).alias("gid"))
    data.show(10)

    spark的正则表达式匹配暂时只找到一个可用于dataframe处理数据的函数

    ————————————————
    原文链接:https://blog.csdn.net/qingumeng4466/article/details/78932970

  • 相关阅读:
    首页效果
    vue 资源精选
    webpack
    常用代码
    超炫效果
    TJ 大神 与 node
    fis webpack 原理对比
    前端自动化测试
    非常强的用户体验的网站功能
    蔡康永: 说话之道
  • 原文地址:https://www.cnblogs.com/AlanWilliamWalker/p/11681240.html
Copyright © 2011-2022 走看看