zoukankan      html  css  js  c++  java
  • spark相关问题

    1.transformation和action的区别

    Transformation:代表的是转化操作就是我们的计算流程,返回是RDD[T],可以是一个链式的转化,并且是延迟触发的。
    Action:代表是一个具体的行为,返回的值非RDD类型,可以一个object,或者是一个数值,也可以为Unit代表无返回值,并且action会立即触发job的执行。
    Transformation的官方文档方法集合如下:
    map
    filter
    flatMap
    mapPartitions
    mapPartitionsWithIndex
    sample
    union
    intersection
    distinct
    groupByKey
    reduceByKey
    aggregateByKey
    sortByKey
    join
    cogroup
    cartesian
    pipe
    coalesce
    repartition
    repartitionAndSortWithinPartitions
     
    Action的官方文档方法集合如下:
    reduce
    collect
    count
    first
    take
    takeSample
    takeOrdered
    saveAsTextFile
    saveAsSequenceFile
    saveAsObjectFile
    countByKey
    foreach
     
     

    cache和persist的区别

    cache只有一个默认的缓存级别MEMORY_ONLY

    cache调用了persist

    persist可以根据情况设置其它的缓存级别

    flatmap和map区别

    map是把

     
    查看kafka某个topic
    kafka-run-class.sh kafka.tools.GetOffsetShell --broker-list hbak1:9092 --topic zb
    create by cphmvp email:cphmvp@163.com 爬虫技术交流_crawler QQ群 :167047843
  • 相关阅读:
    ES6新特性
    ng-bind与ng-medol 区别
    验证输入两次密码是否一致angularjs
    最全的node.js安装步骤
    JAVA基础
    localStorage 个人使用总结
    mac中怎么安装python3
    macbook配置homebrew以及安装python3
    python之函数进阶
    mysql数据库入门
  • 原文地址:https://www.cnblogs.com/cphmvp/p/14692397.html
Copyright © 2011-2022 走看看