zoukankan html css js c++ java

spark rdd持久化的简单对比

未使用rdd持久化

使用后

通过对比可以发现,未使用RDD持久化时,第一次计算比使用RDD持久化要快,但之后的计算显然要慢的多,差不多10倍的样子

代码

 1 public class PersistRDD {
 2     private static SparkConf conf = new SparkConf().setMaster("local").setAppName("persistrdd");
 3     private static JavaSparkContext jsc = new JavaSparkContext(conf);
 4     public static void main(String[] args) {
 5         JavaRDD<String> rdd = jsc.textFile("D:\inputword\result.txt").cache();
 6         
 7         long start = System.currentTimeMillis();
 8         long count = rdd.count();
 9         System.out.println("数量------" + count);
10         long end = System.currentTimeMillis();
11         System.out.println("耗时------" + (end-start) + "毫秒");
12         
13         
14         start = System.currentTimeMillis();
15         count = rdd.count();
16         System.out.println("数量------" + count);
17         end = System.currentTimeMillis();
18         System.out.println("耗时------" + (end-start) + "毫秒");
19         
20         jsc.close();
21     }
22 }

查看全文

相关阅读:
AI公司的商业模式
 半监督学习(semi-supervised learning)综述
 图神经网络GNN系列一：入门篇
 怎么写论文的总结(conclusion)
怎么写论文摘要
 多示例学习(multiple instance learning)定义
 2017CVPR-UntrimmedNets for Weakly Supervised Action Recognition and Detection论文笔记
 向上向下取整
 数论
 set的用法

原文地址：https://www.cnblogs.com/tele-share/p/10274114.html