spark-遇到问题小结 - 走看看

zoukankan html css js c++ java

spark-遇到问题小结

　　经常会遇到类似 org.apache.spark.shuffle.FetchFailedException: java.io.FileNotFoundException 。主要是shuffle 导致内存不足引起的。shuffle 分为 shuffle read 和write 。

　　1. shuffle read 是读其它partition 发来的数据，从缓存中读。

　　2. shuffle write 是写数据到缓存准备发给其他partition。

　　当数据分片partition过多而且每个partition的大小很小的时候，当这个时候触发shuffle就会有大量的网络io和shuffle read 的操作。这时候要通过coalesce 或repartition在之前的某一步提前把数据进行合并，来防止产生过多partition。

　　当数据分片不多而每个partition很大的时候，这时候要是shuffle也会造成大量的shuffle read 和write操作，而导致内存不足，这时候也需要通过coalesce 或repartition在之前的某一步提前把数据打散放小。

　　为什么会出现这样情况呢，应该是数据的partition的数量决定了task的数量。所以经常在调优的时候，经常要注意每一步shuffle后数据partition的大小和partition的数量。这个要从executor的内存，shuffle read 、write的大小来看。

查看全文

相关阅读:
如何编写一个有效的缓存
 [深入Maven源代码]maven绑定命令行参数到具体插件
 java.util.ServiceLoader的用法
 非阻塞算法-栈
 非阻塞算法-简单的计数器
 Excelbatis-一个将excel文件读入成实体列表、将实体列表解析成excel文件的ORM框架，简洁易于配置、可扩展性好
 教你如何迭代地遍历二叉树
 [开源项目]Shell4Win,一个在Windows下执行shell命令的解释器
 [LeetCode]Single Number II
CAS5.3服务环境搭建

原文地址：https://www.cnblogs.com/parkin/p/8405619.html

Copyright © 2011-2022 走看看