一、 transformation操作概览
|
Transformation |
Meaning |
|
map |
对传入的每个元素,返回一个新的元素 |
|
flatMap |
对传入的每个元素,返回一个或多个元素 |
|
filter |
对传入的元素返回true或false,返回的false的元素被过滤掉 |
|
union |
将两个DStream进行合并 |
|
count |
返回元素的个数 |
|
reduce |
对所有values进行聚合 |
|
countByValue |
对元素按照值进行分组,对每个组进行计数,最后返回<K, V>的格式 |
|
reduceByKey |
对key对应的values进行聚合 |
|
cogroup |
对两个DStream进行连接操作,一个key连接起来的两个RDD的数据,都会以Iterable<V>的形式,出现在一个Tuple中。 |
|
join |
对两个DStream进行join操作,每个连接起来的pair,作为新DStream的RDD的一个元素 |
|
transform |
对数据进行转换操作 |
|
updateStateByKey |
为每个key维护一份state,并进行更新(这个,我认为,是在普通的实时计算中,最有用的一种操作) |
|
window |
对滑动窗口数据执行操作(实时计算中最有特色的一种操作) |