一. 基本概念(https://blog.csdn.net/xianzhen376/article/details/89810958)
双流Join是Flink面试的高频问题。一般情况下说明以下几点就可以hold了:
1.join大体分类有两种:window join和interval join。window join又可以根据window的类型细分为3种,如下:
Tumbling Window join、Sliding Window join、Session Window Join。
2. windows类型的join都是利用window的机制,先将数据缓存在window state中,当窗口触发计算时,执行join
3. interval join也是利用state存储数据再处理,区别在于state中的数据有失效机制,依靠数据触发数据清理;
4. 目前Stream join的结果是数据的笛卡尔积;
5. 日常使用中的一些问题,数据延迟、window序列化相关。
二. 双流join与传统数据库表join的区别