《阿里如何实现秒级百万TPS？搜索离线大数据平台架构解读》--阅读

zoukankan html css js c++ java

《阿里如何实现秒级百万TPS？搜索离线大数据平台架构解读》--阅读

离线？在阿里搜索工程体系中我们把搜索引擎、在线算分、SearchPlanner等ms级响应用户请求的服务称之为“在线”服务；与之相对应的，将各种来源数据转换处理后送入搜索引擎等“在线”服务的系统统称为“离线”系统。

特点：1. 任务模型上区分全量和增量（1）全量是指将搜索业务数据全部重新处理生成，并传送给在线引擎，一般是每天一次。这么做有两个原因：有业务数据是daily更新；引擎需要全量数据来高效的进行索引整理和预处理，提高在线服务效率。(2）增量是指将上游数据源实时发生的数据变化更新到在线引擎中。(3）性能方面有较高要求。全量需要极高吞吐能力，确保数以亿计的数据可以在数小时内完成。增量则需要支持数万TPS秒级的实时性，还需要有极高的可用性。

搜索离线引入Hbase?：1.通过Scan/Get可以批量/单条的获取数据，通过bulkload/put可以批量/单条的导入数据，这与搜索的全量/增量模型完全吻合，天然适合支持搜索离线业务2.底层存储基于HDFS，LSM-Tree的的架构能够确保数据安全性，计算存储分离的架构保证了集群规模水平可扩展，易于提高整体的吞吐。通过单机性能优化（Async、BucketCache、Handler分层、Offheap）和集群的扩容，确保了业务大幅增长时，存储从来没有成为系统的瓶颈。3.Free Schema的特性能够很好的应对业务数据频繁变化的情况，也能够方便支持一些特殊业务场景的数据逻辑。

基于Flink的计算架构明显的优势：1.采用SQL来描述Blink任务业务逻辑非常清晰，可以直接利用Blink提供的各种Operator完成数据处理，方便任务的调试，例如：dim join、groupby，而不是在Datastream时期需要自行编写完成类似Hbase Join的Operator。2.Blink 2.1原生支持Batch，采用Batch模式可以直接完成生成HFile的任务，下线MR任务，彻底统一计算引擎到Blink。Batch模式任务执行时采用分阶段调度可以大幅的节省计算资源，提高集群效率。Blink SQL可以通过修改提交模式，分别转化为Stream或Batch任务，在保持业务逻辑稳定的同时方便任务调试和验证。3.通过Bayes这样的开发平台服务化的方式提交任务到不同集群，彻底解决以前任务通过GateWay提交运维复杂的问题，添加新的Yarn集群只需要简单配置即可完成。另外在Bayes上同样会保存Bahamut自动生成提交的Sql，可以在Bayes上直接进行任务的调试和管理，方便了开发人员。

搜索离线平台从0到1的建设已经走过了两年,还是很不错的。值得各大企业借鉴学习。

查看全文

相关阅读:
苹果开发者账号多少钱？个人/公司/企业申请费用及怎么选【都有】
uniapp ios真机调试【亲测有效】
Uniapp---IOS打包证书私钥密码怎么获取？
微信小程序地图计算两个点之间的距离
 各大地理坐标系互转
 解决mac下vscode等应用中vim光标无法快速移动
 python 脚本如何在后代运行并记录标准输出
 wkhtmltox 在Linux上安装
 shell中的##*,%%*问题
 matplotlib、seaborn 展示中文字体

原文地址：https://www.cnblogs.com/mm20/p/11042825.html