zoukankan      html  css  js  c++  java
  • 技术栈_人工智能-大数据-云计算

    技术俯瞰

     云 管 端
      A B C-- 数据 算法 算力
    

    端管云-ABC

    终端-Terminal
    	 端侧数据采集
    	 端侧AI模型
    
    边缘--EON-Edge of Network边缘网络
         数据采集和处理以及上传
    	 数据通信
    	 边缘网络和模型
    
    云端 --Cloud
        01.数据
           结构化数据: 
           非结构化数据
        02. BigData大数据技术趋势
          01.存储和计算分离
    	         计算资源与存储资源可以独立伸缩,计算资源可以在计算完成后立即释放
            001.存储-对象存储 - 湖仓一体  
            002.计算-计算引擎 - 批流一体
          02.资源调度-在线离线混部在线离线混部解决方案
        03.AI模型
    

    湖仓一体

     如何利用对象存储提供的无限存储能力,同时又高效地操作文件系统的元数据
    
    			
    对象存储	
    	 Ceph   是对象存储,块存储和文件系统开源平台
         MinIO  是一款开源云存储软件	
    	 OpenIO 是用于管理和保护大量非结构化数据的开源对象存储解决方案
    	 LakeFS 是一个开源数据环境工具,可让您管理基于对象存储的数据湖
    
    数据湖 :ACID 功能,支持实时消费增量数据、离线批量更新数据
      01.开源     
         Apache CarbonData 华为
         Open Delta Lake  Databricks推出的delta  Delta Lake存储一个事务日志,以跟踪对表目录所做的所有提交,以提供ACID事务
         Apache Hudi     Uber的   Hadoop Upserts Deletes and Incrementals,主要支持Upserts、Deletes和增量数据处理
         Apache Iceberg  Netflix
      02.商业 
         华为
             FusionInsight 智能数据湖
    	     存算分离:OBS实现存储计算解耦
         阿里
           阿里云数据湖构建(Data Lake Formation,DLF)
    	     基于对象存储OSS、数据湖构建Data Lake Formation
    	     存储的部分叫 JindoFS。JindoFS 是阿里云针对云上存储定制的自研大数据存储服务
    	     Jindo FS 有两种使用模式,块存储模式和缓存模式
         腾讯:
           数据湖解决方案以 COS 为数据湖底座,支持多种格式数据海量存储;
           通过数据湖加速器 GooseFS 无缝对接各类计算和机器学习平台,打破数据孤岛
    	   
         ByteLake:字节跳动基于Apache Hudi的实时数据湖平台
    	 微软:
    	   Azure Data Lake -- Azure Data Lake Store
    	   基于 Azure Blob 存储构建的高度可缩放的安全 Data Lake 功能
    	 Amazon
    	  Galaxy数据湖基于Amazon的Simple Storage Service或对象存储服务S3构建
     批流一体
        Spark  Flink
     混部
       K8s
    

    A 人工智能 Artificial Intelligence

    常见的机器学习算法
        线性回归
        逻辑回归
        决策树
        SVM
        朴素贝叶斯
        K最近邻算法
        K均值算法
        随机森林算法
        降维算法
        Gradient Boost 和 Adaboost 算法
    深度神经网络
         DNN--- CNN  RNN
        
        计算机视觉  (Computer Vision  CV)又称为机器视觉(Machine Vision)
        自然语言处理(Natural Language Process, NLP)
        语音识别    (Speech Recognition)
    算法应用等级
       开窗即用
       使用框架
       开发和修改框架的
    

    B 大数据 Big Data

    存储 HDFS Hbase  S3  OBS
    传输 Kafka
    计算 Flink  Spark  Hive  Clickhouse
    资源调度: Yarn Kubernetes   资源调度 时间调度 依赖调度 
    服务  可视化  采集
    

    C 云计算 Cloud

    云计算技术- 云原生 Cloud Native
     以资源编排为主体向以应用编排为主体转变
    	认证  计算机节点管理 计算机网络管理 镜像服务管理  UI服务
    开源的云基础架构服务  OpenStack  围绕虚拟机构建的IaaS资源管理体系
    商业的云基础架构服务
    涉及技术: 服务器虚拟化 有Citrix Xen VMware ESX Server 和Microsoft Hype-V
    未来:-存储和网络  虚拟化网络技术  存储的管理
     资源 应用和服务  安全是底线
     Dev(开发人员)+Ops(运维人员)   
    给用户提供三种环境,实验环境、离线任务、在线服务
  • 相关阅读:
    CentOS7安装node环境
    【异常】update更新java.sql.SQLException: Duplicate entry '2019-07-30 00:00:00-110100' for key
    MySQL查询多行重复数据SQL
    Phoenix批量提交优化,官网的demo
    (转) 读懂IL
    Docker
    Docker
    Rest之路
    (转)Docker
    Docker
  • 原文地址:https://www.cnblogs.com/ytwang/p/14638177.html
Copyright © 2011-2022 走看看