zoukankan      html  css  js  c++  java
  • AI 的架构与核心

    AI 的架构

    人工智能的架构分为三层:应用层、技术层和基础层。

    应用层聚焦在人工智能和各行业各领域的结合。技术层是算法、模型和技术开发。基础层则是计算能力和数据资源。

    数据收集:获取什么类型的数据,数据可以通过那些途径获取。常见的数据来源是采集、购买或其他方式获取现有数据。

        比如中山大学的资深机器学习研究专家梁浩林就分享到,城市地理学领域的数据采集渠道,可以同步获取一些社交APP,比如Yahoo Flickr、Sina Webo的checkin数据,手机的信号数据,用户GPS的轨迹数据等等。

    数据理解:获取到原始数据之后,分析数据里面有什么内容、数据准确性如何,为下一步的预处理做准备。

        比如我们拍摄的各种照片,需要从中识别出包含人脸的照片。

    数据预处理:原始数据可能会有环境影响或者干扰因素,格式化也不好,所以为了保证预测的准确性和有效性,需要进行数据的预处理。

        常见的比如调整照片亮度、对比度、锐化等等。

    特征提取:将数据里有用的,有典型特征的抽取出来。

        比如,对几千张有效照片进行分类,特征包括性别、头发眼睛皮肤颜色、轮廓、脸型等等。

    模型构建:使用适当的算法,获取预期准确的值。

        常用的分类算法包括:决策树分类法(Decision Tree),朴素贝叶斯分类算法(Native Bayesian Classifier)、基于支持向量机(SVM)的分类器、神经网络法(Neural Network)、k-最近邻法(k-nearest neighbor,kNN) 语义树、知识库、各种视觉算法等等等。至于各种算法的区别,我还在学习中。

    模型评估:通常对一个模型进行评估的标准有准确率、查全率。

    查准率 =检索出的相关信息量/检索出的信息总量

    查全率=检索出的相关信息量/系统中的相关信息总量

        狭义上的理解拿人脸识别来讲,假设数据库中存在的10个用户的照片,我对这10个用户进行拍照,识别出来库中包含的人脸有7个,这7个中识别正确的有5个,那么查准率=5/10=50%;查全率就是7/10=70%。另外就是,假设我对1个用户,操作十次,出来的结果是否十次均和实际匹配。我认为也是模型评估的一个标准。

    模型训练:根据模型评估的结果,对模型进行不断的训练甚至是调整,以达到更好的效果。

    模型应用:将模型部署、应用到实际场景中。

    可以回到AI 基本概念和应用中的人脸识别开门场景,来看看如何跟我们的 AI 架构对应的。

    从AI 的结构很容易可以看出来。

    人工智能的核心是基础层,即计算能力和refreshing data flow (持续的数据流)。

    所以大公司愿意投入人工智能和发展人工智能的优势,因为大公司有数据。尤其是Google、Facebook、亚马逊、苹果,还有国内的BAT。于是现在有一个声音会认为:大公司不具备的医疗、基金、金融等数据,可能会是小公司、人工智能初创企业突破的机会。

    技术层的核心主要在于:特征提取, 模型与算法选择。

    Google 在过去两年的时间里,一直致力于 AI 的探索和转型,将机器学习和人工智能技术用到Google Lens、YouTube、Google Map上等。另外还将公司内部开发和采用的机器学习技术整理到了一起,命名为 TensorFlow,也称为第二代人工智能系统,完全开源,任何人都可以用。并且在国内也有专门的社区网站http://www.tensorfly.cn/ 。

    Tensorflow 的优势

    可移植:小到一部智能手机、大到数千台数据中心服务器的各种设备上运行

    开放性:完全开源,任何人都可以用。

    算法:支持CNN、RNN、LSTM 算法,这都是目前在Image(图像),Speech(语音)和NLP最流行的深度神经网络模型。

    应用层主要考虑人工智能+教育、人工智能+医疗、人工智能+金融等的结合。

    ————————————————
    版权声明:本文为CSDN博主「alice_tl」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。
    原文链接:https://blog.csdn.net/alice_tl/article/details/78566426

  • 相关阅读:
    Tips(持续跟新)
    icpc 2018 徐州 网络赛 B 博弈+记忆化搜索
    2018 徐州 icpc 网络赛 A 递推or数学公式
    2018 徐州icpc网络赛 G 分块
    HDU 3092 Least common multiple(完全背包+思维)
    hdu 4747(DP?线性递推)
    Pell-方程学习小结
    C++中map的介绍用法以及Gym题目:Two Sequences
    求最长上升子序列和最长非下降子序列
    dfs+枚举,flip游戏的拓展POJ2965
  • 原文地址:https://www.cnblogs.com/mawenqiangios/p/11640507.html
Copyright © 2011-2022 走看看