zoukankan      html  css  js  c++  java
  • [ML]机器学习分类科普

    学习的两个分支:基于符号主义的专家系统(使用规则),基于连接主义的概率统计的系统(如机器学习,深度学习)

    使用哪种系统主要看数据量,没有数据或者数据量很少的时候使用专家系统,有大量数据的时候使用机器学习或者深度学习

    专家系统=推理引擎+知识

    专家系统的流程:

    任务:搭建金融知识图谱

    1、金融领域或者风控领域的专家,输出经验

    2、知识图谱工程师结合专家的经验构建知识图谱,并将知识导入到知识库中

    3、AI/算法工程师构建推理引擎(基于知识库),生成API

    4、业务系统使用API,即可使用金融知识图谱

    专家系统的特点:

    • 处理不确定性

    • 知识的表示,如知识图谱,将非结构的知识表示成结构化的知识图谱

    • 可解释性,因为它是基于规则来做的,规则是很好解释的,所以专家系统具有非常好的可解释性

    • 可以做知识推理,因为它的可解释性较强,因此可以做推理

    专家系统的缺点:

    • 涉及大量的规则

    • 需要领域专家来主导

    • 可移植性差

    • 学习能力差

    • 人能考虑的范围是有限的

    搭建专家系统时可能会遇到的问题:

    • 逻辑推理

    • 解决规则冲突,引用逻辑推理的方法:有n条已知的规则,有1条规则是需要证明的,如果能证明出来,说明规则没有冲突,否则,规则是冲突的,我们需要删除冲突的规则

    • 选择最小规则的子集,有很多的方法,如贪心方法等

    解决一个难题的思路

    • 找出一个类似的“经典的”问题,如选择最小规则的子集方法,对应的经典问题可以是“set cover problem”

    • 阅读相关文献

     

    机器学习

    1、定义:自动从已有的数据里找出一些规律,然后把学到的这些规律应用到对未来数据的预测中,或者在不确定环境下自动的做一些决策。

    2、分类:

     监督学习无监督学习
    生成模型 朴素贝叶斯方法 HMM,LDA,GMM(高斯混合模型)
    判别模型 逻辑回归方法,CRF模型

    监督学习:线性回归,逻辑回归,朴素贝叶斯,神经网络,SVM,随机森林,Adaboost,CNN等

    无监督学习:K-means(聚类),PCA,ICA,MF(矩阵分解),LSA,LDA

    生成模型:通过已训练好的模型,生成数据

    判别模型:计算数据之间的区别

    搭建一个模型的工作流程:

    1、经典流程:数据——>数据清洗——>特征工程——>建模——>预测

    2、端到端流程:去掉特征工程

    ——来源于贪心科技NLP班的笔记

  • 相关阅读:
    红楼【建筑位置】
    红楼【人物关系】
    jenkins【shared-libraries】
    linux 安装mysql8.0 tar.xz
    MySQL 输入字符串对日期进行模糊查询
    解决kali linux 和 win10 双系统时间不一致问题
    linux idea桌面图标
    linux卸载openjdk11
    tar.xz解压
    pandas模块高性能使用方法总结
  • 原文地址:https://www.cnblogs.com/mj-selina/p/12853110.html
Copyright © 2011-2022 走看看