zoukankan      html  css  js  c++  java
  • nlp算法

     

    人工智能算法大体上来说可以分类两类:基于统计的机器学习算法(Machine Learning)和深度学习算法(Deep Learning)

    总的来说,在sklearn中机器学习算法大概的分类如下:

    1. 纯算法类

    (1).回归算法
    (2).分类算法
    (3).聚类算法
    (4)降维算法
    (5)概率图模型算法
    (6)文本挖掘算法
    (7)优化算法
    (8)深度学习算法

    2.建模方面

    (1).模型优化
    (2).数据预处理

    二、详细算法

    1.分类算法

    (1).LR (Logistic Regression,逻辑回归又叫逻辑分类)
    (2).SVM (Support Vector Machine,支持向量机)
    (3).NB (Naive Bayes,朴素贝叶斯)
    (4).DT (Decision Tree,决策树)

    • 1).C4.5
    • 2).ID3
    • 3).CART

    (5).集成算法

    • 1).Bagging
    • 2).Random Forest (随机森林)
    • 3).GB(梯度提升,Gradient boosting)
    • 4).GBDT (Gradient Boosting Decision Tree)
    • 5).AdaBoost
    • 6).Xgboost

    (6).最大熵模型

    2.回归算法

    (1).LR (Linear Regression,线性回归)
    (2).SVR (支持向量机回归)
    (3). RR (Ridge Regression,岭回归)

    3.聚类算法

    (1).Knn
    (2).Kmeans 算法
    (3).层次聚类
    (4).密度聚类

    4.降维算法

    (1).SGD (随机梯度下降)

    5.概率图模型算法

    (1).贝叶斯网络
    (2).HMM
    (3).CRF (条件随机场)

    6.文本挖掘算法

    (1).模型

    • 1).LDA (主题生成模型,Latent Dirichlet Allocation)
    • 2).最大熵模型

    (2).关键词提取

    • 1).tf-idf
    • 2).bm25
    • 3).textrank
    • 4).pagerank
    • 5).左右熵 :左右熵高的作为关键词
    • 6).互信息:

    (3).词法分析

    • 1).分词
      – ①HMM (因马尔科夫)
      – ②CRF (条件随机场)
    • 2).词性标注
    • 3).命名实体识别

    (4).句法分析

    • 1).句法结构分析
    • 2).依存句法分析

    (5).文本向量化

    • 1).tf-idf
    • 2).word2vec
    • 3).doc2vec
    • 4).cw2vec

    (6).距离计算

    • 1).欧氏距离
    • 2).相似度计算

    7.优化算法

    (1).正则化

    • 1).L1正则化
    • 2).L2正则化

    8.深度学习算法

    (1).BP
    (2).CNN
    (3).DNN
    (3).RNN
    (4).LSTM

    三、建模方面

    1.模型优化·

    • (1).特征选择
    • (2).梯度下降
    • (3).交叉验证
    • (4).参数调优
    • (5).模型评估:准确率、召回率、F1、AUC、ROC、损失函数

    2.数据预处理

      • (1).标准化
      • (2).异常值处理
      • (3).二值化
      • (4).缺失值填充: 支持均值、中位数、特定值补差、多重插补
  • 相关阅读:
    map/reduce/filter/lambda
    DHCP Option43配置
    函数的参数
    通用路由封装协议——GRE
    spring 中使用quartz实现定时任务
    自己实现的简单的grid
    Java 中 Double 相关问题
    爬坑纪——RESTful WCF
    Hi,UEditor——百度编辑器配置若干
    去除ColumnChart自带的阴影效果
  • 原文地址:https://www.cnblogs.com/luckyplj/p/11058531.html
Copyright © 2011-2022 走看看