zoukankan      html  css  js  c++  java
  • 深度学习

    传统方法的局限性:

    一:数据稀疏性:

    语言是离散的符号系统,每个字符,单词都是离散型随机变量。而机器学习模型只接受向量。所以为了将文本转换成向量,通常要将离散符号按照其索引编码为One-hot向量。

    然而近义词之间并不能通过这种方式编码成相似的向量。

    将任意词语表示为固定长度为n的稠密向量,并且稠密向量的维度远小于词表体积,可以好好地解决相似性问题,并且由于向量的长度变短,能显著降低模型参数的数量。

    这种思路被称为“词向量”。

    二:人工特征工程的不足:

    高级NLP任务需要有复杂的特征。然而传统的自然语言处理使用的是手工制定的特征模板。比如中文分词:使用的是上一个字符和当前字符的组合。命名实体识别:前后两个单词与当前单词经常组合。这样的特征模板会带来数据稀疏的困扰。即便有前人对特征工程的研究工作。他们使得某些数据集有相应的特征模板,但不适合所有领域。

    三:误差传播问题:

    流水线式的作业方式存在严重的误差传播问题,前一个模块产生的错误被输入到下一个模块中会产生更大的错误。

    深度学习入门:

    可以自动学习事物的向量表示(vectorial representation)的模型。在深度学习中,相对于传统机器学习,特征末班被多层感知机替代。

    多层感知机通过权重矩阵对样本的上一个特征进行线性变换,通过非线性函数对特征强度进行激活。通常将输出层的特征输入到softmax函数得到一个后验概率分布。

     然后将该分布与经验分布的交叉熵作为损失函数。由于该损失函数为非凸函数,一般采用梯度下降法进行优化。

    (更多详见Pattern recognition and machine learning)

    后验概率分布与先验概率分布:https://blog.csdn.net/qq_40597317/article/details/82388164

  • 相关阅读:
    linux 常用命令大全
    socket的读写函数readn和writen函数
    python中exec 和eval的用法
    python中set集合介绍
    python中下划线变量的规则和意义
    关于小端字节序和大端字节序的解释
    需要学习的网站
    关于尾递归节省内存空间
    python中的with语句
    python中的类变量和对象变量,以及传值传引用的探究
  • 原文地址:https://www.cnblogs.com/liuguangshou123/p/13766031.html
Copyright © 2011-2022 走看看