zoukankan      html  css  js  c++  java
  • 【自然语言】预训练

    预训练 微调

    斯坦福 

    Word Embeding

    • 同义
    • 层级关系

    WordNet 词的网络 树的结构

    人工构建 存在主观性问题

    怎么判断相似度:

    最短路径  - 转换为0~1的相似度(度量)

    分布式表示

    词的语义分布到不同的神经元上

    通过神经元的组合来形成语义的表示

    word2vec

    (找中文版的)

    无监督/自监督

    目标函数/损失函数

    怎么使其预测周围的词

    优化目标函数,需要用梯度下降,要优化的参数是什么?

    词向量的位置是参数(参数其实就是词向量)

    待优化的是uv里面的数值

    负采样

    ELMo:Embeddings from Language Models

    为了得到更符合语境的表示

    假设每一个任务有不同的权重(重要性)

    缩放因子

  • 相关阅读:
    English Dictionary site for ODE and OALD
    vmic environment
    makefile
    the diference between include and import
    windows 工具命令 cmd
    python namespace
    shell cmd args
    ROE, ROC
    IP
    链接及常用软件
  • 原文地址:https://www.cnblogs.com/wfish/p/13898534.html
Copyright © 2011-2022 走看看