zoukankan      html  css  js  c++  java
  • Text Mining and Analytics WEEK1

    第一周目标

    • 解释自然语言处理中的一些基本概念

    • 解释不同的方式来表示文本数据

    • 解释的两种基本的词联想以及如何从文本数据挖掘聚合关系

    尝试回答以下问题

    • 为了理解一个自然语言句子,计算机必须做些什么?

    • 什么是歧义?

    • 为什么自然语言处理(NLP)对计算机来说很困难?

    • 什么是词袋表示?

    • 为什么这个基于词法的表示比从文本的句法和语义分析派生的表达更健壮?

    • 什么是聚合(paradigmatic)关系?

    • 什么是组合(syntagmatic)关系?

    • 从文本中发现聚合关系的一般思想是什么?

    • 从文本中发现合成关系的一般思路是什么?

    • 在计算上下文相似性时,为什么要进行词频(TF)转换呢?

    • 如何BM25词频转换工作?

    • 当计算上下文相似性时,为什么要做逆文档频率(IDF)权重?

  • 相关阅读:
    文件载入功能
    代码调试功能
    实用项
    连贯操作
    AR模式
    表名操作
    字段映射
    ThinkPHP中的模型二
    创建数据对象
    HDU 4888 Redraw Beautiful Drawings(最大流+判最大流网络是否唯一)
  • 原文地址:https://www.cnblogs.com/yuuken/p/9463250.html
Copyright © 2011-2022 走看看