zoukankan      html  css  js  c++  java
  • NLP概览(一)

    NLP是什么?有哪些应用

    NLP即自然语言处理。
    主要应用在语音识别、分词、词性标注、关键词提取、概要、句法分析、语义理解与提取、机器翻译、印刷体或手写体识别、拼写错误、汉字输入、文献查询

    为什么要分词——词是语义的基本单位

    罗马拼音系语言的字词之间天生具有空格,所以分词大多用于象形文件上面,随着欧洲的扩张,使用罗马拼音系的国家非常多,而象形文字,用得最多的无疑是中国了。

    中文体现语义的最小单位是词,比如上面的“罗马”,如果你将其分成“罗”“马”,那就失了原意,当然有的字本身就单独成词,如“我爱你”拆分成“我”“爱”“你”是没有什么问题的。


    因为词是表达语义的基本单位,所以我们要理解一句话的意思,首先就要经过分词。大家可以找一篇古文来看看,加深一下体会。

    转载请注明出处 http://www.cnblogs.com/hx78/ 

    积累,沉淀
  • 相关阅读:
    SQLAlchemy Table(表)类方式
    MySQL简单入门
    第四次作业
    第三次随笔
    第二次随笔
    第一次随笔
    第四次随笔
    第三次作业
    第二次随笔
    第一次随笔
  • 原文地址:https://www.cnblogs.com/hx78/p/7298578.html
Copyright © 2011-2022 走看看