1.基本概念:
NLP:自然语言处理是研究如何利用计算机技术对语言文本(句子、篇章或话语等)进行处理和加工的一门学科,研究内容包括对词法、句法、语义和语用等信息的识别、分类、提取、转换和生成等各种处理方法和实现技术。
语言的基本属性:语音和文字
2.研究内容:
3.基本问题:
a)形态学(morphology)问题:研究词(word) 由有意义的基本单位-词素(morphemes)的构成问题。单词的识别/ 汉语的分词问题。词素:词根、前缀、后缀、词尾。
b)语法学(syntax)问题:研究句子结构成分之间的相互关系和组成句子序列的规则 。为什么一句话可以这么说也可以那么说?如何建立快速有效的句子结构分析方法?
c)语义学(semantics)问题:研究如何从一个语句中词的意义,以及这些词在该语句中句法结构中的作用来推导出该语句的意义。
d)语用学(pragmatics)问题:研究在不同上下文中语句的应用,以及上下文对语句理解所产生的影响。从狭隘的语言学观点看,语用学处理的是语言结构中有形式体现的那些语境。相反,语用学最宽泛的定义是研究语义学未能涵盖的那些意义。
e)语音学(phonetics)问题:研究语音特性、语音描述、分类及转写方法等。
4.主要困难:
a)大量歧义
b)大量新词和未知语言:
5.研究方法:
6.研究现状: