浅层语义分析及SPARQL在问答系统中的应用
摘要:为了解决受限域问答系统中答案抽取的问题,提出了一种基于浅层语义分析的问答系统模型。该模型以自然语言为接口,利用医院信息本体,采用浅层语义分析技术,由语义块定义规则和语义块判定规则,首先生成问句向量,然后利用SPARQL查询技术,在本体中进行查询,从而得到答案。
问句预处理(分词,词性标注(ICTCLAS),去除停用词)->语义块识别->生成问句向量
基于深度学习算法的中文文本与SPARQL的转换方法研究(好文章)
基于Seq2Seq的SPARQL翻译模型,该模型能够实现直接将用户提出的中文自然语言问句转换为SPARQL标记序列,然后生成SPARQL语句。
1、问题分析模块:该模块将分析该自然语言问句的语言学特征,通过命名实体识别、词性标注、信息抽取、句法分析、依存关系分析、逻辑形式转换等技术,完成问题分类和关键词提取等任务。
2、词语链接和映射模块:从问题中提取的关键词语映射到知识库中的资源(通过计算词语的词向量和资源标签词向量之间的相似度,从而决定映射的关系)
3、词语和语义消歧:(第一种方法,判断资源所定义的上下文与词语所处环境是否一致,第二种方法,计算相似度,选择相似度最高的资源)
4、查询构建模块:结合上面几个模块的内容,生成与最初用户所提问句对应的SPARQL查询语句。
面向自然语言查询的知识搜索关键技术研究
本文首先从自然语言到知识库的实体和关系的映射上,提出了基于层次化的实体映射和基于外部数据集的关系映射算法,同时,本文还提出了基于手工定义模板和基于语义关系抽取的自动生成算法,实现从无结构化自然语言查询语句到结构化查询语句之间的映射。
实体匹配算法的研究
智能问答系统的研究与实现
词法分析(中文分词和词性标注处理)、问句分类、主体识别、谓词识别与消歧、问句元转换
面向自然问句的SPARQL查询和生成方法研究与实现
不知所云
基于语义查询图的结构化查询生成框架研究