zoukankan      html  css  js  c++  java
  • 简单应用复旦FNLP自然语言处理工具(一)

    FNLP是一个基于机器学习的中文自然语言文本处理的开发工具包,FNLP主要是为中文自然语言处理而开发的工具包,也包含为实现这些任务的机器学习算法和数据集。

                                                         ----------百度百科

    • 信息检索 文本分类 新闻聚类
    • 中文处理: 中文分词 词性标注 实体名识别 关键词抽取 依存句法分析 时间短语识别
    • 结构化学习: 在线学习 层次分类 聚类

    在看这篇文章之前,请确定已经装好了Eclipse,如果没有安装Eclipse,请看这里JSP环境安装

    因为FNLP在Github上已经有了很详尽的入门教程,所以在这里我只是把这些教程的顺序、要点和要注意的地方写出来:

    FNLP在Github上的项目地址:中文自然语言处理工具包 Toolkit for Chinese natural language processing (formerly FudanNLP)

    首先先下载最新的fnlp版本文件,点这里............................:)IE浏览器有可能会点不动

    往下找有一个入门教程链接

    入门教程有两个,我感觉第二个教程唯一有用的是一篇介绍Eclipse安装Maven插件的文章,在这里:Eclipse安装Maven插件

    在使用fnlp工具之前,我们需要先安装Maven工具,Maven和maven插件我已经传到了网盘里,这里是地址Maven网盘文件

    现在简单的测试一下你的环境配置有没有成功,打开cmd,分别输入java -version     javac -version     mvn -version

     



    进行到这一步可能有的同学会出现问题,提示没有JAVA_HOME变量,进入电脑系统属性-环境变量,新建系统变量JAVA_HOME,变量值为java/jdk的安装目录,java安装目录在cmd下可以用java -verbose查看

    最后一行的地址就是你的java安装地址,以我的电脑为例,JAVA_HOME的变量名就是C:Program FilesJavajdk1.8.0_20



    好了,现在环境已经配置好了,其实有一些步骤我也是借鉴的第一篇教程,现在开始看第一篇fnlp入门教程:


    为了方便,官方给的模型文件、两个jar包的链接在这里直接贴出来http://pan.baidu.com/s/1D7CVc ,注意jar包只需要下载Trove和Commons-cli两个。

    接下来按教程走 

     

    cmd进入fnlp源码目录,如我的fnlp文件放在E:/fnlp下,

    执行上面的命令:mvn install -Dmaven.test.skip=true,编译fnlp

    接下来就简单多了,不过要注意官方教程里命令行调用中,包与包的间隔用的  :  号,windows用户要改成  ;  号,英文状态下。

    在Eclipse项目中引用FNLP中需要注意的是,新建一个java Project,如果没有找到,请注意右上角

    然后只要按照Github上的第一个教程就好了


    其实好多都是官方已经说明的,嗯,先感谢一下FNLP项目组成员!!!下面介绍几个常见错误解决办法(百度来的,经过验证)


    一、命令行执行报错模型文件版本错误


      用网盘的模型文件就好了,这种错误是因为你的模型文件和FNLP版本号不符,网盘里永远是最新的


    二、命令行报错找不到或无法加载主类


      首先请确定你的系统变量配置正确,Path,CLASSPATH还有JAVA_HOME

      系统变量的正确配置是类似

       只要把JAVA_HOME换成你的jdk目录就好了


    三、如果报错空指针异常之类的错误,怎么也检查不到代码错误,或者干脆是cmd执行却还是报空指针异常

      额,恭喜你,估计是源文件有问题,欢迎加群253541693,报告管理员。 

    四、无论是maven,fnlp或者jdk,安装目录都不要用中文,否则奇奇怪怪的问题就来了。虽然,我的是英文路径。


    因为本人也是刚刚认识的FNLP,在安装使用的过程中遇到了问题,也走了弯路,所以特地将安装使用过程详细的整理了下,希望能给想要使用FNLP的同学以帮助!

    最后,欢迎有问题有错误的同学到这里一起讨论,共同进步。转载请注明来自任祥磊。 

  • 相关阅读:
    eclipse上运行spark程序
    Java实现高斯模糊算法处理图像
    Hadoop环境共享
    P1182 数列分段`Section II`
    NOIP2015题解
    镜面上的迷失之链 —— 二分判定性问题
    网络最大流
    [IOI2008]Island
    历史的进程——单调队列
    快速幂
  • 原文地址:https://www.cnblogs.com/Oscar-ren/p/fnlp_install.html
Copyright © 2011-2022 走看看