zoukankan      html  css  js  c++  java
  • 在linux上centos6安装scws中文分词系统

    SCWS是免费开源的中文分词系统,我就是安装了玩玩,本文所有经验取自网络;

    原文链接:http://www.xunsearch.com/scws/docs.php#instscws

    首先说明一下:

    想要在自己的环境里面应用scws分词系统,可分为两个部分;

    第一步要安装scws系统;

    第二步要添加php的csws扩展;

    那么首先安装我把内容简单复制一下:

    1. 取得 scws-1.2.3 的代码
    cd /
    mkdir sc_tmp wget http://www.xunsearch.com/scws/down/scws-1.2.3.tar.bz2 2. 解开压缩包 tar xvjf scws-1.2.3.tar.bz2 3. 进入目录执行配置脚本和编译 cd scws-1.2.3
    ./configure --prefix=/usr/local/scws

    make ; make install 注:这里和通用的 GNU 软件安装方式一样,具体选项参数执行 ./configure --help 查看。 常用选项为:--prefix=<scws的安装目录> 4. 顺利的话已经编译并安装成功到 /usr/local/scws 中了,执行下面命令看看文件是否存在 ls -al /usr/local/scws/lib/libscws.la 5. 试试执行 scws-cli 文件 /usr/local/scws/bin/scws -h scws (scws-cli/1.2.3) Simple Chinese Word Segmentation - Command line usage. Copyright (C)2007 by hightman. ... 6 用 wget 下载并解压词典,或从主页下载然后自行解压再将 *.xdb 放入 /usr/local/scws/etc 目录中 cd /usr/local/scws/etc wget http://www.xunsearch.com/scws/down/scws-dict-chs-gbk.tar.bz2 wget http://www.xunsearch.com/scws/down/scws-dict-chs-utf8.tar.bz2 tar xvjf scws-dict-chs-gbk.tar.bz2 tar xvjf scws-dict-chs-utf8.tar.bz2

    完成上面的操作,不出意外的话scws就已经安装到本地服务器了;
    那么接下来就是添加php的scws扩展了;
    cd /sc_tmp/scws-1.2.3/phpext/
    跟安装curl一样,进入到源码目录;
    /usr/local/php/bin/phpize;
    调用phpize程序生成编译配置文件;
    ./configure --with-scws=/usr/local/scws --with-php-config=/usr/local/php/bin/php-config
    make
    make install
    配置 编译 安装,完成;

     在 php.ini 中加入以下几行
    
    [scws]
    ;
    ; 注意请检查 php.ini 中的 extension_dir 的设定值是否正确, 否则请将 extension_dir 设为空,
    ; 再把 extension = scws.so 指定绝对路径。
    ;
    extension = scws.so
    scws.default.charset = gbk
    scws.default.fpath = /usr/local/scws/etc

    然后重启服务器,就可以在info上面看到已经安装了scws扩展了。
     
  • 相关阅读:
    机器学习【工具】:Numpy
    机器学习【算法】:KNN近邻
    【笔记】:字典内部剖析
    【笔记】:谁偷了我的内存?
    什么是RESTful框架
    音频下载服务
    【模块】:Requests(二)
    【模块】:Weakref
    异步Web服务(二)
    【Win10】UAP/UWP/通用 开发之 RelativePanel
  • 原文地址:https://www.cnblogs.com/eis13/p/5508994.html
Copyright © 2011-2022 走看看