zoukankan      html  css  js  c++  java
  • SCWS分词扩展在UNIX/LINUX下的安装方法

    <?php
    /**
     * 中文分词处理方法
     *+---------------------------------
     * @param stirng  $string 要处理的字符串
     * @param boolers $sort=false 根据value进行倒序
     * @param Numbers $top=0 返回指定数量,默认返回全部
     *+---------------------------------
     * @return void
     */
    function scws($text, $top = 5, $return_array = false, $sep = ',') {
        include('./pscws4/pscws4.php');//去下面给的网址把pscws4下载下来
        $cws = new pscws4('utf-8');
        $cws -> set_charset('utf-8');
        $cws -> set_dict('./pscws4/etc/dict.utf8.xdb');
        $cws -> set_rule('./pscws4/etc/rules.utf8.ini');
        //$cws->set_multi(3);
        $cws -> set_ignore(true);
        //$cws->set_debug(true);
        //$cws->set_duality(true);
        $cws -> send_text($text);
        $ret = $cws -> get_tops($top, 'r,v,p');
        $result = null;
        foreach ($ret as $value) {
            if (false === $return_array) {
                $result .= $sep . $value['word'];
            } else {
                $result[] = $value['word'];
            }
        }
        return false === $return_array ? substr($result, 1) : $result;
    }
    print_r(scws('百度安全'));

    ?>

    scws下载:http://www.xunsearch.com/scws/download.php

    pscws4下载:http://download.csdn.net/detail/pzp_118/5412639

  • 相关阅读:
    如何判断PHP 是ts还是nts版的
    让IE支持placeholder属性
    解决点击浏览器后退按钮页面过期的问题
    git记住用户名密码
    php保存base64数据
    azure注册码
    SQL Server 2008 R2密钥序列号
    SQL允许远程访问
    PHP生成表格
    PHP发起get post put delete请求
  • 原文地址:https://www.cnblogs.com/milantgh/p/4673362.html
Copyright © 2011-2022 走看看