zoukankan      html  css  js  c++  java
  • 中文分词接口api,采用结巴分词PHP版中文分词接口

    中文分词,分词就是将连续的字序列按照一定的规范重新组合成词序列的过程。我们知道,在英文的行文中,单词之间是以空格作为自然分界符的,而中文只是字、句和段能通过明显的分界符来简单划界,唯独词没有一个形式上的分界符,虽然英文也同样存在短语的划分问题,不过在词这一层上,中文比之英文要复杂得多、困难得多。

    中文分词api使用说明

    1. 接口url
    https://jsonin.com/fenci.php
    2. POST或GET参数[type非必须;msg必须]
    type=fenci 或 type=cixing
    msg=待分词的中文文本
    3. 例如GET:
    https://jsonin.com/fenci.php?msg=针对近期发生的
    ["针对","近期","发生","的"]

     
    本接口采用结巴分词PHP版,运行效率还可以接受,欢迎提出宝贵意见建议!

    在线中文分词接口演示 https://jsonin.com/fenci.html

  • 相关阅读:
    (水题)洛谷
    (水题)洛谷
    洛谷
    (水题)洛谷
    POJ
    poj 3061(二分 or 尺取法)
    poj 2456(二分)
    poj 1064(二分答案)
    POJ 2559(单调栈)
    STL
  • 原文地址:https://www.cnblogs.com/daxiangxm/p/zhongwenfenci.html
Copyright © 2011-2022 走看看