zoukankan      html  css  js  c++  java
  • nlp Python库之pynlpir

    项目需要,需要分词外加情感分析,网上的很多直接用的情感分析不适合本项目,因此需要修改情感词典从而加以修正。本次使用的就是pynlpir进行分词,然后情感分析逻辑自己搞。
    先跑几个小demo,可以试一试效果
    相关简短介绍:
    NLPIR分詞系統前身為2000年發布的ICTCLAS詞法分析系統,從2009年開始,為了和以前工作進行大的區隔,並推廣NLPIR自然語言處理與信息檢索共享平臺,調整命名為NLPIR分詞系統。
    其主要的功能有中文分詞,標註詞性和獲取句中的關鍵詞。
    主要用到的函數有兩個:

    pynlpir.segment(s, pos_tagging=True, pos_names=‘parent‘, pos_english=True)
    pynlpir.get_key_words(s, max_words=50, weighted=False)

    分詞:pynlpir.segment(s, pos_tagging=True, pos_names=‘parent‘, pos_english=True)
    S: 句子
    pos_tagging:是否進行詞性標註
    pos_names:顯示詞性的父類(parent)還是子類(child) 或者全部(all)
    pos_english:詞性顯示英語還是中文

    获取关键词:pynlpir.get_key_words(s, max_words=50, weighted=False)
    s: 句子
    max_words:最大的關鍵詞數
    weighted:是否顯示關鍵詞的權重

  • 相关阅读:
    51Nod 1006 最长公共子序列Lcs
    输入和输出
    51Nod 1092 回文字符串
    51Nod 1050 循环数组最大子段和
    项目初始
    一元多项式求导 (25)
    说反话 (20)
    数组元素循环右移问题 (20)
    素数对猜想 (20)
    换个格式输出整数 (15)
  • 原文地址:https://www.cnblogs.com/zswbky/p/8454058.html
Copyright © 2011-2022 走看看