zoukankan      html  css  js  c++  java
  • python用户评论标签匹配的解决方法

    python用户评论标签匹配的解决方法

    这篇文章主要为大家详细介绍了python用户评论标签匹配的解决方法,具有一定的参考价值,感兴趣的小伙伴们可以参考一下

    我们观察用户评论发现:属性词往往和情感词伴随出现,原因是用户通常会在描述属性时表达情感,属性是情感表达的对象。还发现:属性词和专用情感词基本都是名词或形容词(形谓词)。

    算法流程图如下:

    评论数据如下:

    代码如下:

    代码如下:    
    #encoding=utf-8 
      
    ############################# 

    # 功能:给定一些中文的产品评论,希望从中找到评价对象及评价词。 

    # @author:licl 

    ############################## 
      
    fdata = open('JD_DFB_comments_out.txt','r') 
    Output = open('Pattern_Result.txt','a') 
      
    try: 
     data = fdata.readlines() 
       
     listline = [] 
       
       
     for line in data: 
        
      listline = line.replace(" ","/") 
      listline = listline.split("/") 
        
      i = 1
        
      while i < len(listline): 
         
       if listline[i] != "名词": 
          
        i = i 2
          
       else: 
          
        new_list = ["","",""] 
        new_list[0] = listline[i-1] 
          
        a = i-1
        i = i 2
          
        while i < len(listline):     
           
         if listline[i] == "标点": 
            
          i = i 2
          break
           
         else: 
            
          if listline[i-1]=='不' or listline[i-1]=='不怎么样' or listline[i-1]=='不怎么' or listline[i-1]=='不太':  
           new_list[1] = listline[i-1] 
          if listline[i] == "形容词" or listline[i] == "形谓词": 
           new_list[1] = listline[i-1] 
             
           b = i-1    
           t = (b-a)/2  
           new_list[2] = str(t) 
           for line in new_list: 
              
            Output.write(line " ") 
              
           Output.write(" ")  
           break
            
          else: 
           
           i = i 2 
    except: 
     print "‘文件不存在'或者‘文件无法打开'"
        
    finally: 
       
     fdata.close() 
     Output.close()
    以上就是本文的全部内容,希望对大家的学习有所帮助

     

  • 相关阅读:
    8 pandas模块,多层索引
    7 numpy 傅里叶,提取图片轮廓
    6 DataFrame处理丢失数据--数据清洗
    5 pandas模块,DataFrame类
    4 pandas模块,Series类
    3 numpy模块
    2 线性代数基础
    1 Ipython、Jupyter 入门
    jdk安装与环境变量配置(一劳永逸)
    对jsp可见域的变量感悟
  • 原文地址:https://www.cnblogs.com/amengduo/p/9586348.html
Copyright © 2011-2022 走看看