zoukankan      html  css  js  c++  java
  • 使用 python 进行微信好友分析

    使用 python 进行微信好友分析

    1. 使用到的库

    ① wxpy:初始化微信机器人

    ② openpyxl:保存微信好友数据为Excel表格

    ③ pyecharts:生成可视化的地图

    ④ wordcloud、matplotlib、jieba:生成词云图

    特别提醒】:pyecharts 库用的是0.5.x版本,而在 pip 中安装的为1.x.x版本,因此需要自行到【官网】中下载。

    2. 基本功能

    ① 分析微信好友数据

    ② 生成词云图

    ③ 生成地图展示

    3. 代码实现

    此处使用类来实现

    (1) 导入模块

     

    1 #  导入模块
    
    2 from wxpy import Bot
    
    3 import openpyxl
    
    4 from pyecharts import Map
    
    5 from wordcloud import WordCloud
    
    6 import matplotlib.pyplot as plt
    
    7 import jieba

     

     

    (2) 初始化机器人和获取微信好友的源信息

    此处调用 Bot() 方法,需要扫码登陆微信网页版,后续操作才能进行。

     

     1 def __init__(self, ToExcelFile="", ToCityFile="", ToMapProvinceFile="", ToMapCityFile=""):
    
     2     ''' 初始化机器人和其他参数 '''
    
     3     # 初始化机器人,需要扫码
    
     4     self.bot = Bot()
    
     5     # 获取我所有的微信好友信息 - 存储基础信息(未处理)
    
     6     self.allFriends_Info = self.bot.friends()
    
     7     # 我的微信好友个数
    
     8     self.allFriends_Num = len(self.allFriends_Info)
    
     9     # 保存微信好友信息的表格文件路径(.xlsx)
    
    10     self.ExcelFile = ToExcelFile
    
    11     # 保存城市词云图的文件路径(.png/.jpg)
    
    12     self.WCOfCityFile = ToCityFile
    
    13     # 保存省份地图的文件路径(.html)
    
    14     self.MapProvinceFile = ToMapProvinceFile
    
    15     # 其他可用参数
    
    16     self.MapCityFile = ToMapCityFile
    
    17     # 自动调用run方法,使得在实例化对象后自动运行其他函数
    
    18     self.run()

     

     

    (3) 统计和处理微信好友的信息

    除了列出的还有 个性签名、头像其他属性。

     

     

    1 def getFriendsInfo(self):
    
     2     ''' 获取微信好友的全部信息 '''
    
     3     # 存储微信好友的信息(经过信息处理的)
    
     4     self.friendsInfo = []
    
     5     # 定义列标题
    
     6     self.infoTitle = ['NickName', 'RemarkName', 'Sex', 'Province', 'City']
    
     7     for aFriend in self.allFriends_Info:
    
     8         # 获取昵称
    
     9         NickName = aFriend.raw.get(self.infoTitle[0], None)
    
    10         # 获取备注
    
    11         RemarkName = aFriend.raw.get(self.infoTitle[1], None)
    
    12         # 获取性别
    
    13         Sex = {1:"", 2:"", 0:"其他"}.get(aFriend.raw.get(self.infoTitle[2], None), None)
    
    14         # 获取省份
    
    15         Province = aFriend.raw.get(self.infoTitle[3], None)
    
    16         # 获取城市
    
    17         City = aFriend.raw.get(self.infoTitle[4], None)
    
    18         lisTmp = [NickName, RemarkName, Sex, Province, City]
    
    19         self.friendsInfo.append(lisTmp)

     

     

    (4) 保存微信好友的信息

    在这保存为Excel表格,在代码中插入表头行,为了便于阅读。

     

     

    1 def saveFriendsInfoAsExcel(self, ExcelName):
    
     2     ''' 保存微信好友的信息到 Excel 表格中 '''
    
     3     # 生成openpyxl对象
    
     4     workbook = openpyxl.Workbook()
    
     5     # 激活表格
    
     6     sheet = workbook.active
    
     7     # 设置表格标题
    
     8     sheet.title = 'WeChatFriendsInfo'
    
     9     # 填充列标题到第一行
    
    10     for _ in range(len(self.infoTitle)):
    
    11         sheet.cell(row=1, column=_+1, value=self.infoTitle[_])
    
    12     # 填充微信好友信息,从第二行开始
    
    13     for i in range(self.allFriends_Num):
    
    14         for j in range(len(self.infoTitle)):
    
    15             sheet.cell(row=i+2, column=j+1, value=str(self.friendsInfo[i][j]))
    
    16     # 若文件名非空,则保存到该路径下
    
    17     if ExcelName != "":
    
    18         workbook.save(ExcelName)
    
    19         print(">>> Save WeChat friends' information successfully!")

     

     

    (5) 分析微信好友的信息

    1 def quiteAnalyzeFriendsInfo(self):
    
    2     ''' 分析数据,一步到位,直接了当 '''
    
    3     print(self.allFriends_Info.stats_text())

     

    (6) 生成city词云图

     

     

    1 def creatWordCloudOfCity(self, CityName):
    
     2     ''' 使用获取的数据生成city词云图 '''
    
     3     # 获取所有的城市
    
     4     cityStr = ""
    
     5     for i in range(self.allFriends_Num):
    
     6         if self.friendsInfo[i][4] not in cityStr:
    
     7             cityStr += " " + self.friendsInfo[i][4]
    
     8     #jieba库精确模式分词
    
     9     wordlist = jieba.lcut(cityStr)
    
    10     cityStr = ' '.join(wordlist)
    
    11     # 加载背景图片
    
    12     #cloud_mask = np.array(Image.open(BackGroundFile))
    
    13     #设置词云图属性
    
    14     font = r'C:WindowsFontssimfang.ttf' # 设置字体路径
    
    15     wc = WordCloud(
    
    16         background_color = 'black',     # 背景颜色
    
    17         #mask = cloud_mask,             # 背景图片
    
    18         max_words = 100,                # 设置最大显示的词云数
    
    19         font_path = font,               # 设置字体形式(在本机系统中)
    
    20         height = 300,                   # 图片高度
    
    21         width = 600,                    # 图片宽度
    
    22         max_font_size = 100,            # 字体最大值
    
    23         random_state = 100,             # 配色方案的种类
    
    24         )
    
    25     # 生成词云图
    
    26     myword = wc.generate(cityStr)
    
    27     #展示词云图
    
    28     plt.imshow(myword)
    
    29     plt.axis('off')
    
    30     plt.show()
    
    31     # 若文件名非空,则保存到该路径下
    
    32     if CityName != "":
    
    33         #保存词云图
    
    34         wc.to_file(CityName)
    
    35         print(">>> Creat WeChat wordcloud of city successfully!")

     

     

    (7) 生成province地图

     

     

    1 def creatMapProvince(self, MapFile):
    
     2     ''' 使用获取的数据生成province地图 '''
    
     3     # 获取所有省份
    
     4     provinceList, provinceNum = [], []
    
     5     for i in range(self.allFriends_Num):
    
     6         if self.friendsInfo[i][3] not in provinceList:
    
     7             provinceList.append(self.friendsInfo[i][3])
    
     8             provinceNum.append(0)
    
     9     for i in range(self.allFriends_Num):
    
    10         for j in range(len(provinceList)):
    
    11             if self.friendsInfo[i][3] == provinceList[j]:
    
    12                 provinceNum[j] += 1
    
    13     # 生成 Map
    
    14     map = Map("各省微信好友分布", width=1000, height=800)
    
    15     map.add("", provinceList, provinceNum, maptype="china", is_visualmap=True, visual_text_color='#000')
    
    16     # 若文件名非空,则保存到该路径下
    
    17     if MapFile != "":
    
    18         map.render(MapFile)
    
    19         print(">>> Creat WeChat Map of Provinces seccessfully!")

     

     

    (8) 生成city地图

     

    1 def creatMapCity(self, MapFile):
    
     2         ''' 使用获取的数据生成city地图 '''
    
     3         # 获取所有省份
    
     4         CityList, CityNum = [], []
    
     5         for i in range(self.allFriends_Num):
    
     6             if self.friendsInfo[i][4] not in CityList:
    
     7                 CityList.append(self.friendsInfo[i][4])
    
     8                 CityNum.append(0)
    
     9         for i in range(self.allFriends_Num):
    
    10             for j in range(len(CityList)):
    
    11                 if self.friendsInfo[i][4] == CityList[j]:
    
    12                     CityNum[j] += 1
    
    13         for i in range(len(CityList)):
    
    14             CityList[i] += ''
    
    15         # 生成 Map
    
    16         map = Map("各市微信好友分布", width=1000, height=800)
    
    17         map.add("", CityList, CityNum, maptype="广东", is_visualmap=True, visual_text_color='#000')
    
    18         # 若文件名非空,则保存到该路径下
    
    19         if MapFile != "":
    
    20             map.render(MapFile)
    
    21             print(">>> Creat WeChat Map of Cities seccessfully!")
    
     

     

    有了上述实现各个功能的方法,那么就差一个调用各种方法的方法了。

    (9) run方法

     

     

    1 def run(self):
    
     2     # 获取微信好友信息
    
     3     self.getFriendsInfo()
    
     4     print(">>> Get WeChat friends' information successfully!")
    
     5     print(">>> Members:", self.allFriends_Num)
    
     6     # 保存微信好友信息
    
     7     self.saveFriendsInfoAsExcel(self.ExcelFile)
    
     8     # 分析微信好友信息
    
     9     self.quiteAnalyzeFriendsInfo()
    
    10     # 使用微信好友的 city 产生词云图
    
    11     self.creatWordCloudOfCity(self.WCOfCityFile)
    
    12     # 生成微信好友的 province 地图
    
    13     self.creatMapProvince(self.MapProvinceFile)
    
    14     # 生成微信好友的 city 地图
    
    15     self.creatMapCity(self.MapCityFile)

     

    对于文件路径,在main函数中传递即可。【注】:上述代码都在类中,在此处结束,下面为main函数

     

    1 if __name__ == "__main__":
    
    2     ToExcelFile = "./WeChatAnalyze//FriendsInfo.xlsx"      # 微信好友信息的Excel表格保存路径
    
    3     ToPictureFile = "./WeChatAnalyze//CityWordCloud.png"   # 微信好友信息city词云图保存路径
    
    4     ToMapFileProvince = "./WeChatAnalyze//WeChatProvinceMap.html" # 微信好友信息province地图保存路径
    
    5     ToMapFileCity = "./WeChatAnalyze//WeChatCityMap.html"  # 微信好友信息city地图保存路径
    
    6     # WeChatRobot对象实例化
    
    7     robot = WeChatRobot(ToExcelFile, ToPictureFile, ToMapFileProvince, ToMapFileCity)

     

    是不是觉得Main函数很简短,哈哈,没错,就是这么简!

    接下来看看实现的效果吧!

    参考文献:

    ① 用python玩微信:https://segmentfault.com/a/1190000014203617

    ② pyecharts 中部分import 不到:https://blog.csdn.net/weixin_38617311/article/details/81146748

    ③ pyecharts 中地图显示不全:https://blog.csdn.net/xiamoyanyulrq/article/details/80025105

     

     总代码:

     

      1 from wxpy import *
      2 
      3 #初始化机器人,选择缓存模式(扫码)登录
      4 
      5 bot=Bot(cache_path=True)
      6 
      7 #获取我的所有微信好友信息
      8 
      9 friend_all=bot.friends()
     10 
     11 print(friend_all[0].raw)#friend_all[0]是我的微信昵称,.raw 则是获取我的全部信息
     12 
     13 ############运行后会自动弹出二维码页面,手机扫描登陆即可###########
     14 
     15 lis=[]
     16 
     17 for a_friend in friend_all:
     18 
     19     NickName=a_friend.raw.get('NickName',None)
     20 
     21     #Sex=afriend.raw.get('Sex',None)
     22 
     23     Sex={1:"",2:"",0:"其他"}.get(a_friend.raw.get('Sex',None),None)
     24 
     25     City=a_friend.raw.get('City',None)
     26 
     27     Province=a_friend.raw.get("Province",None)
     28 
     29     Sigenature=a_friend.raw.get("Signature",None)
     30 
     31     HeadImgFlagUrl=a_friend.raw.get("HeadImgFlagUrl",None)
     32 
     33     HeadImgFlag=a_friend.raw.get("HeadImgFlag",None)
     34 
     35     list_0=[NickName,Sex,City,Province,Sigenature,HeadImgFlagUrl,HeadImgFlag]
     36 
     37     lis.append(list_0)
     38 
     39 def lis2e07(filename,lis):
     40 
     41     import openpyxl
     42 
     43     wb = openpyxl.Workbook()
     44 
     45     sheet = wb.active
     46 
     47     sheet.title = 'list2excel07'
     48 
     49     file_name = filename +'.xlsx'
     50 
     51     for i in range(0, len(lis)):
     52 
     53         for j in range(0, len(lis[i])):
     54 
     55                 sheet.cell(row=i+1, column=j+1, value=str(lis[i][j]))
     56 
     57     wb.save(file_name)
     58 
     59     print("写入数据成功!")
     60 
     61 lis2e07('list3',lis)
     62 
     63 #######################粗略获取好友信息###############################
     64 
     65 Friends=bot.friends()
     66 
     67 data=Friends.stats_text(total=True,sex=True,top_provinces=30,top_cities=300)
     68 
     69 print(data)
     70 
     71 ######可以从存储在本地的 excel 中读取数据进行分析在执行以
     72 
     73  
     74 
     75 from pandas import read_excel
     76 
     77 df=read_excel('list4.xlsx',sheet_name='list2excel07')
     78 
     79 print(df.tail(7))
     80 
     81 df.city.count()
     82 
     83 df.city.describe()
     84 
     85 import pandas as pd
     86 
     87 #count=df.city.value_count()#对dataframe对 dataframe 进行全频率统计,排除了 nan
     88 
     89 city_list=df['city'].fillna('NAN').tolist()#将dataframe的列转化为list,其中nan用NAN替换
     90 
     91 count_city=pd.value_counts(city_list)#对list进行全频率统计
     92 
     93 from pyecharts import WordCloud
     94 
     95 name=count_city.index.tolist()
     96 
     97 value=count_city.tolist()
     98 
     99 wordcloud=WordCloud(width=1300,height=620)
    100 
    101 wordcloud.add("",name,value,word_size_range=[20,100])
    102 
    103 wordcloud.show_config()
    104 
    105 wordcloud.render(r'cy.html')
    106 
    107 province_list=df['province'].fillna('NAN').tolist()
    108 
    109 count_province=pd.value_counts(province_list)#对list进行全频率统计
    110 
    111 from pyecharts import Map
    112 
    113 value=count_province.tolist()
    114 
    115 attr=count_province.index.tolist()
    116 
    117 map=Map("各省微信好友分布",width=1000,height=600)
    118 
    119 map.add("",attr,value,maptype='china',is_visualmap=True,visual_text_color='#000',is_label_show=True)#显示地图上的省份
    120 
    121 map.show_config()
    122 
    123 map.render(r'FriendMap.html')

    成果图如下:

  • 相关阅读:
    (3)Smali系列学习之Smali语法详解
    (2.1)Smali系列学习之基础语法
    (2.0)Smali系列学习之Smali语法
    Why NHibernate updates DB on commit of read-only transaction
    用LinqPad查看Nhibernate生成的sql语句
    Oracle中Clob类型处理解析
    时间线插件
    深入理解OAuth2.0协议
    项目经理问:为什么总是只有我在加班–挂包袱现象
    Nhibernate Case SUM
  • 原文地址:https://www.cnblogs.com/Exin/p/10966040.html
Copyright © 2011-2022 走看看