使用 python 进行微信好友分析
1. 使用到的库
① wxpy:初始化微信机器人
② openpyxl:保存微信好友数据为Excel表格
③ pyecharts:生成可视化的地图
④ wordcloud、matplotlib、jieba:生成词云图
【特别提醒】:pyecharts 库用的是0.5.x版本,而在 pip 中安装的为1.x.x版本,因此需要自行到【官网】中下载。
2. 基本功能
① 分析微信好友数据
② 生成词云图
③ 生成地图展示
3. 代码实现
此处使用类来实现
(1) 导入模块
1 # 导入模块 2 from wxpy import Bot 3 import openpyxl 4 from pyecharts import Map 5 from wordcloud import WordCloud 6 import matplotlib.pyplot as plt 7 import jieba
(2) 初始化机器人和获取微信好友的源信息
此处调用 Bot() 方法,需要扫码登陆微信网页版,后续操作才能进行。
1 def __init__(self, ToExcelFile="", ToCityFile="", ToMapProvinceFile="", ToMapCityFile=""): 2 ''' 初始化机器人和其他参数 ''' 3 # 初始化机器人,需要扫码 4 self.bot = Bot() 5 # 获取我所有的微信好友信息 - 存储基础信息(未处理) 6 self.allFriends_Info = self.bot.friends() 7 # 我的微信好友个数 8 self.allFriends_Num = len(self.allFriends_Info) 9 # 保存微信好友信息的表格文件路径(.xlsx) 10 self.ExcelFile = ToExcelFile 11 # 保存城市词云图的文件路径(.png/.jpg) 12 self.WCOfCityFile = ToCityFile 13 # 保存省份地图的文件路径(.html) 14 self.MapProvinceFile = ToMapProvinceFile 15 # 其他可用参数 16 self.MapCityFile = ToMapCityFile 17 # 自动调用run方法,使得在实例化对象后自动运行其他函数 18 self.run()
(3) 统计和处理微信好友的信息
除了列出的还有 个性签名、头像等其他属性。
1 def getFriendsInfo(self): 2 ''' 获取微信好友的全部信息 ''' 3 # 存储微信好友的信息(经过信息处理的) 4 self.friendsInfo = [] 5 # 定义列标题 6 self.infoTitle = ['NickName', 'RemarkName', 'Sex', 'Province', 'City'] 7 for aFriend in self.allFriends_Info: 8 # 获取昵称 9 NickName = aFriend.raw.get(self.infoTitle[0], None) 10 # 获取备注 11 RemarkName = aFriend.raw.get(self.infoTitle[1], None) 12 # 获取性别 13 Sex = {1:"男", 2:"女", 0:"其他"}.get(aFriend.raw.get(self.infoTitle[2], None), None) 14 # 获取省份 15 Province = aFriend.raw.get(self.infoTitle[3], None) 16 # 获取城市 17 City = aFriend.raw.get(self.infoTitle[4], None) 18 lisTmp = [NickName, RemarkName, Sex, Province, City] 19 self.friendsInfo.append(lisTmp)
(4) 保存微信好友的信息
在这保存为Excel表格,在代码中插入表头行,为了便于阅读。
1 def saveFriendsInfoAsExcel(self, ExcelName): 2 ''' 保存微信好友的信息到 Excel 表格中 ''' 3 # 生成openpyxl对象 4 workbook = openpyxl.Workbook() 5 # 激活表格 6 sheet = workbook.active 7 # 设置表格标题 8 sheet.title = 'WeChatFriendsInfo' 9 # 填充列标题到第一行 10 for _ in range(len(self.infoTitle)): 11 sheet.cell(row=1, column=_+1, value=self.infoTitle[_]) 12 # 填充微信好友信息,从第二行开始 13 for i in range(self.allFriends_Num): 14 for j in range(len(self.infoTitle)): 15 sheet.cell(row=i+2, column=j+1, value=str(self.friendsInfo[i][j])) 16 # 若文件名非空,则保存到该路径下 17 if ExcelName != "": 18 workbook.save(ExcelName) 19 print(">>> Save WeChat friends' information successfully!")
(5) 分析微信好友的信息
1 def quiteAnalyzeFriendsInfo(self): 2 ''' 分析数据,一步到位,直接了当 ''' 3 print(self.allFriends_Info.stats_text())
(6) 生成city词云图
1 def creatWordCloudOfCity(self, CityName): 2 ''' 使用获取的数据生成city词云图 ''' 3 # 获取所有的城市 4 cityStr = "" 5 for i in range(self.allFriends_Num): 6 if self.friendsInfo[i][4] not in cityStr: 7 cityStr += " " + self.friendsInfo[i][4] 8 #jieba库精确模式分词 9 wordlist = jieba.lcut(cityStr) 10 cityStr = ' '.join(wordlist) 11 # 加载背景图片 12 #cloud_mask = np.array(Image.open(BackGroundFile)) 13 #设置词云图属性 14 font = r'C:WindowsFontssimfang.ttf' # 设置字体路径 15 wc = WordCloud( 16 background_color = 'black', # 背景颜色 17 #mask = cloud_mask, # 背景图片 18 max_words = 100, # 设置最大显示的词云数 19 font_path = font, # 设置字体形式(在本机系统中) 20 height = 300, # 图片高度 21 width = 600, # 图片宽度 22 max_font_size = 100, # 字体最大值 23 random_state = 100, # 配色方案的种类 24 ) 25 # 生成词云图 26 myword = wc.generate(cityStr) 27 #展示词云图 28 plt.imshow(myword) 29 plt.axis('off') 30 plt.show() 31 # 若文件名非空,则保存到该路径下 32 if CityName != "": 33 #保存词云图 34 wc.to_file(CityName) 35 print(">>> Creat WeChat wordcloud of city successfully!")
(7) 生成province地图
1 def creatMapProvince(self, MapFile): 2 ''' 使用获取的数据生成province地图 ''' 3 # 获取所有省份 4 provinceList, provinceNum = [], [] 5 for i in range(self.allFriends_Num): 6 if self.friendsInfo[i][3] not in provinceList: 7 provinceList.append(self.friendsInfo[i][3]) 8 provinceNum.append(0) 9 for i in range(self.allFriends_Num): 10 for j in range(len(provinceList)): 11 if self.friendsInfo[i][3] == provinceList[j]: 12 provinceNum[j] += 1 13 # 生成 Map 14 map = Map("各省微信好友分布", width=1000, height=800) 15 map.add("", provinceList, provinceNum, maptype="china", is_visualmap=True, visual_text_color='#000') 16 # 若文件名非空,则保存到该路径下 17 if MapFile != "": 18 map.render(MapFile) 19 print(">>> Creat WeChat Map of Provinces seccessfully!")
(8) 生成city地图
1 def creatMapCity(self, MapFile): 2 ''' 使用获取的数据生成city地图 ''' 3 # 获取所有省份 4 CityList, CityNum = [], [] 5 for i in range(self.allFriends_Num): 6 if self.friendsInfo[i][4] not in CityList: 7 CityList.append(self.friendsInfo[i][4]) 8 CityNum.append(0) 9 for i in range(self.allFriends_Num): 10 for j in range(len(CityList)): 11 if self.friendsInfo[i][4] == CityList[j]: 12 CityNum[j] += 1 13 for i in range(len(CityList)): 14 CityList[i] += '市' 15 # 生成 Map 16 map = Map("各市微信好友分布", width=1000, height=800) 17 map.add("", CityList, CityNum, maptype="广东", is_visualmap=True, visual_text_color='#000') 18 # 若文件名非空,则保存到该路径下 19 if MapFile != "": 20 map.render(MapFile) 21 print(">>> Creat WeChat Map of Cities seccessfully!")
有了上述实现各个功能的方法,那么就差一个调用各种方法的方法了。
(9) run方法
1 def run(self): 2 # 获取微信好友信息 3 self.getFriendsInfo() 4 print(">>> Get WeChat friends' information successfully!") 5 print(">>> Members:", self.allFriends_Num) 6 # 保存微信好友信息 7 self.saveFriendsInfoAsExcel(self.ExcelFile) 8 # 分析微信好友信息 9 self.quiteAnalyzeFriendsInfo() 10 # 使用微信好友的 city 产生词云图 11 self.creatWordCloudOfCity(self.WCOfCityFile) 12 # 生成微信好友的 province 地图 13 self.creatMapProvince(self.MapProvinceFile) 14 # 生成微信好友的 city 地图 15 self.creatMapCity(self.MapCityFile)
对于文件路径,在main函数中传递即可。【注】:上述代码都在类中,在此处结束,下面为main函数
1 if __name__ == "__main__": 2 ToExcelFile = "./WeChatAnalyze//FriendsInfo.xlsx" # 微信好友信息的Excel表格保存路径 3 ToPictureFile = "./WeChatAnalyze//CityWordCloud.png" # 微信好友信息city词云图保存路径 4 ToMapFileProvince = "./WeChatAnalyze//WeChatProvinceMap.html" # 微信好友信息province地图保存路径 5 ToMapFileCity = "./WeChatAnalyze//WeChatCityMap.html" # 微信好友信息city地图保存路径 6 # WeChatRobot对象实例化 7 robot = WeChatRobot(ToExcelFile, ToPictureFile, ToMapFileProvince, ToMapFileCity)
是不是觉得Main函数很简短,哈哈,没错,就是这么简!
接下来看看实现的效果吧!
参考文献:
① 用python玩微信:https://segmentfault.com/a/1190000014203617
② pyecharts 中部分import 不到:https://blog.csdn.net/weixin_38617311/article/details/81146748
③ pyecharts 中地图显示不全:https://blog.csdn.net/xiamoyanyulrq/article/details/80025105
总代码:
1 from wxpy import * 2 3 #初始化机器人,选择缓存模式(扫码)登录 4 5 bot=Bot(cache_path=True) 6 7 #获取我的所有微信好友信息 8 9 friend_all=bot.friends() 10 11 print(friend_all[0].raw)#friend_all[0]是我的微信昵称,.raw 则是获取我的全部信息 12 13 ############运行后会自动弹出二维码页面,手机扫描登陆即可########### 14 15 lis=[] 16 17 for a_friend in friend_all: 18 19 NickName=a_friend.raw.get('NickName',None) 20 21 #Sex=afriend.raw.get('Sex',None) 22 23 Sex={1:"男",2:"女",0:"其他"}.get(a_friend.raw.get('Sex',None),None) 24 25 City=a_friend.raw.get('City',None) 26 27 Province=a_friend.raw.get("Province",None) 28 29 Sigenature=a_friend.raw.get("Signature",None) 30 31 HeadImgFlagUrl=a_friend.raw.get("HeadImgFlagUrl",None) 32 33 HeadImgFlag=a_friend.raw.get("HeadImgFlag",None) 34 35 list_0=[NickName,Sex,City,Province,Sigenature,HeadImgFlagUrl,HeadImgFlag] 36 37 lis.append(list_0) 38 39 def lis2e07(filename,lis): 40 41 import openpyxl 42 43 wb = openpyxl.Workbook() 44 45 sheet = wb.active 46 47 sheet.title = 'list2excel07' 48 49 file_name = filename +'.xlsx' 50 51 for i in range(0, len(lis)): 52 53 for j in range(0, len(lis[i])): 54 55 sheet.cell(row=i+1, column=j+1, value=str(lis[i][j])) 56 57 wb.save(file_name) 58 59 print("写入数据成功!") 60 61 lis2e07('list3',lis) 62 63 #######################粗略获取好友信息############################### 64 65 Friends=bot.friends() 66 67 data=Friends.stats_text(total=True,sex=True,top_provinces=30,top_cities=300) 68 69 print(data) 70 71 ######可以从存储在本地的 excel 中读取数据进行分析在执行以 72 73 74 75 from pandas import read_excel 76 77 df=read_excel('list4.xlsx',sheet_name='list2excel07') 78 79 print(df.tail(7)) 80 81 df.city.count() 82 83 df.city.describe() 84 85 import pandas as pd 86 87 #count=df.city.value_count()#对dataframe对 dataframe 进行全频率统计,排除了 nan 88 89 city_list=df['city'].fillna('NAN').tolist()#将dataframe的列转化为list,其中nan用NAN替换 90 91 count_city=pd.value_counts(city_list)#对list进行全频率统计 92 93 from pyecharts import WordCloud 94 95 name=count_city.index.tolist() 96 97 value=count_city.tolist() 98 99 wordcloud=WordCloud(width=1300,height=620) 100 101 wordcloud.add("",name,value,word_size_range=[20,100]) 102 103 wordcloud.show_config() 104 105 wordcloud.render(r'cy.html') 106 107 province_list=df['province'].fillna('NAN').tolist() 108 109 count_province=pd.value_counts(province_list)#对list进行全频率统计 110 111 from pyecharts import Map 112 113 value=count_province.tolist() 114 115 attr=count_province.index.tolist() 116 117 map=Map("各省微信好友分布",width=1000,height=600) 118 119 map.add("",attr,value,maptype='china',is_visualmap=True,visual_text_color='#000',is_label_show=True)#显示地图上的省份 120 121 map.show_config() 122 123 map.render(r'FriendMap.html')
成果图如下: