zoukankan      html  css  js  c++  java
  • 使用 python 进行微信好友分析

    使用 python 进行微信好友分析

    1. 使用到的库

    ① wxpy:初始化微信机器人

    ② openpyxl:保存微信好友数据为Excel表格

    ③ pyecharts:生成可视化的地图

    ④ wordcloud、matplotlib、jieba:生成词云图

    特别提醒】:pyecharts 库用的是0.5.x版本,而在 pip 中安装的为1.x.x版本,因此需要自行到【官网】中下载。

    2. 基本功能

    ① 分析微信好友数据

    ② 生成词云图

    ③ 生成地图展示

    3. 代码实现

    此处使用类来实现

    (1) 导入模块

    复制代码
    1 #  导入模块
    2 from wxpy import Bot
    3 import openpyxl
    4 from pyecharts import Map
    5 from wordcloud import WordCloud
    6 import matplotlib.pyplot as plt
    7 import jieba
    复制代码

    (2) 初始化机器人和获取微信好友的源信息

    此处调用 Bot() 方法,需要扫码登陆微信网页版,后续操作才能进行。

    复制代码
     1 def __init__(self, ToExcelFile="", ToCityFile="", ToMapProvinceFile="", ToMapCityFile=""):
     2     ''' 初始化机器人和其他参数 '''
     3     # 初始化机器人,需要扫码
     4     self.bot = Bot()
     5     # 获取我所有的微信好友信息 - 存储基础信息(未处理)
     6     self.allFriends_Info = self.bot.friends()
     7     # 我的微信好友个数
     8     self.allFriends_Num = len(self.allFriends_Info)
     9     # 保存微信好友信息的表格文件路径(.xlsx)
    10     self.ExcelFile = ToExcelFile
    11     # 保存城市词云图的文件路径(.png/.jpg)
    12     self.WCOfCityFile = ToCityFile
    13     # 保存省份地图的文件路径(.html)
    14     self.MapProvinceFile = ToMapProvinceFile
    15     # 其他可用参数
    16     self.MapCityFile = ToMapCityFile
    17     # 自动调用run方法,使得在实例化对象后自动运行其他函数
    18     self.run()
    复制代码

    (3) 统计和处理微信好友的信息

    除了列出的还有 个性签名、头像其他属性。

    复制代码
     1 def getFriendsInfo(self):
     2     ''' 获取微信好友的全部信息 '''
     3     # 存储微信好友的信息(经过信息处理的)
     4     self.friendsInfo = []
     5     # 定义列标题
     6     self.infoTitle = ['NickName', 'RemarkName', 'Sex', 'Province', 'City']
     7     for aFriend in self.allFriends_Info:
     8         # 获取昵称
     9         NickName = aFriend.raw.get(self.infoTitle[0], None)
    10         # 获取备注
    11         RemarkName = aFriend.raw.get(self.infoTitle[1], None)
    12         # 获取性别
    13         Sex = {1:"男", 2:"女", 0:"其他"}.get(aFriend.raw.get(self.infoTitle[2], None), None)
    14         # 获取省份
    15         Province = aFriend.raw.get(self.infoTitle[3], None)
    16         # 获取城市
    17         City = aFriend.raw.get(self.infoTitle[4], None)
    18         lisTmp = [NickName, RemarkName, Sex, Province, City]
    19         self.friendsInfo.append(lisTmp)
    复制代码

    (4) 保存微信好友的信息

    在这保存为Excel表格,在代码中插入表头行,为了便于阅读。

    复制代码
     1 def saveFriendsInfoAsExcel(self, ExcelName):
     2     ''' 保存微信好友的信息到 Excel 表格中 '''
     3     # 生成openpyxl对象
     4     workbook = openpyxl.Workbook()
     5     # 激活表格
     6     sheet = workbook.active
     7     # 设置表格标题
     8     sheet.title = 'WeChatFriendsInfo'
     9     # 填充列标题到第一行
    10     for _ in range(len(self.infoTitle)):
    11         sheet.cell(row=1, column=_+1, value=self.infoTitle[_])
    12     # 填充微信好友信息,从第二行开始
    13     for i in range(self.allFriends_Num):
    14         for j in range(len(self.infoTitle)):
    15             sheet.cell(row=i+2, column=j+1, value=str(self.friendsInfo[i][j]))
    16     # 若文件名非空,则保存到该路径下
    17     if ExcelName != "":
    18         workbook.save(ExcelName)
    19         print(">>> Save WeChat friends' information successfully!")
    复制代码

    (5) 分析微信好友的信息

    1 def quiteAnalyzeFriendsInfo(self):
    2     ''' 分析数据,一步到位,直接了当 '''
    3     print(self.allFriends_Info.stats_text())

    (6) 生成city词云图

    复制代码
     1 def creatWordCloudOfCity(self, CityName):
     2     ''' 使用获取的数据生成city词云图 '''
     3     # 获取所有的城市
     4     cityStr = ""
     5     for i in range(self.allFriends_Num):
     6         if self.friendsInfo[i][4] not in cityStr:
     7             cityStr += " " + self.friendsInfo[i][4]
     8     #jieba库精确模式分词
     9     wordlist = jieba.lcut(cityStr)
    10     cityStr = ' '.join(wordlist)
    11     # 加载背景图片
    12     #cloud_mask = np.array(Image.open(BackGroundFile))
    13     #设置词云图属性
    14     font = r'C:WindowsFontssimfang.ttf' # 设置字体路径
    15     wc = WordCloud(
    16         background_color = 'black',     # 背景颜色
    17         #mask = cloud_mask,             # 背景图片
    18         max_words = 100,                # 设置最大显示的词云数
    19         font_path = font,               # 设置字体形式(在本机系统中)
    20         height = 300,                   # 图片高度
    21         width = 600,                    # 图片宽度
    22         max_font_size = 100,            # 字体最大值
    23         random_state = 100,             # 配色方案的种类
    24         )
    25     # 生成词云图
    26     myword = wc.generate(cityStr)
    27     #展示词云图
    28     plt.imshow(myword)
    29     plt.axis('off')
    30     plt.show()
    31     # 若文件名非空,则保存到该路径下
    32     if CityName != "":
    33         #保存词云图
    34         wc.to_file(CityName)
    35         print(">>> Creat WeChat wordcloud of city successfully!")
    复制代码

    (7) 生成province地图

    复制代码
     1 def creatMapProvince(self, MapFile):
     2     ''' 使用获取的数据生成province地图 '''
     3     # 获取所有省份
     4     provinceList, provinceNum = [], []
     5     for i in range(self.allFriends_Num):
     6         if self.friendsInfo[i][3] not in provinceList:
     7             provinceList.append(self.friendsInfo[i][3])
     8             provinceNum.append(0)
     9     for i in range(self.allFriends_Num):
    10         for j in range(len(provinceList)):
    11             if self.friendsInfo[i][3] == provinceList[j]:
    12                 provinceNum[j] += 1
    13     # 生成 Map
    14     map = Map("各省微信好友分布", width=1000, height=800)
    15     map.add("", provinceList, provinceNum, maptype="china", is_visualmap=True, visual_text_color='#000')
    16     # 若文件名非空,则保存到该路径下
    17     if MapFile != "":
    18         map.render(MapFile)
    19         print(">>> Creat WeChat Map of Provinces seccessfully!")
    复制代码

    (8) 生成city地图

    复制代码
     1 def creatMapCity(self, MapFile):
     2         ''' 使用获取的数据生成city地图 '''
     3         # 获取所有省份
     4         CityList, CityNum = [], []
     5         for i in range(self.allFriends_Num):
     6             if self.friendsInfo[i][4] not in CityList:
     7                 CityList.append(self.friendsInfo[i][4])
     8                 CityNum.append(0)
     9         for i in range(self.allFriends_Num):
    10             for j in range(len(CityList)):
    11                 if self.friendsInfo[i][4] == CityList[j]:
    12                     CityNum[j] += 1
    13         for i in range(len(CityList)):
    14             CityList[i] += '市'
    15         # 生成 Map
    16         map = Map("各市微信好友分布", width=1000, height=800)
    17         map.add("", CityList, CityNum, maptype="广东", is_visualmap=True, visual_text_color='#000')
    18         # 若文件名非空,则保存到该路径下
    19         if MapFile != "":
    20             map.render(MapFile)
    21             print(">>> Creat WeChat Map of Cities seccessfully!")
    复制代码

    有了上述实现各个功能的方法,那么就差一个调用各种方法的方法了。

    (9) run方法

    复制代码
     1 def run(self):
     2     # 获取微信好友信息
     3     self.getFriendsInfo()
     4     print(">>> Get WeChat friends' information successfully!")
     5     print(">>> Members:", self.allFriends_Num)
     6     # 保存微信好友信息
     7     self.saveFriendsInfoAsExcel(self.ExcelFile)
     8     # 分析微信好友信息
     9     self.quiteAnalyzeFriendsInfo()
    10     # 使用微信好友的 city 产生词云图
    11     self.creatWordCloudOfCity(self.WCOfCityFile)
    12     # 生成微信好友的 province 地图
    13     self.creatMapProvince(self.MapProvinceFile)
    14     # 生成微信好友的 city 地图
    15     self.creatMapCity(self.MapCityFile)
    复制代码

    对于文件路径,在main函数中传递即可。【注】:上述代码都在类中,在此处结束,下面为main函数

    复制代码
    1 if __name__ == "__main__":
    2     ToExcelFile = "./WeChatAnalyze//FriendsInfo.xlsx"      # 微信好友信息的Excel表格保存路径
    3     ToPictureFile = "./WeChatAnalyze//CityWordCloud.png"   # 微信好友信息city词云图保存路径
    4     ToMapFileProvince = "./WeChatAnalyze//WeChatProvinceMap.html" # 微信好友信息province地图保存路径
    5     ToMapFileCity = "./WeChatAnalyze//WeChatCityMap.html"  # 微信好友信息city地图保存路径
    6     # WeChatRobot对象实例化
    7     robot = WeChatRobot(ToExcelFile, ToPictureFile, ToMapFileProvince, ToMapFileCity)
    复制代码

    是不是觉得Main函数很简短,哈哈,没错,就是这么简!

    接下来看看实现的效果吧!

    >>> 这个是终端显示效果

    >>> 这个是保存为Excel表格的内容

     >>> 这个是微信好友各省的分布

    >>> 这个是微信好友各市的分布

    OK. 今天就分享到这啦!最后附上完整代码!

    参考文献:

    ① 用python玩微信:https://segmentfault.com/a/1190000014203617

    ② pyecharts 中部分import 不到:https://blog.csdn.net/weixin_38617311/article/details/81146748

    ③ pyecharts 中地图显示不全:https://blog.csdn.net/xiamoyanyulrq/article/details/80025105

    复制代码
      1 # -*- coding: utf-8 -*-
      2 '''
      3 This is a program which can analyze datas of WeChat friends.
      4 @author: bpf
      5 '''
      6 
      7 #  导入模块
      8 from wxpy import Bot
      9 import openpyxl
     10 from pyecharts import Map
     11 from wordcloud import WordCloud
     12 import matplotlib.pyplot as plt
     13 import jieba
     14 
     15 class WeChatRobot:
     16 
     17     '''====================== 1. 获取微信好友信息 ======================'''
     18     def __init__(self, ToExcelFile="", ToCityFile="", ToMapProvinceFile="", ToMapCityFile=""):
     19         ''' 初始化机器人和其他参数 '''
     20         # 初始化机器人,需要扫码
     21         self.bot = Bot()
     22         # 获取我所有的微信好友信息 - 存储基础信息(未处理)
     23         self.allFriends_Info = self.bot.friends()
     24         # 我的微信好友个数
     25         self.allFriends_Num = len(self.allFriends_Info)
     26         # 保存微信好友信息的表格文件路径(.xlsx)
     27         self.ExcelFile = ToExcelFile
     28         # 保存城市词云图的文件路径(.png/.jpg)
     29         self.WCOfCityFile = ToCityFile
     30         # 保存省份地图的文件路径(.html)
     31         self.MapProvinceFile = ToMapProvinceFile
     32         # 其他可用参数
     33         self.MapCityFile = ToMapCityFile
     34         # 自动调用run方法,使得在实例化对象后自动运行其他函数
     35         self.run()
     36 
     37     '''====================== 2. 统计微信好友信息 ======================'''
     38     def getFriendsInfo(self):
     39         ''' 获取微信好友的全部信息 '''
     40         # 存储微信好友的信息(经过信息处理的)
     41         self.friendsInfo = []
     42         # 定义列标题
     43         self.infoTitle = ['NickName', 'RemarkName', 'Sex', 'Province', 'City']
     44         for aFriend in self.allFriends_Info:
     45             # 获取昵称
     46             NickName = aFriend.raw.get(self.infoTitle[0], None)
     47             # 获取备注
     48             RemarkName = aFriend.raw.get(self.infoTitle[1], None)
     49             # 获取性别
     50             Sex = {1:"男", 2:"女", 0:"其他"}.get(aFriend.raw.get(self.infoTitle[2], None), None)
     51             # 获取省份
     52             Province = aFriend.raw.get(self.infoTitle[3], None)
     53             # 获取城市
     54             City = aFriend.raw.get(self.infoTitle[4], None)
     55             lisTmp = [NickName, RemarkName, Sex, Province, City]
     56             self.friendsInfo.append(lisTmp)
     57     
     58     '''====================== 3. 保存微信好友信息 ======================'''
     59     def saveFriendsInfoAsExcel(self, ExcelName):
     60         ''' 保存微信好友的信息到 Excel 表格中 '''
     61         # 生成openpyxl对象
     62         workbook = openpyxl.Workbook()
     63         # 激活表格
     64         sheet = workbook.active
     65         # 设置表格标题
     66         sheet.title = 'WeChatFriendsInfo'
     67         # 填充列标题到第一行
     68         for _ in range(len(self.infoTitle)):
     69             sheet.cell(row=1, column=_+1, value=self.infoTitle[_])
     70         # 填充微信好友信息,从第二行开始
     71         for i in range(self.allFriends_Num):
     72             for j in range(len(self.infoTitle)):
     73                 sheet.cell(row=i+2, column=j+1, value=str(self.friendsInfo[i][j]))
     74         # 若文件名非空,则保存到该路径下
     75         if ExcelName != "":
     76             workbook.save(ExcelName)
     77             print(">>> Save WeChat friends' information successfully!")
     78 
     79     '''====================== 4. 分析微信好友信息 ======================'''
     80     def quiteAnalyzeFriendsInfo(self):
     81         ''' 分析数据,一步到位,直接了当 '''
     82         print(self.allFriends_Info.stats_text())
     83     
     84     '''====================== 5. 产生city词云图 ======================'''
     85     def creatWordCloudOfCity(self, CityName):
     86         ''' 使用获取的数据生成city词云图 '''
     87         # 获取所有的城市
     88         cityStr = ""
     89         for i in range(self.allFriends_Num):
     90             if self.friendsInfo[i][4] not in cityStr:
     91                 cityStr += " " + self.friendsInfo[i][4]
     92         #jieba库精确模式分词
     93         wordlist = jieba.lcut(cityStr)
     94         cityStr = ' '.join(wordlist)
     95         # 加载背景图片
     96         #cloud_mask = np.array(Image.open(BackGroundFile))
     97         #设置词云图属性
     98         font = r'C:WindowsFontssimfang.ttf' # 设置字体路径
     99         wc = WordCloud(
    100             background_color = 'black',     # 背景颜色
    101             #mask = cloud_mask,             # 背景图片
    102             max_words = 100,                # 设置最大显示的词云数
    103             font_path = font,               # 设置字体形式(在本机系统中)
    104             height = 300,                   # 图片高度
    105             width = 600,                    # 图片宽度
    106             max_font_size = 100,            # 字体最大值
    107             random_state = 100,             # 配色方案的种类
    108             )
    109         # 生成词云图
    110         myword = wc.generate(cityStr)
    111         #展示词云图
    112         plt.imshow(myword)
    113         plt.axis('off')
    114         plt.show()
    115         # 若文件名非空,则保存到该路径下
    116         if CityName != "":
    117             #保存词云图
    118             wc.to_file(CityName)
    119             print(">>> Creat WeChat wordcloud of city successfully!")
    120     
    121     '''===================== 6. 产生province地图 ====================='''
    122     def creatMapProvince(self, MapFile):
    123         ''' 使用获取的数据生成province地图 '''
    124         # 获取所有省份
    125         provinceList, provinceNum = [], []
    126         for i in range(self.allFriends_Num):
    127             if self.friendsInfo[i][3] not in provinceList:
    128                 provinceList.append(self.friendsInfo[i][3])
    129                 provinceNum.append(0)
    130         for i in range(self.allFriends_Num):
    131             for j in range(len(provinceList)):
    132                 if self.friendsInfo[i][3] == provinceList[j]:
    133                     provinceNum[j] += 1
    134         # 生成 Map
    135         map = Map("各省微信好友分布", width=1000, height=800)
    136         map.add("", provinceList, provinceNum, maptype="china", is_visualmap=True, visual_text_color='#000')
    137         # 若文件名非空,则保存到该路径下
    138         if MapFile != "":
    139             #map.show_config()
    140             map.render(MapFile)
    141             print(">>> Creat WeChat Map of Provinces seccessfully!")
    142     
    143     '''===================== 7. 产生city地图 ====================='''
    144     def creatMapCity(self, MapFile):
    145         ''' 使用获取的数据生成city地图 '''
    146         # 获取所有省份
    147         CityList, CityNum = [], []
    148         for i in range(self.allFriends_Num):
    149             if self.friendsInfo[i][4] not in CityList:
    150                 CityList.append(self.friendsInfo[i][4])
    151                 CityNum.append(0)
    152         for i in range(self.allFriends_Num):
    153             for j in range(len(CityList)):
    154                 if self.friendsInfo[i][4] == CityList[j]:
    155                     CityNum[j] += 1
    156         for i in range(len(CityList)):
    157             CityList[i] += '市'
    158         # 生成 Map
    159         map = Map("各市微信好友分布", width=1000, height=800)
    160         map.add("", CityList, CityNum, maptype="广东", is_visualmap=True, visual_text_color='#000')
    161         # 若文件名非空,则保存到该路径下
    162         if MapFile != "":
    163             map.render(MapFile)
    164             print(">>> Creat WeChat Map of Cities seccessfully!")
    165         
    166     '''===================== 8. 自动执行函数 ====================='''
    167     def run(self):
    168         # 获取微信好友信息
    169         self.getFriendsInfo()
    170         print(">>> Get WeChat friends' information successfully!")
    171         print(">>> Members:", self.allFriends_Num)
    172         # 保存微信好友信息
    173         self.saveFriendsInfoAsExcel(self.ExcelFile)
    174         # 分析微信好友信息
    175         self.quiteAnalyzeFriendsInfo()
    176         # 使用微信好友的 city 产生词云图
    177         self.creatWordCloudOfCity(self.WCOfCityFile)
    178         # 生成微信好友的 province 地图
    179         self.creatMapProvince(self.MapProvinceFile)
    180         # 生成微信好友的 city 地图
    181         self.creatMapCity(self.MapCityFile)
    182         
    183 if __name__ == "__main__":
    184     ToExcelFile = "./WeChatAnalyze//FriendsInfo.xlsx"      # 微信好友信息的Excel表格保存路径
    185     ToPictureFile = "./WeChatAnalyze//CityWordCloud.png"   # 微信好友信息city词云图保存路径
    186     ToMapFileProvince = "./WeChatAnalyze//WeChatProvinceMap.html" # 微信好友信息province地图保存路径
    187     ToMapFileCity = "./WeChatAnalyze//WeChatCityMap.html"  # 微信好友信息city地图保存路径
    188     # WeChatRobot对象实例化
    189     robot = WeChatRobot(ToExcelFile, ToPictureFile, ToMapFileProvince, ToMapFileCity)
  • 相关阅读:
    全基因组关联分析学习资料(GWAS tutorial)
    GWAS研究可利用的数据库(20200424更新)
    本周最新文献速递20200614
    本周最新文献速递20200607
    甲基化数据QC: 使用甲基化数据推测SNP基因型(ewastools工具)
    文献速递20200531
    查找感兴趣的基因、基因组区域是否有调控元件的在线网页工具EpiRegio
    许嵩
    甲基化数据QC:使用甲基化数据计算样本间的相关性
    there is no package called 'GO.db'报错解决方案
  • 原文地址:https://www.cnblogs.com/elbow/p/10976862.html
Copyright © 2011-2022 走看看