zoukankan      html  css  js  c++  java
  • python之微信爬虫

    调查自己微信中好友的数据分析

    代码如下

      1 # -*- coding: utf-8 -*-
      2 """
      3 Created on Wed Jun  5 12:33:27 2019
      4 
      5 @author: m1353
      6 """
      7 
      8 from wxpy import Bot
      9 import openpyxl
     10 from pyecharts import Map
     11 from wordcloud import WordCloud
     12 import matplotlib.pyplot as plt
     13 import jieba
     14 
     15 class WeChatRobot:
     16 
     17     '''====================== 1. 获取微信好友信息 ======================'''
     18     def __init__(self, ToExcelFile="", ToCityFile="", ToMapProvinceFile="", ToMapCityFile=""):
     19         ''' 初始化机器人和其他参数 '''
     20         # 初始化机器人,需要扫码
     21         self.bot = Bot()
     22         # 获取我所有的微信好友信息 - 存储基础信息(未处理)
     23         self.allFriends_Info = self.bot.friends()
     24         # 我的微信好友个数
     25         self.allFriends_Num = len(self.allFriends_Info)
     26         # 保存微信好友信息的表格文件路径(.xlsx)
     27         self.ExcelFile = ToExcelFile
     28         # 保存城市词云图的文件路径(.png/.jpg)
     29         self.WCOfCityFile = ToCityFile
     30         # 保存省份地图的文件路径(.html)
     31         self.MapProvinceFile = ToMapProvinceFile
     32         # 其他可用参数
     33         self.MapCityFile = ToMapCityFile
     34         # 自动调用run方法,使得在实例化对象后自动运行其他函数
     35         self.run()
     36 
     37     '''====================== 2. 统计微信好友信息 ======================'''
     38     def getFriendsInfo(self):
     39         ''' 获取微信好友的全部信息 '''
     40         # 存储微信好友的信息(经过信息处理的)
     41         self.friendsInfo = []
     42         # 定义列标题
     43         self.infoTitle = ['NickName', 'RemarkName', 'Sex', 'Province', 'City']
     44         for aFriend in self.allFriends_Info:
     45             # 获取昵称
     46             NickName = aFriend.raw.get(self.infoTitle[0], None)
     47             # 获取备注
     48             RemarkName = aFriend.raw.get(self.infoTitle[1], None)
     49             # 获取性别
     50             Sex = {1:"", 2:"", 0:"其他"}.get(aFriend.raw.get(self.infoTitle[2], None), None)
     51             # 获取省份
     52             Province = aFriend.raw.get(self.infoTitle[3], None)
     53             # 获取城市
     54             City = aFriend.raw.get(self.infoTitle[4], None)
     55             lisTmp = [NickName, RemarkName, Sex, Province, City]
     56             self.friendsInfo.append(lisTmp)
     57     
     58     '''====================== 3. 保存微信好友信息 ======================'''
     59     def saveFriendsInfoAsExcel(self, ExcelName):
     60         ''' 保存微信好友的信息到 Excel 表格中 '''
     61         # 生成openpyxl对象
     62         workbook = openpyxl.Workbook()
     63         # 激活表格
     64         sheet = workbook.active
     65         # 设置表格标题
     66         sheet.title = 'WeChatFriendsInfo'
     67         # 填充列标题到第一行
     68         for _ in range(len(self.infoTitle)):
     69             sheet.cell(row=1, column=_+1, value=self.infoTitle[_])
     70         # 填充微信好友信息,从第二行开始
     71         for i in range(self.allFriends_Num):
     72             for j in range(len(self.infoTitle)):
     73                 sheet.cell(row=i+2, column=j+1, value=str(self.friendsInfo[i][j]))
     74         # 若文件名非空,则保存到该路径下
     75         if ExcelName != "":
     76             workbook.save(ExcelName)
     77             print(">>> Save WeChat friends' information successfully!")
     78 
     79     '''====================== 4. 分析微信好友信息 ======================'''
     80     def quiteAnalyzeFriendsInfo(self):
     81         ''' 分析数据,一步到位,直接了当 '''
     82         print(self.allFriends_Info.stats_text())
     83     
     84     '''====================== 5. 产生city词云图 ======================'''
     85     def creatWordCloudOfCity(self, CityName):
     86         ''' 使用获取的数据生成city词云图 '''
     87         # 获取所有的城市
     88         cityStr = ""
     89         for i in range(self.allFriends_Num):
     90             if self.friendsInfo[i][4] not in cityStr:
     91                 cityStr += " " + self.friendsInfo[i][4]
     92         #jieba库精确模式分词
     93         wordlist = jieba.lcut(cityStr)
     94         cityStr = ' '.join(wordlist)
     95         # 加载背景图片
     96         #cloud_mask = np.array(Image.open(BackGroundFile))
     97         #设置词云图属性
     98         font = r'C:WindowsFontssimfang.ttf' # 设置字体路径
     99         wc = WordCloud(
    100             background_color = 'black',     # 背景颜色
    101             #mask = cloud_mask,             # 背景图片
    102             max_words = 100,                # 设置最大显示的词云数
    103             font_path = font,               # 设置字体形式(在本机系统中)
    104             height = 300,                   # 图片高度
    105             width = 600,                    # 图片宽度
    106             max_font_size = 100,            # 字体最大值
    107             random_state = 100,             # 配色方案的种类
    108             )
    109         # 生成词云图
    110         myword = wc.generate(cityStr)
    111         #展示词云图
    112         plt.imshow(myword)
    113         plt.axis('off')
    114         plt.show()
    115         # 若文件名非空,则保存到该路径下
    116         if CityName != "":
    117             #保存词云图
    118             wc.to_file(CityName)
    119             print(">>> Creat WeChat wordcloud of city successfully!")
    120     
    121     '''===================== 6. 产生province地图 ====================='''
    122     def creatMapProvince(self, MapFile):
    123         ''' 使用获取的数据生成province地图 '''
    124         # 获取所有省份
    125         provinceList, provinceNum = [], []
    126         for i in range(self.allFriends_Num):
    127             if self.friendsInfo[i][3] not in provinceList:
    128                 provinceList.append(self.friendsInfo[i][3])
    129                 provinceNum.append(0)
    130         for i in range(self.allFriends_Num):
    131             for j in range(len(provinceList)):
    132                 if self.friendsInfo[i][3] == provinceList[j]:
    133                     provinceNum[j] += 1
    134         # 生成 Map
    135         map = Map("各省微信好友分布", width=1000, height=800)
    136         map.add("", provinceList, provinceNum, maptype="china", is_visualmap=True, visual_text_color='#000')
    137         # 若文件名非空,则保存到该路径下
    138         if MapFile != "":
    139             #map.show_config()
    140             map.render(MapFile)
    141             print(">>> Creat WeChat Map of Provinces seccessfully!")
    142     
    143     '''===================== 7. 产生city地图 ====================='''
    144     def creatMapCity(self, MapFile):
    145         ''' 使用获取的数据生成city地图 '''
    146         # 获取所有省份
    147         CityList, CityNum = [], []
    148         for i in range(self.allFriends_Num):
    149             if self.friendsInfo[i][4] not in CityList:
    150                 CityList.append(self.friendsInfo[i][4])
    151                 CityNum.append(0)
    152         for i in range(self.allFriends_Num):
    153             for j in range(len(CityList)):
    154                 if self.friendsInfo[i][4] == CityList[j]:
    155                     CityNum[j] += 1
    156         for i in range(len(CityList)):
    157             CityList[i] += '市'
    158         # 生成 Map
    159         map = Map("各市微信好友分布", width=1000, height=800)
    160         map.add("", CityList, CityNum, maptype="广东", is_visualmap=True, visual_text_color='#000')
    161         # 若文件名非空,则保存到该路径下
    162         if MapFile != "":
    163             map.render(MapFile)
    164             print(">>> Creat WeChat Map of Cities seccessfully!")
    165         
    166     '''===================== 8. 自动执行函数 ====================='''
    167     def run(self):
    168         # 获取微信好友信息
    169         self.getFriendsInfo()
    170         print(">>> Get WeChat friends' information successfully!")
    171         print(">>> Members:", self.allFriends_Num)
    172         # 保存微信好友信息
    173         self.saveFriendsInfoAsExcel(self.ExcelFile)
    174         # 分析微信好友信息
    175         self.quiteAnalyzeFriendsInfo()
    176         # 使用微信好友的 city 产生词云图
    177         self.creatWordCloudOfCity(self.WCOfCityFile)
    178         # 生成微信好友的 province 地图
    179         self.creatMapProvince(self.MapProvinceFile)
    180         # 生成微信好友的 city 地图
    181         self.creatMapCity(self.MapCityFile)
    182         
    183 if __name__ == "__main__":
    184     ToExcelFile = "D:\python wexin\微信好友1.xlsx"      # 微信好友信息的Excel表格保存路径
    185     ToPictureFile = "D:\python wexin\微信好友2.png"   # 微信好友信息city词云图保存路径
    186     ToMapFileProvince = "D:\python wexin\微信好友3.html" # 微信好友信息province地图保存路径
    187     ToMapFileCity = "D:\python wexin\微信好友4.html"  # 微信好友信息city地图保存路径
    188     # WeChatRobot对象实例化
    189     robot = WeChatRobot(ToExcelFile, ToPictureFile, ToMapFileProvince, ToMapFileCity)

    然后我们可以获得一个xlsx文件,一个词云图片,两个html网页

    文件内容如下

    xlsx文件有隐私内容我就不放了

    直接来到词云

    之后是第一份html

     第二份html

  • 相关阅读:
    Android NDK Downloads
    Download Blackarch Linux
    Download Kali Linux
    Download ubuntu Linux
    cocos2D-X 常见49种Action
    win10 快速访问存在 2345Downloads 删除解决方案
    C++ 短信验证码/通知
    windows 登陆服务器
    使用路由器的虚拟服务器
    C++:查找字符串字串并替换
  • 原文地址:https://www.cnblogs.com/qq1079179226/p/10979002.html
Copyright © 2011-2022 走看看