zoukankan      html  css  js  c++  java
  • 用Python来找合适的妹子

    用Python来找合适的妹子(一)

    时间真的有点仓促,匆匆忙忙撸完这篇文章.

    虽然今天是情人节,但还是要关心一下单身狗们,帮助他们俩脱单。

    古人知己知彼,百战不殆.  好好去了解一下妹子们的内心想法,早日脱单!

    这次我在一个某知名婚恋网站,抓取了一些数据,对她们的内心读白进行分析.

    我这次筛选条件:女性,年龄20-30,学历本科,就这些条件.

    用Python来找合适的妹子(一)

    3000条妹子内心读白词云如下:

    用Python来找合适的妹子(一)

    放心好了,她们都是追求精神满足而非物质,大部分都是要找生命中的另一半,那她们的另一半会是你吗?

    完整代码

    # coding=utf-8
    
    
    from selenium import webdriver
    import time
    from lxml import etree
    import sys
    
    reload(sys)
    sys.setdefaultencoding('utf-8')
    
    """
    PEP8 Python编程规范
    https://www.douban.com/note/134971609/
    
    """
    # 获取浏览器驱动
    driver = webdriver.Firefox()
    driver.maximize_window()
    webUrl = 'http://www.lovewzly.com/jiaoyou.html'
    driver.get(webUrl)
    
    # 等15秒,我来手动做一下筛选条件。,女性,21-30左右,学历本科,
    # 本来想通过js代码,来自动执行,但无奈对js真的不熟,也没有太多时间去整了,凑合看看.
    time.sleep(15)
    
    """
    下拉滚动条,从1开始到3结束 分2次加载完每页数据
    
    """
    while True:
    
        for i in range(1, 20):
            height = 1000 * i  # 每次滑动20000像素
            strword = "window.scrollBy(0," + str(height) + ")"
            driver.execute_script(strword)
            time.sleep(3)
    
            s = etree.HTML(driver.page_source)
            selectors = s.xpath('//*[@id="hibox"]/table/tbody/tr/td/div')
    
            with open('内心读白.txt', 'a') as f:
                for selector in selectors:
                    img = selector.xpath('./div[1]/img/@src')
                    nick = selector.xpath('./div[2]/p[1]/span/text()')
                    age = selector.xpath('./div[2]/p[2]/span[1]/text()')
                    height = selector.xpath('./div[2]/p[2]/span[2]/text()')
                    address = selector.xpath('./div[2]/p[2]/span[3]/text()')
                    heart = selector.xpath('./div[2]/p[3]/text()')
    
                    img = img[0] if len(img) > 0 else ''
                    nick = nick[0] if len(nick) > 0 else ''
                    age = age[0] if len(age) > 0 else ''
                    height = height[0] if len(height) > 0 else ''
                    address = address[0] if len(address) > 0 else ''
                    heart = heart[0] if len(heart) > 0 else ''
                    print nick, age, height, address, heart, img
                    f.write(heart)
    

    生成词云的代码之前的文章里面有,这里就不展示了,自行前往查阅!

    时间确实太仓促了,我想做一个更好一点,但时间不够了

    下一步准备:

    • 我们可以输入自己的需求,然后进行筛选.
    • 把妹子照片,身高,籍贯,收入,学历,摘偶要求,都一起配上,并配上她们的链接,让单身狗们有目标的找妹子!哈哈
    • http://www.aibbt.com/a/18059.html
  • 相关阅读:
    Delphi代码获取网卡物理地址三种方法 本文来自Delphi之窗,原文地址:http://www.52delphi.com...
    SQL SERVER 中实现公历到农历的转换
    cxgrid相同列合并显示
    rzCheckList.ItemChecked[Index]就可以判断指定节点地状态.
    为什么PING域名得到IP与实际公网IP不符
    如何让sql server2005和sql server2000共存安装在同一机器上
    如何编译通过 Raize 5.3 中的 RzBorder.pas
    u6升级到u890的过程
    技术部门到底该如何管理才能“和谐”
    在CXGRID中如何让字段能以0.00的格式显示
  • 原文地址:https://www.cnblogs.com/aibbtcom/p/8529274.html
Copyright © 2011-2022 走看看