zoukankan      html  css  js  c++  java
  • 91家纺

    """
    抓取
    解析
    存储
    """
    import re
    import ast
    from urllib import parse
    from datetime import datetime

    import requests
    from scrapy import Selector

    domain = "http://www.91jf.com/"

    def write_txt():
        f = open("a.txt", 'w')
        f.write("hello world")
        f.close()

    def get_nodes_json():
        left_menu_text = requests.get("http://www.91jf.com/").text
        sel = Selector(text=left_menu_text)
        all_divs = sel.xpath("//div[@class='class_child_li']//a/@herf")
        #nodes_str_match = re.search(r"(<li><a href=".*>)", left_menu_text)
        print(all_divs)
        #print(nodes_str_match.groups())
        '''
        if nodes_str_match:
            nodes_str = nodes_str_match.group(1).replace("null", "None")
            nodes_list = ast.literal_eval(nodes_str)
            return nodes_list
        return []
        '''

    if __name__ == "__main__":
        get_nodes_json()
  • 相关阅读:
    结构化建模分析
    qemusystemriscv64 machine \?
    git clone commit
    riscv gdb machine mode
    error: src refspec main does not match any.
    riscv ecall
    git windows
    fixedlink
    iperf交叉编译
    每日学习
  • 原文地址:https://www.cnblogs.com/dog-and-cat/p/13204277.html
Copyright © 2011-2022 走看看