zoukankan      html  css  js  c++  java
  • 看网络开发实战书笔记

    -·   

    请求方法:  

     

    名词:

    HTML:

    长沙市:

     CSS:

    DOM:

     

    JSON:

     AJAX:

    爬虫方法:

    1:获取网页

    2:提取信息

    3:保存数据

    静态网页:

     登陆时框,爬虫登陆代码:

     文件上传:

    其中favicon.ioc相当于一个文件:

    登陆认证:

     

    seach()——在匹配时扫描字符串,然后返回第一个成功匹配的结果

    match()——从字符串的头部开始匹配,一旦开头不匹配则匹配失败返回none

    findall()——匹配正则表达式的所有内容。

    sub()——去掉不想要的内容

    compile()——将正则表达式编译成正则表达式对象,以后在后面的匹配中复用

     

    beautiful soup4

     

    读取JSON:

    关于ensure_ascii = False:

    CSV文件的写入行:

     数据库MySQL操作:

    1创建表:CREATE

    2:插入数据:INSERT

    3:更新数据:UPDATE

    4:-删除数据:DELETE

    5:查询数据:SELECT

     数据库MongoDB操作:

    连接mongoDB:

    指定数据库:

    指定集合:

    插入数据:

    查询数据:

     关于selenium:

    单节点:

    多节点:

     

    关于动态链:

    对于鼠标拖拽,键盘按键等这些动作得使用动态链来实现

    关于下拉进度条:

    execute_script()可以将进度条下拉到最底部

    获取源代码:

    page_source

    获取文本值:

    webElement——text

    beautifulSoup——get_text()

    pyquery——text()

    获取属性:

    get_attribute()——获取节点属性

    获取id,位置,标签名和大小:

     切换Frame(相当于子页面)

     

    延时等待:

    隐式等待: implicitly——wait()

    显式等待:

  • 相关阅读:
    数组review
    算法复杂度分析
    利用栈判断括号是否匹配(Parentheses)
    java实现stack和queue
    路由器结构
    层次化路由简介
    es 嵌套对象和父子文档对比
    远心镜头的远心度
    Delphi编程细节汇总
    halcon深度学习总结(二)
  • 原文地址:https://www.cnblogs.com/lmx123/p/9255451.html
Copyright © 2011-2022 走看看