zoukankan      html  css  js  c++  java
  • nodejs基础二

    cheerio第三方的模块:cheerio是jquery核心功能的一个快速灵活而又简洁的实现,主要是为了用在服务器端需要对DOM进行操作的地方

    用http模块做爬虫爬取网页的新闻:

    const http =require("http");
    const fs =require("fs");
    const cheerio =require("cheerio");
    http.get("http://news.baidu.com",(res)=>{
        var str ="";
        res.setEncoding("utf-8");//预防文字乱码问题
        res.on("data",(thunk)=>{
            str+=thunk;
        })
        res.on("end",()=>{
            var $ =cheerio.load(str);//将爬取的整个文档变成可操作的jQuery对象,就可以使用jQuery的方法了。
            fs.writeFileSync("./news.txt","","utf-8");
            $(".focuslistnews a").each((index,item)=>{
                fs.appendFileSync("./news.txt",$(item).text()+"
    ","utf-8");
            })
        })
    })

    问题补充:path.join和path.resolve的区别?

    path.join()方法是将多个参数字符串合并成一个路径字符串   console.log(path.join(__dirname,'a','b')); 假如当前文件的路径是E:/node/1,那么拼接出来就是E:/node/1/a/b。

    path.resolve()方法可以将多个路径解析为一个规范化的绝对路径    path.resolve()方法是以程序为根目录,作为起点,根据参数解析出一个绝对路径

    path.extname 取得当前文件的扩展名

    __dirname 当前目录的绝对路径

    __filename 当前文件的绝对路径

  • 相关阅读:
    Binomial Coeffcients(山东省第二届省赛G题)
    合法的C标示符(判断是否是数字或字母)
    HDU2544最短路问题Floydwarshall Algorithm做法
    简单N的阶乘
    手动实现类的属性
    基本语法基本的数据类型
    UITableViewCell的背景
    基本语法类
    UITableView专题
    单击视图空白处隐藏IPhone键盘
  • 原文地址:https://www.cnblogs.com/dongdong1996/p/12089632.html
Copyright © 2011-2022 走看看