zoukankan      html  css  js  c++  java
  • node 写的简单爬虫(一)

    安装cheerio

    npm install cheerio --save

    引入http和cheeri

    var http=require("http");
    var cheerio=require("cheerio");

    1.爬取新闻

    我们选择新浪新闻来进行爬取

    http://news.sina.com.cn/china/
    http.get(url,function(res){
         var html='';
         res.on('data',function(data){
             html +=data
         })
     
         res.on('end', function() {
             var $=cheerio.load(html);
            $("#subShowContent2_static .news-item h2").each((iten,i)=>{
                console.log($(i).text());
            })
          console.log("数据加载完毕");
         });
     }).on('error', function() {
         console.log("获取数据出错!")
     });

    结果如下:

    2.爬取图片

    我们选择天极网的图片进行爬取

    http://pic.yesky.com/
    http.get(url, function (res) {
            var imageData ='';
            res.on('data',function(data){  //图片加载到内存变量
                imageData += data;
            }).on('end',function(){        //图片加载完
                var $=cheerio.load(imageData);
                $Imgs = $('img'),
                $Imgs.each((iten,i)=>{
                console.log($(i).attr('src')+"------");
               })   
            });
        });

    结果如下:

    记录生活中的点点滴滴!
  • 相关阅读:
    1012每日博客
    1011每日博客
    108每日博客
    1013每日博客
    1015每日博客
    写几个关于sql server的例子
    正则表达式实例
    gridview 选中行变色
    ASP.NET跨页面传值技巧
    关于不同电脑Outlook同步
  • 原文地址:https://www.cnblogs.com/aSnow/p/8438425.html
Copyright © 2011-2022 走看看