zoukankan      html  css  js  c++  java
  • nodeJs爬虫小程序练习

    //爬虫小程序

    	var express = require('express');
    	//superagent是一个http的库,可以发起get和post请求
    	var superagent = require('superagent');
    	//cheerio是一个类似于jquery的库,用来从网页中以css 选择器取数据,
    	//使用方式和jquery相同
    	var cheerio = require('cheerio');
    	
    	var app = express();
    	
    	app.get('/', function(req, res, next){
    	    superagent.get('https://cnodejs.org/')
    	    .end(function(err,sres){
    	    	//常规错误处理
    	    	if(err){
    	    		return next(err);
    	    	}
    	    	var $ = cheerio.load(sres.text);
    	    	var items = [];//数组
    	        $('#topic_list .topic_title').each(function(idx, element){
    	        	var $element = $(element);
    	        	items.push({
    	        		title: $element.attr('title'),
    	        		href: $element.attr('href')
    	        	});
    	        });
    	
    	        res.send(items);
    	    });
    	});
    	
    	app.listen(3000,function(req,res){
    	    console.log('app is run at port 3000');
    	});
    
    • SuperAgent是轻量级的渐进式ajax API,灵活性高,可读性高。可以通过调用request对象上的适当方法.end()来启动请求,然后调用发送请求。例如一个简单的GET请求:

         request
           .get('/search')
           .end(function(err, res){
        
           });
  • 相关阅读:
    CSS 样式书写规范
    css等比例分割父级容器(完美三等分)
    右上角标的效果
    webstorm 激活破解方法大全
    ios开关按钮
    javascript功能封装
    Ajax 跨域
    javascript常用实例的实现与封装
    使用CSS完成元素居中的七种方法
    美化加载失败的图片
  • 原文地址:https://www.cnblogs.com/yehui-mmd/p/7397932.html
Copyright © 2011-2022 走看看