zoukankan      html  css  js  c++  java
  • 一个简单的go语言爬虫

    package main
    
    import (
    	"bufio"
    	"fmt"
    	"golang.org/x/net/html/charset"
    	"golang.org/x/text/encoding"
    	"golang.org/x/text/transform"
    	"io"
    	"io/ioutil"
    	"net/http"
    )
    
    func determineEncoding(r io.Reader) encoding.Encoding {
           //编码判断
    	bytes, err := bufio.NewReader(r).Peek(1024)
    	if err != nil {
    		panic(err)
    	}
    	e, _, _ := charset.DetermineEncoding(bytes, ",")
    	return e
    
    }
    func main() {
    	resp, err := http.Get("http://www.baidu.com")
    	if err != nil {
    		panic(err)
    	}
    	defer resp.Body.Close() //最后关闭,先进后出
    
    	if resp.StatusCode != http.StatusOK {
    		fmt.Println("Error:status code", resp.StatusCode)
    		return
    	}
    	e := determineEncoding(resp.Body)
    	utf8Reader := transform.NewReader(resp.Body, e.NewDecoder())
    	all, err := ioutil.ReadAll(utf8Reader)
    	//utf8Reader:=transform.NewReader(resp.Body,simplifiedchinese.GBK.NewDecoder())
    
    	//下面是不加编码判断的
    	//all, err := ioutil.ReadAll(resp.Body)
    	if err != nil {
    		panic(err)
    	}
    	fmt.Printf("%s
    ", all)
    
    }
    
    
  • 相关阅读:
    基于C/S模式的程序更新下载
    拓展方法
    主从级GridView
    using 的用法
    五大数据类型
    redis的主从复制原理及步骤
    redis的发布订阅
    redis的持久化
    redis的事务
    配置文件详解
  • 原文地址:https://www.cnblogs.com/c-x-a/p/10707958.html
Copyright © 2011-2022 走看看