zoukankan      html  css  js  c++  java
  • python3 输出中文、日文等等乱码问题的解决办法

    例如:

    url = 'https://zozo.jp/shop/mrolive/goods-sale/44057773/?did=73037089'
    resp = requests.get(url=url)
    html = etree.HTML(resp.text)
    title = html.xpath('//div[@id="item-intro"]/h1/text()')[0]
    print(title)

    打印结果为:

    ƒAƒ“ƒeƒB[ƒN ƒuƒ‰ƒbƒN ƒJƒEƒŒƒU[  / MA-1 ƒŒƒU[ ƒuƒ‹ƒ]ƒ“

    以上打印结果为乱码,解决办法:

    1 先获取网址的编码:

    url = 'https://zozo.jp/shop/mrolive/goods-sale/44057773/?did=73037089'
    resp = requests.get(url=url)
    encodings = requests.utils.get_encodings_from_content(resp.text)
    print(encodings)

    结果为:

    ['Shift_JIS']

    由此可知网站的编码是['Shift_JIS']

    2 将获取的response.conetent的编码设置为['Shift_JIS'],再次请求,获取到的就不是乱码了。

    url = 'https://zozo.jp/shop/mrolive/goods-sale/44057773/?did=73037089'
    resp = requests.get(url=url)
    resp_txt = resp.content.decode('Shift_JIS')
    html = etree.HTML(resp_txt)
    title = html.xpath('//div[@id="item-intro"]/h1/text()')[0]
    print(title)

    结果为:

    アンティーク ブラック カウレザー  / MA-1 レザー ブルゾン
  • 相关阅读:
    RMI笔记
    java 本地方法(JNI)
    java 的SPI机制
    eclipse中的 Compiler compliance level含义
    初步理解JNDI
    大数据5.1
    大数据4.1
    需要攻破的知识点
    大数据4.2 -- hive数据库
    大数据---单词释义
  • 原文地址:https://www.cnblogs.com/loren880898/p/12171712.html
Copyright © 2011-2022 走看看