zoukankan      html  css  js  c++  java
  • python3 输出中文、日文等等乱码问题的解决办法

    例如:

    url = 'https://zozo.jp/shop/mrolive/goods-sale/44057773/?did=73037089'
    resp = requests.get(url=url)
    html = etree.HTML(resp.text)
    title = html.xpath('//div[@id="item-intro"]/h1/text()')[0]
    print(title)

    打印结果为:

    ƒAƒ“ƒeƒB[ƒN ƒuƒ‰ƒbƒN ƒJƒEƒŒƒU[  / MA-1 ƒŒƒU[ ƒuƒ‹ƒ]ƒ“

    以上打印结果为乱码,解决办法:

    1 先获取网址的编码:

    url = 'https://zozo.jp/shop/mrolive/goods-sale/44057773/?did=73037089'
    resp = requests.get(url=url)
    encodings = requests.utils.get_encodings_from_content(resp.text)
    print(encodings)

    结果为:

    ['Shift_JIS']

    由此可知网站的编码是['Shift_JIS']

    2 将获取的response.conetent的编码设置为['Shift_JIS'],再次请求,获取到的就不是乱码了。

    url = 'https://zozo.jp/shop/mrolive/goods-sale/44057773/?did=73037089'
    resp = requests.get(url=url)
    resp_txt = resp.content.decode('Shift_JIS')
    html = etree.HTML(resp_txt)
    title = html.xpath('//div[@id="item-intro"]/h1/text()')[0]
    print(title)

    结果为:

    アンティーク ブラック カウレザー  / MA-1 レザー ブルゾン
  • 相关阅读:
    js冒泡排序的两种实现方式
    LeetCode SQL(一)
    k8s学习之Mac安装最新版本k8s
    docker 安装MySQL8.0设置主从复制
    代码中if的骚操作
    和别人说东西的时候要注意的点
    2021 五一深圳计划
    Swoole支持openssl扩展Mac版
    租房
    Mac常用的快捷键
  • 原文地址:https://www.cnblogs.com/loren880898/p/12171712.html
Copyright © 2011-2022 走看看