zoukankan      html  css  js  c++  java
  • Python的print中国输出对齐问题

    问题叙述性说明:

    在使用Python内置函数print当输出英语,应用格输出类型可以对齐很好:

    s1 = 'I am a long sentence.'
    s2 = 'I'm short.'
    
    print '%-30s%-20s' %(s1,s2) #'%-30s' 含义是 左对齐,且占用30个字符位 
    print '%-30s%-20s' %(s2,s1)

    输出:


    注:

    这里应用了最原始的cmd控制台,一些IDE自带的控制台(如Sublime text)可能会有不同的输出效果。


    但当字符串包括中文时。却发现它对齐得不是非常好:

    # -*- coding:utf-8 -*-
    #author: Song Bo, Eagle, ZJU
    #email: sbo@zju.edu.cn
    s1 = '我是一个长句子,是的非常长的句子。'
    s2 ='我是短句子'
    
    
    print '%-30s%-20s' %(s1,s2)
    print '%-30s%-20s' %(s2,s1)
    


    首先是出现乱码:



    cmd控制台并未正确解码utf-8编码。把s1和s2解码成unicode就可以:

    s1 = u'我是一个长句子,是的非常长的句子。

    ' s2 =u'我是短句子' print '%-30s%-20s' %(s1,s2) print '%-30s%-20s' %(s2,s1)


    输出



    无法对齐。

    原因是这样:在print中,函数为了实现字符串对齐,会在未达到指定长度的字符串末尾添上空格补齐。

    可是,问题在这里,它会填入ASCII码为20的space,也就是半角空格。它的长度等于每一个字母或数字的宽度。但远比汉字的宽度小,所以导致补足后的字符串长度仍然不同。


    解决方式:

    重写一个格式对齐函数。函数中推断字符串是否是中文字符串,有的话则加入全角空格补齐,否则加入半角空格补齐。

    # -*- coding:utf-8 -*-
    #author: Song Bo, Eagle, ZJU
    #email: sbo@zju.edu.cn
    
    def myAlign(string, length=0):
    	if length == 0:
    		return string
    	slen = len(string)
    	re = string
    	if isinstance(string, str):
    		placeholder = ' '
    	else:
    		placeholder = u' '
    	while slen < length:
    		re += placeholder
    		slen += 1
    	return re
    s1 = u'我是一个长句子,是的非常长的句子。'
    s2 =u'我是短句子'
    
    
    print myAlign(s1, 20) + myAlign(s2, 10)
    print myAlign(s2, 20) + myAlign(s1, 10)

    输出:



    中英混排:




  • 相关阅读:
    POJ 1287 Networking
    2019 牛客多校第六场 D Move
    2019 牛客多校第六场 J Upgrading Technology
    2019 牛客多校第六场 B Shorten IPv6 Address
    POJ 1251 Jungle Roads
    POJ 3268 Silver Cow Party
    POJ 3259 Wormholes
    Codeforces Round #596 (Div. 1, based on Technocup 2020 Elimination Round 2)
    Educational Codeforces Round 75 (Rated for Div. 2)
    【知识点】多项式乘法
  • 原文地址:https://www.cnblogs.com/mfrbuaa/p/4600848.html
Copyright © 2011-2022 走看看