1.起因
一直以来疯迷“冬吴相对论”,为了整理下载他的MP3花了不少功夫,今天突然发现将电脑中的mp3导入到itunes后,文件名竟然不识别了。#_* itunes自动识别了mp3的信息内容。多次一举么,文件名挺好。事实如此,让我深感不完美。一定要将文件名也写如MP3信息中区。
网上一搜,一大把的python代码,都是用了eyeD3这个组件包。照着例子简单搞了两下就出来一个版本,运行发现latin_1啥的编码问题。OK把它的tag和id3还有frames包中的编码统统改成GBK就能解决了。但是又发现,如果文件原本没有id3v1时,获取title就直接报错了。找了两下没有发现有人提这个问题。看来只能自己动手了。那就完全不用eyeD3包了。因为id3v1确实很简单。
2.分析
百度就有说,我想写的这些信息可保存于mp3文件的尾部。
ID3V1比较简单,它是存放在MP3文件的末尾,用16进制的编辑器打开一个MP3文件,查看其末尾的128个顺序存放字节,数据结构定义如下:
- char Header[3]; /标签头必须是"TAG"否则认为没有标签/
- char Title[30]; /标题/
- char Artist[30]; /作者/
- char Album[30]; /专集/
- char Year[4]; /出品年代/
- char Comment[30]; /备注/
- char Genre; /类型/
ID3V1的各项信息都是顺序存放,没有任何标识将其分开,比如标题信息不足30个字节,则使用'\0'补足,否则将造成信息错误。
3.解决
还好,文件结构不复杂,处理起来就相对简单。思路很简单,读取mp3文件的尾部128字节,判断一下有米有TAG,有了就把最后的128节用我们自己的信息替换掉,没有就补充128字节上去。
4.代码
最好的文档就是源码,当然我回写注释的。没有依赖eyeD3这样的包,纯手工写法。
#encoding=utf8
__author__ ='pcode@qq.com'import os
importstructdefGetFiles(path):"""
读取指定目录的文件
"""FileDic=[]
files=os.listdir(path)for f in files:
f=f[:-4]FileDic.append(f)returnFileDic,files
def_GetLast128K(path,file):
ff1=open(os.path.join(path,file),"rb")
ff1.seek(-128,2)
id3v1data=ff1.read()
ff1.close()return id3v1data
def_GetAllBinData(path,file):
ff1=open(os.path.join(path,file),"rb")
data=ff1.read()
ff1.close()return data
defSetTag(path,file,title,artist,album,year,comment,genre):"""
设置mp3的ID3 v1中的部分参数
char Header[3]; /*标签头必须是"TAG"否则认为没有标签*/
char Title[30]; /*标题*/
char Artist[30]; /*作者*/
char Album[30]; /*专集*/
char Year[4]; /*出品年代*/
char Comment[30]; /*备注*/
char Genre; /*类型*/
mp3文件尾部128字节为id3v1的数据,如果有数据则读取修改,无数据则补充
"""
header='TAG'#组合出最后128K的id3V1的数据内容
str =struct.pack('3s30s30s30s4s30ss',header,title,artist,album,year,comment,genre)#获取原始全部数据
data=_GetAllBinData(path,file)#获取末尾的128字节数据
id3v1data=_GetLast128K(path,file)#打开原文件准备写入
ff=open(os.path.join(path,file),"wb")try:#判断是否有id3v1数据if id3v1data[0:3]!=header:#倒数128字节不是以TAG开头的说明没有#按照id3v1的结构补充上去
ff.write(data+str)else:#有的情况下要换一下
ff.write(data[0:-128]+str)
ff.close()print"OK"+title
except:
ff.write(data)print"Error "+title
finally:if ff :ff.close()if __name__=="__main__":#我存放mp3文件的目录
path=u"K:\\reading\\阅读\\东吴相对论"#获取到文件名和文件全名
names,files=GetFiles(path)#苦力代码for i in range(len(files)):#注意编码解码
title=names[i].encode('gbk')
artist=u'梁冬 吴伯凡'.encode('gbk')
album=u'东吴相对论'.encode('gbk')
year=''
comment=''
genre=''#调用函数处理SetTag(path,files[i],title,artist,album,year,comment,genre)
5.后续
使用了以后id3v1的信息全部按文件名改好了,其中的SetTag函数也可以迁移到别的程序里用来改id3v1的信息。但是写文件那里,无论是否有TAG都得重写全部文件内容。效率一般般。速度没有eyeD3这种组件快。但那时eyeD3不能支持中文,而且文件本来没id3v1信息时会出错,自己的就放心多了。 bingo 收工。