[转载]swf文件格式解析(二)
http://blog.sina.com.cn/s/blog_6a2061a20100ye5d.html上一篇教程可能写的有点乱 ,本回合开始之前先做一个概述吧,引用官方白皮书的原文
概述
SWF 文件是由一个文件头,和跟在后面的一系列的标签组成。标签有定义型标签和控
制型标签两类。定义型标签把对象定义为角色存储在字典里,控制型标签操作这些角色并控
制影片的流程。
如下图
上回合已经解析完文件头 本会合接着解析Tag
首先,官方理论知识补充
定义型标签和控制型标签
Swf 文件有两类标签:定义型和控制型
A定义型标签定义SWF 文件的内容如Shapes、文本、位图、声音等等。每一个标签会为
定义的内容分配一个唯一的编号称做角色编号(character ID)。之后Flash Player 将角色
(character)存储在称作字典(dictionary)的仓库。定义型标签本身不产生渲染。
B控制型标签创建和操作已渲染的字典中角色的实例,同时控制文件流程。
SWF文件的处理过程
Flash Player 会处理所有的标签直到遇到ShowFrame 标签。此时,显示列表被复制到屏
幕,然后播放器继续处理直到下一帧需要显示。第一帧的内容累计了第一个ShowFrame 标
签之前所有控制型标签的执行结果,第二帧的内容累计从文件开始到第二个ShowFrame 标
签的所有控制标签的执行效果,以此类推。
长标签和短标签
Tag分为长标签跟短标签
这个有一个官方的介绍
每一个标签的开始都是标签的类型和长度。标签头可以是短标签头类型也可以是长标签
头类型。短标签头类型用于数据在62 字节之内的标签。如果标签的数据长度不超过62 个字
节使用短标签。而长标签头类型可以用于数据在4G 之内的任何标签。
标签头记录(短类型) |
||
字段 |
类型 |
说明 |
TagCodeAndLength |
UI16(两个字节) |
高10 位表示标签类型 低6 位表示标签长度 |
注意事项:
TagCodeAndLength 字段是一个两个字节的字,而不是一个10 位的字段跟随一个6
位字段。SWF 使用低位在前(little-endian)造成上述两种情况是不同的。
(ps:如果TagCodeAndLength 字段的十六进制是44 11 那么实际上的值是11 44 二
进制为00010001 01000100前10 位的值是69 表示这是一个FileAttributes标
签)
标签的长度不包括标签头记录自己的长度,仅表示其后面数据的长度。
长标签
标签头记录(长类型) |
||
字段 |
类型 |
说明 |
TagCodeAndLength |
UI16(两个字节) |
高10 位表示标签类型 低6 位始终为0x3F即111111 |
Length |
SI32 |
标签的长度 |
在开始解析之前,我引用一下swf_file_format_spec_v10白皮书中关于标签字段数值跟类型的对应表
Tag value Tag name 0 End 1 ShowFrame 2 DefineShape 4 PlaceObject 5 RemoveObject 6 DefineBits 7 DefineButton 8 JPEGTables 9 SetBackgroundColor 10 DefineFont 11 DefineText 12 DoAction 13 DefineFontInfo 14 DefineSound 15 StartSound 17 DefineButtonSound 18 SoundStreamHead 19 SoundStreamBlock 20 DefineBitsLossless 21 DefineBitsJPEG2 22 DefineShape2 23 DefineButtonCxform 24 Protect 26 PlaceObject2 28 RemoveObject2 32 DefineShape3 33 DefineText2 34 DefineButton2 35 DefineBitsJPEG3 36 DefineBitsLossless2 37 DefineEditText 39 DefineSprite 43 FrameLabel 45 SoundStreamHead2 46 DefineMorphShape 48 DefineFont2 56 ExportAssets 57 ImportAssets 58 EnableDebugger 59 DoInitAction 60 DefineVideoStream 61 VideoFrame 62 DefineFontInfo2 64 EnableDebugger2 65 ScriptLimits 66 SetTabIndex 69 FileAttributes 70 PlaceObject3 71 ImportAssets2 73 DefineFontAlignZones 74 CSMTextSettings 75 DefineFont3 76 SymbolClass 77 Metadata 78 DefineScalingGrid 82 DoABC 83 DefineShape4 84 DefineMorphShape2 86 DefineSceneAndFrameLabelData 87 DefineBinaryData 88 DefineFontName 89 StartSound2 90 DefineBitsJPEG4 91 DefineFont4
下边继续分析我们上一回合那个swf
重新用Hex workshop打开,截一张图
第一个标签:
记录头部 44 11 =11 44 =0001000101 000100
因为 000100!= 111111 所以是短格式, 而且这个标签的长度为 4 ,标签的类型为 69 为FileAttributes(文件属性),(貌似是从swf6之后第一个标签都是这个FileAttributes)
内容是19 00 00 00
继续分析下第二个标签,这是一个长标签,注意跟短标签有什么不同
记录头部 7f 13 =13 7f =0001001101 111111
因为 111111 所以是长格式, 取后四位(因为length为SI32)CB 01 00 00(作为这个标签的长度 0x000001CB = 459 ,标签的类型为 77
属性是 Metadata 内容为后边459个字节
.
.
.直到最后的结束标签
记录头部:00 00 = 00 00 = 0000000000 000000
短标签:标签长度为0,标签类型为0
标签属性:End
标签头 加 内容(内容为空)为 :00 00
下边的标签就不一一赘述,按照这种方式都可以一一解析完毕
其中最重要的一个标签为82 DoABC(Actionscript ByteCode)标签 即AVM2中执行as代码的地方,这个TAG解析是一件非常浩大的工程,很多前辈都放弃了,如果我有生之年有遗力,一定单独解析一下,以了却那么多前辈的心愿
对应上边的表格 我们可以查到SymbolClass对应的编号为76,我们想得到swf中的链接类其实就是重点解析SymbolClass这个Tag的
下边理论上分析一下SymbolClass
先看以下官方白皮书介绍
SymbolClass
The SymbolClass tag creates associations between symbols in the SWF file and
ActionScript 3.0 classes. It is the ActionScript 3.0 equivalent of the ExportAssets tag. If the
character ID is zero, the class is associated with the main timeline of the SWF. This is how the root class of a SWF is designated. Classes listed in the SymbolClass tag are available for
creation by other SWF files (see StartSound2, DefineEditText (HasFontClass), and
PlaceObject3 (PlaceFlagHasClassName and PlaceFlagHasImage). For example, ten SWF files that are all part of the same website can share an embedded custom font if one file embeds and exports the font class.
这个无非就是介绍了导出类的概念 以及导出类可以被其他swf调用等等,这个都不难理解
之后就是ADOBE 坑爹的一段,为了澄清我对他的污蔑,我把它的白皮书直接截图下来
上边是解释symbolclass的一个表格 意思就是
这个tag的组成部分由 header(即symbolclass这标签)+NumSymbols(这个标签导出类的数量占两个字节)+类一ID+类一名字(字符串格式)…类N ID+ 类N名字。
于是 我就按照这个形式一个字节一个字节解析,结果解析了半下午啊…
尼玛我这看来看去啊!!
白皮书很值得信任有木有啊!!
哥一个字一个字翻译有木有啊!!!
英文不好的程序员伤不起啊!!
到后来,还是用Hex workshop 一个字节一个字节自己的看16进制
上截图
两个类之间跟不仅仅是一个两个字节的Tag ID
尼玛明明有三个字节啊!!!!!!
好了,咆哮之后淡定,我这理解就就是adobe白皮书的一个错误,据过来人说白皮书中有三四处错误,
如果是我冤枉ADOBE了,谁给我指正 在下同样感激涕零…..
以下是用AS3写的一个对SymbolClass解析,包括之前文件头的解释 源码如下
package symbolClass { import flash.display.Sprite; import flash.utils.ByteArray; import flash.utils.Endian; import flashx.textLayout.elements.InlineGraphicElement; public class ByteArrayTest extends Sprite { [Embed(source = "mainCity.swf", mimeType="application/octet-stream")] private var TestSwf:Class; private var _swfByteArray:ByteArray = new ByteArray; private const COMPRESSED:String = "CWS"; private var _swfSize:int; private var _frameRate:int; private var _frameTotal:int; private var _version:int; private var TestClass:Class public function ByteArrayTest() { super(); var tempByteArray:ByteArray = new TestSwf(); //是否 压缩 var compressed:String = tempByteArray.readUTFBytes(3); //swf 版本 _version = tempByteArray.readByte(); // var length:uint = tempByteArray.readUnsignedInt(); tempByteArray.position = 8; tempByteArray.readBytes(_swfByteArray); if(compressed == COMPRESSED) { _swfByteArray.uncompress(); } _swfByteArray.endian = Endian.LITTLE_ENDIAN; // 解析 swf 宽度 高度 数据 rect 数据 _swfSize = _swfByteArray.readUnsignedByte()>>3; _swfByteArray.position = Math.ceil((_swfSize*4)/8+5);// 计算 rect 结束位置 trace(_swfByteArray.position); _frameRate = _swfByteArray.readShort()/256;//读取帧频 因为低8位是小数,所以需要除以2的8次方 _frameTotal = _swfByteArray.readShort();//读取 总帧数 trace("compressed:",compressed,"swf_version:",_version,"frameRate:",_frameRate,"frameTotal:",_frameTotal); parseTagType(); } private function parseTagType():void { //设置读取数据的字节顺序为倒序(以字节为单位) _swfByteArray.endian = Endian.LITTLE_ENDIAN; while(_swfByteArray.bytesAvailable) { var tagHead:int = _swfByteArray.readShort(); var tagType:int = tagHead>>6; //0x3F 00111111 var tagLength:int = tagHead & 0x3F; if(tagLength == 63) //如果tag 是长类型 { tagLength = _swfByteArray.readUnsignedInt(); } // 解析 symbolClass tag if(tagType == 76) { parseSymbolClass(tagLength); } else { _swfByteArray.position += tagLength; } } } private var _classList:Array; private function parseSymbolClass(length:int):void { _classList = []; var classNum:int = _swfByteArray.readShort(); while(classNum --) { var classId:int = _swfByteArray.readUnsignedShort(); // trace("classId之后的位置是"+_swfByteArray.position); var char:int = _swfByteArray.readByte(); var name:String = ""; while(char) { name += String.fromCharCode(char); char = _swfByteArray.readByte(); } trace("导出类名为"+name); _classList.push(name); } } } }
上边那个例子嵌入了我自己的一个swf 大家可以换下自己的进行实验,会依次输出swf的类名 如下图
至于如何用这些东西开发相应的工具,不属于本文范畴
关于ByteArray的一些用法,也请各位自行查看API
本回合结束!!至于DoABC的详细解析....等我鼓足勇气再来吧.....