zoukankan      html  css  js  c++  java
  • swf文件格式解析(二)

    上一篇教程可能写的有点乱 ,本回合开始之前先做一个概述吧,引用官方白皮书的原文

    概述

    SWF 文件是由一个文件头,和跟在后面的一系列的标签组成。标签有定义型标签和控

    制型标签两类。定义型标签把对象定义为角色存储在字典里,控制型标签操作这些角色并控

    制影片的流程。

    如下图

    上回合已经解析完文件头 本会合接着解析Tag

    首先,官方理论知识补充

    定义型标签和控制型标签

    Swf 文件有两类标签:定义型和控制型

    A定义型标签定义SWF 文件的内容如Shapes、文本、位图、声音等等。每一个标签会为

    定义的内容分配一个唯一的编号称做角色编号(character ID)。之后Flash Player 将角色

    (character)存储在称作字典(dictionary)的仓库。定义型标签本身不产生渲染。

    B控制型标签创建和操作已渲染的字典中角色的实例,同时控制文件流程。

    SWF文件的处理过程

    Flash Player 会处理所有的标签直到遇到ShowFrame 标签。此时,显示列表被复制到屏

    幕,然后播放器继续处理直到下一帧需要显示。第一帧的内容累计了第一个ShowFrame 标

    签之前所有控制型标签的执行结果,第二帧的内容累计从文件开始到第二个ShowFrame 标

    签的所有控制标签的执行效果,以此类推。

     

    长标签和短标签

    Tag分为长标签跟短标签

    这个有一个官方的介绍

    每一个标签的开始都是标签的类型和长度。标签头可以是短标签头类型也可以是长标签

    头类型。短标签头类型用于数据在62 字节之内的标签。如果标签的数据长度不超过62 个字

    节使用短标签。而长标签头类型可以用于数据在4G 之内的任何标签。

     

    标签头记录(短类型)

    字段

    类型

    说明

    TagCodeAndLength

    UI16(两个字节)

    高10 位表示标签类型

    低6 位表示标签长度

     

    注意事项:

    TagCodeAndLength 字段是一个两个字节的字,而不是一个10 位的字段跟随一个6

    位字段。SWF 使用低位在前(little-endian)造成上述两种情况是不同的。

    (ps:如果TagCodeAndLength 字段的十六进制是44 11 那么实际上的值是11 44 二

    进制为00010001 01000100前10 位的值是69 表示这是一个FileAttributes标

    签)

    标签的长度不包括标签头记录自己的长度,仅表示其后面数据的长度。

    长标签

    标签头记录(长类型)

    字段

    类型

    说明

    TagCodeAndLength

    UI16(两个字节)

    高10 位表示标签类型

    低6 位始终为0x3F即111111

    Length

    SI32

    标签的长度

    在开始解析之前,我引用一下swf_file_format_spec_v10白皮书中关于标签字段数值跟类型的对应表

     

    Tag value Tag name

    0 End

    1 ShowFrame

    2 DefineShape

    4 PlaceObject

    5 RemoveObject

    6 DefineBits

    7 DefineButton

    8 JPEGTables

    9 SetBackgroundColor

    10 DefineFont

    11 DefineText

    12 DoAction

    13 DefineFontInfo

    14 DefineSound

    15 StartSound

    17 DefineButtonSound

    18 SoundStreamHead

    19 SoundStreamBlock

    20 DefineBitsLossless

    21 DefineBitsJPEG2

    22 DefineShape2

    23 DefineButtonCxform

    24 Protect

    26 PlaceObject2

    28 RemoveObject2

    32 DefineShape3

    33 DefineText2

    34 DefineButton2

    35 DefineBitsJPEG3

    36 DefineBitsLossless2

    37 DefineEditText

    39 DefineSprite

    43 FrameLabel

    45 SoundStreamHead2

    46 DefineMorphShape

    48 DefineFont2

    56 ExportAssets

    57 ImportAssets

    58 EnableDebugger

    59 DoInitAction

    60 DefineVideoStream

    61 VideoFrame

    62 DefineFontInfo2

    64 EnableDebugger2

    65 ScriptLimits

    66 SetTabIndex

    69 FileAttributes

    70 PlaceObject3

    71 ImportAssets2

    73 DefineFontAlignZones

    74 CSMTextSettings

    75 DefineFont3

    76 SymbolClass

    77 Metadata

    78 DefineScalingGrid

    82 DoABC

    83 DefineShape4

    84 DefineMorphShape2

    86 DefineSceneAndFrameLabelData

    87 DefineBinaryData

    88 DefineFontName

    89 StartSound2

    90 DefineBitsJPEG4

    91 DefineFont4

     

     

    下边继续分析我们上一回合那个swf

    重新用Hex workshop打开,截一张图


     

    第一个标签:
    记录头部 44 11 =11 44 =0001000101 000100
    因为 000100!= 111111 所以是短格式, 而且这个标签的长度为 4 ,标签的类型为 69 为FileAttributes(文件属性),(貌似是从swf6之后第一个标签都是这个FileAttributes)

    内容是19 00 00 00

     

    继续分析下第二个标签,这是一个长标签,注意跟短标签有什么不同
    记录头部 7f 13 =13 7f =0001001101 111111
    因为 111111 所以是长格式, 取后四位(因为length为SI32)CB 01 00 00(作为这个标签的长度 0x000001CB = 459 ,标签的类型为 77
    属性是 Metadata 内容为后边459个字节

    .

    .

    .直到最后的结束标签

    记录头部:00 00 = 00 00 = 0000000000 000000
    短标签:标签长度为0,标签类型为0
    标签属性:End
    标签头 加 内容(内容为空)为 :00 00

    下边的标签就不一一赘述,按照这种方式都可以一一解析完毕

    其中最重要的一个标签为82 DoABC(Actionscript ByteCode)标签 即AVM2中执行as代码的地方,这个TAG解析是一件非常浩大的工程,很多前辈都放弃了,如果我有生之年有遗力,一定单独解析一下,以了却那么多前辈的心愿

     

    对应上边的表格 我们可以查到SymbolClass对应的编号为76,我们想得到swf中的链接类其实就是重点解析SymbolClass这个Tag的

     

    下边理论上分析一下SymbolClass

     

    先看以下官方白皮书介绍

    SymbolClass

    The SymbolClass tag creates associations between symbols in the SWF file and

    ActionScript 3.0 classes. It is the ActionScript 3.0 equivalent of the ExportAssets tag. If the

    character ID is zero, the class is associated with the main timeline of the SWF. This is how the root class of a SWF is designated. Classes listed in the SymbolClass tag are available for

    creation by other SWF files (see StartSound2, DefineEditText (HasFontClass), and

    PlaceObject3 (PlaceFlagHasClassName and PlaceFlagHasImage). For example, ten SWF files that are all part of the same website can share an embedded custom font if one file embeds and exports the font class.

     

    这个无非就是介绍了导出类的概念 以及导出类可以被其他swf调用等等,这个都不难理解

    之后就是ADOBE 坑爹的一段,为了澄清我对他的污蔑,我把它的白皮书直接截图下来

     

    上边是解释symbolclass的一个表格 意思就是

    这个tag的组成部分由 header(即symbolclass这标签)+NumSymbols(这个标签导出类的数量占两个字节)+类一ID+类一名字(字符串格式)…类N ID+ 类N名字。

    于是 我就按照这个形式一个字节一个字节解析,结果解析了半下午啊…

    尼玛我这看来看去啊!!

    白皮书很值得信任有木有啊!!

    哥一个字一个字翻译有木有啊!!!

    英文不好的程序员伤不起啊!!

     

    到后来,还是用Hex workshop 一个字节一个字节自己的看16进制

     

    上截图

     


     

     

    两个类之间跟不仅仅是一个两个字节的Tag ID

    尼玛明明有三个字节啊!!!!!!

     

    好了,咆哮之后淡定,我这理解就就是adobe白皮书的一个错误,据过来人说白皮书中有三四处错误,

    如果是我冤枉ADOBE了,谁给我指正 在下同样感激涕零…..

     

     

    以下是用AS3写的一个对SymbolClass解析,包括之前文件头的解释 源码如下

    package symbolClass

    {   

    import flash.display.Sprite;

    import flash.utils.ByteArray;

    import flash.utils.Endian;

    import flashx.textLayout.elements.InlineGraphicElement;

    public class ByteArrayTest extends Sprite

    {   

    [Embed(source = "mainCity.swf", mimeType="application/octet-stream")]

    private var TestSwf:Class;  

    private var _swfByteArray:ByteArray = new ByteArray; 

        

    private const COMPRESSED:String = "CWS"; 

    private var _swfSize:int; 

    private var _frameRate:int; 

    private var _frameTotal:int; 

    private var _version:int; 

    private var TestClass:Class

    public function ByteArrayTest()

    {       

    super();     

    var tempByteArray:ByteArray = new TestSwf();

    //是否 压缩  

    var compressed:String = tempByteArray.readUTFBytes(3);

    //swf 版本

    _version = tempByteArray.readByte();

    //

    var length:uint = tempByteArray.readUnsignedInt();   

    tempByteArray.position = 8; 

    tempByteArray.readBytes(_swfByteArray); 

                

    if(compressed == COMPRESSED)

    {

    _swfByteArray.uncompress(); 

    }  

    _swfByteArray.endian = Endian.LITTLE_ENDIAN;

    // 解析 swf 宽度 高度 数据 rect 数据

    _swfSize = _swfByteArray.readUnsignedByte()>>3;

    _swfByteArray.position = Math.ceil((_swfSize*4)/8+5);// 计算 rect 结束位置

    trace(_swfByteArray.position); 

    _frameRate = _swfByteArray.readShort()/256;//读取帧频 因为低8位是小数,所以需要除以2的8次方

    _frameTotal = _swfByteArray.readShort();//读取 总帧数

    trace("compressed:",compressed,"swf_version:",_version,"frameRate:",_frameRate,"frameTotal:",_frameTotal);

    parseTagType();   

       

    private function parseTagType():void

    {     

    //设置读取数据的字节顺序为倒序(以字节为单位)

    _swfByteArray.endian = Endian.LITTLE_ENDIAN; 

    while(_swfByteArray.bytesAvailable)

    {

    var tagHead:int = _swfByteArray.readShort();

    var tagType:int = tagHead>>6;

         

    //0x3F  00111111

    var tagLength:int = tagHead & 0x3F;   

    if(tagLength == 63) //如果tag 是长类型

    {

    tagLength = _swfByteArray.readUnsignedInt();

    }

    // 解析 symbolClass tag

    if(tagType == 76) 

    {   

    parseSymbolClass(tagLength); 

    }

    else

    {

    _swfByteArray.position += tagLength;

    }

    }

    }  

    private var _classList:Array; 

    private function parseSymbolClass(length:int):void

    {

    _classList = [];

    var classNum:int = _swfByteArray.readShort();

    while(classNum --)

    {   

    var classId:int = _swfByteArray.readUnsignedShort();

    // trace("classId之后的位置是"+_swfByteArray.position);

    var char:int = _swfByteArray.readByte(); 

    var name:String = "";

    while(char)

     

    {    

    name += String.fromCharCode(char);    

    char = _swfByteArray.readByte(); 

    }

                                    trace("导出类名为"+name);

    _classList.push(name);

    }


    上边那个例子嵌入了我自己的一个swf 大家可以换下自己的进行实验,会依次输出swf的类名 如下图



    至于如何用这些东西开发相应的工具,不属于本文范畴

    关于ByteArray的一些用法,也请各位自行查看API

    本回合结束!!至于DoABC的详细解析....等我鼓足勇气再来吧.....

    原文地址:http://blog.sina.com.cn/s/blog_6859df370100wtk4.html

  • 相关阅读:
    SQL Server中使用convert进行日期转换
    杂记
    sqlserver表分区与调优与行列转换
    HttpModule的认识与深入理解及MVC运行机制
    再谈委托
    ASP.NET forms凭据设置和跳转的几种方法
    IOS学习网址
    Activator.CreateInstance 方法 (Type) 的用法
    update多表更新的2种方式
    SQL自定义函数split分隔字符串
  • 原文地址:https://www.cnblogs.com/chenhaib/p/2518069.html
Copyright © 2011-2022 走看看