zoukankan      html  css  js  c++  java
  • uboot_freescale_imx51_start.s_详解

    http://wenku.baidu.com/view/37bc764ee518964bcf847c64.html###

    /*

    *

    *Purpose: the document is used to learn detailed information aboutimx51 cpu start.S, *referring to some documents on websites.

    *file address: U-boot-2009.08/Cpu/Arm_cortexa8/start.S

    *

    * writer: xfhai 2011.7.22

    *

    *Instruction:

    *1.@xxxx : indicates annotation

    *2./*****

    ***

    *****/ : stand for code in my files

    *3.instructions refers to code not included in my file

    *

    */

     

    Section 1: uboot overview

    大多数bootloader都分为stage1和stage2两部分,u-boot也不例外。依赖于CPU体系结构的代码(如设备初始化代码等)通常都放在stage1且可以用汇编语言来实现,而stage2则通常用C语言来实现,这样可以实现复杂的功能,而且有更好的可读性和移植性。
    1、Stage1 start.S代码结构
    u-boot的stage1代码通常放在start.S文件中,他用汇编语言写成,其主要代码部分如下:==> (1)定义入口。由于一个可执行的Image必须有一个入口点,并且只能有一个全局入口,通常这个入口放在ROM(Flash)的0x0地址,因此,必须通知编译器以使其知道这个入口,该工作可通过修改连接器脚本来完成。
    ==>(2)设置异常向量(Exception Vector)。
    ==>(3)设置CPU的速度、时钟频率及终端控制寄存器。
    ==>(4)初始化内存控制器。
    ==>(5)将ROM中的程序复制到RAM中。
    ==>(6)初始化堆栈。
    ==>(7)转到RAM中执行,该工作可使用指令ldr pc来完成。
    2、Stage2 C语言代码部分
    lib_arm/board.c中的start arm boot是C语言开始的函数也是整个启动代码中C语言的主函数,同时还是整个u-boot(armboot)的主函数,该函数只要完成如下操作:
    ==>(1)调用一系列的初始化函数。
    ==>(2)初始化Flash设备。
    ==>(3)初始化系统内存分配函数。
    ==>(4)如果目标系统拥有NAND设备,则初始化NAND设备。
    ==>(5)如果目标系统有显示设备,则初始化该类设备。
    ==>(6)初始化相关网络设备,填写IP、MAC地址等。
    ==>(7)进去命令循环(即整个boot的工作循环),接受用户从串口输入的命令,然后进行相应的工作。

    Section 2: demos

    3、U-Boot的启动顺序(示例,其他u-boot版本类似)
    cpu/arm920t/start.S

    (my file is  U-boot-2009.08/Cpu/Arm_cortexa8/start.S )

    @文件包含处理

    #include <config.h>
    @由顶层的mkconfig生成,其中只包含了一个文件:configs/<顶层makefile中6个参数的第1个参数>.h  
    #include <version.h>  
    #include <status_led.h>

    /*
     *************************************************************************
     *
     * Jump vector table as in table 3.1 in [1]
     *
     *************************************************************************
     */

    注:ARM微处理器支持字节(8位)、半字(16位)、字(32位)3种数据类型向量跳转表,每条占四个字节(一个字),地址范围为0x0000 0000~@0x0000 0020,ARM体系结构规定在上电复位后的起始位置,必须有8条连续的跳转指令,通过硬件实现。他们就是异常向量表。ARM在上电复位后,是从0x00000000开始启动的,其实如果bootloader存在,在执行下面第一条指令后,就无条件跳转到start_code,下面一部分并没执行。设置异常向量表的作用是识别bootloader。以后系统每当有异常出现,则CPU会根据异常号,从内存的0x00000000处开始查表做相应的处理

    /******************************************************

    ;当一个异常出现以后,ARM会自动执行以下几个步骤:
    ;1.把下一条指令的地址放到连接寄存器LR(通常是R14).---保存位置
    ;2.将相应的CPSR(当前程序状态寄存器)复制到SPSR(备份的程序状态寄存器)中---保存CPSR
    ;3.根据异常类型,强制设置CPSR的运行模式位
    ;4.强制PC(程序计数器)从相关异常向量地址取出下一条指令执行,从而跳转到相应的异常处理程序中
    *********************************************************/

    .globl _start  /*系统复位位置,整个程序入口*/
    @_start是GNU汇编器的默认入口标签,.globl将_start声明为外部程序可访问的标签,.globl是GNU汇编的保留关键字,前面加点是GNU汇编的语法
    _start: b       start_code   @0x00

    //diff here: _start: b reset
    @ARM上电后执行的第一条指令,也即复位向量,跳转到start_code

    @reset用b,就是因为reset在MMU建立前后都有可能发生
    @其他的异常只有在MMU建立之后才会发生
       ldr pc, _undefined_instruction /*未定义指令异常,0x04*/
       ldr pc, _software_interrupt   /*软中断异常,0x08*/
       ldr pc, _prefetch_abort    /*内存操作异常,0x0c*/
       ldr pc, _data_abort     /*数据异常,0x10*/
       ldr pc, _not_used     /*未适用,0x14*/
       ldr pc, _irq      /*慢速中断异常,0x18*/
       ldr pc, _fiq      /*快速中断异常,0x1c*/

    @对于ARM数据从内存到CPU之间的移动只能通过L/S(load && storage)指令,如:ldr r0,0x12345678为把0x12345678内存中的数据写到r0中,还有一个就是ldr伪指令,如:ldr r0,=0x12345678为把0x12345678地址写到r0中,mov只能完成寄存器间数据的移动,而且立即数长度限制在8位

    _undefined_instruction: .word undefined_instruction
    _software_interrupt: .word software_interrupt
    _prefetch_abort: .word prefetch_abort
    _data_abort:  .word data_abort
    _not_used:  .word not_used
    _irq:   .word irq
    _fiq:   .word fiq

    //three more lines here:

    //.pad:  .word 0x12345678 /*now 16*4=64*/

    //.global _end_vector

    //_end_vect:

    //don’t make sense
    @.word为GNU ARM汇编特有的伪操作,为分配一段字内存单元(分配的单元为字对齐的),可以使用.word把标志符作为常量使用。如_fiq:.word fiq即把fiq存入内存变量_fiq中,也即是把fiq放到地址_fiq中。

     .balignl 16,0xdeadbeef
      .balign是意思是:以当前地址为开始开始,找到第一次出现的以第一个参数为整数倍的地址,并将其作为结束地址,在这个结束地址前面存储一个字节长度的数据,存储内容正是第二个参数。如果当前地址正好是第一个参数的倍数,则没有数据被写入到内存。

    .balign 8, 0xde这条指令的含义可以用下图表示: 

      图解:以当前地址为开始开始,找到第一次出现的以8为整数倍的地址,并将其作为结束地址,在这个结束地址前面存储一个字节长度的数据0xde。如果当前地址正好是8的倍数,则没有数据被写入到内存。

        以此类推,.balignw则表示第二个参数存入的内容长度为2字节:

        .balignw 4, 0x368d

        因为现在填入的内容为2个字节,那就存在以下几种情况:

              当前地址没有偏移就满足了以4为倍数的地址

              当前地址偏移了1个字节就满足了以4为倍数的地址

              当前地址偏移了2个字节就满足了以4为倍数的地址

              当前地址编移了3个字节就满足了以4为倍数的地址

        分析一下这四种情况:

              当没有偏移的时候,地址中间肯定没有办法填上信息

              当偏移1个字节的时候,地址中间空隙不够,所以填入的数值,是末定义,也就是说,填入什么值,不清楚

              当偏移2个字节的时候,地址中间的空隙正好填入0x368d两个字节的内容

              当偏移3个字节的时候,地址中间的空隙大于所要填的内容。此时填入的数值,是末定义,填入什么值,不清楚

        以此类推,.balignl,这个指令用来填与一个字,即4个字节的长度

    仔细分析一下就知道,对于.balignl 16, 0xdeadbeef,如果想要0xdeadbeef一定填到当前地址后面某个部分,当前地址偏移量就必须为4字节,这样才能保证在任何情况下,偏移的地址所留的空隙刚好填入所要填的内容。

     //伪操作指机器码里没有对应的汇编指令,由编译器实现其功能 

    /*
     *************************************************************************
     *
     * Startup Code (called from the ARM reset exception vector)
     *
     * do important init only if we don't start from memory!
     * relocate armboot to ram
     * setup stack
     * jump to second stage
     *
     *************************************************************************

    @保存变量的数据区,保存一些全局变量,用于BOOT程序从FLASH拷贝@到RAM,或者其它的使用。还有一些变量的长度是通过连接脚本里得到,实际上由编译器算出@来的

    _TEXT_BASE:

    @因为linux开始地址是0x30000000

    //the reason for linux start address is 0x30000000?
     .word TEXT_BASE /*uboot映像在SDRAM中的重定位地址*/
    @TEXT_BASE在开发板相关的目录中的config.mk文档中定义, 他定义了代码在运行时所在的地址, 那么_TEXT_BASE中保存了这个地址(这个TEXT_BASE怎么来的还不清楚)

     //the file address is U-boot-2009.08/Board/freescale/Mx51_bbg/Config.mk

    //& the TEXT_BASE is 0x978000000, has any special reasons?

    .globl _armboot_start
    _armboot_start:
     .word _start
    @用_start来初始化_armboot_start。 

    /*
     * These are defined in the board-specific linker script.
     */
    @下面这些是定义在开发板目录链接脚本中的 

    .globl _bss_start   
    _bss_start:
     .word __bss_start
    @__bss_start定义在和开发板相关的u-boot.lds中,_bss_start保存的是__bss_start标号所在的地址。 

    .globl _bss_end
    _bss_end:
     .word _end
    @同上,这样赋值是因为代码所在地址非编译时的地址,直接取得该标号对应地址。 

    @中断的堆栈设置

     #ifdef CONFIG_USE_IRQ
    /* IRQ stack memory (calculated at run-time) */
    .globl IRQ_STACK_START
    IRQ_STACK_START:
     .word 0x0badc0de 

    /* IRQ stack memory (calculated at run-time) */
    .globl FIQ_STACK_START
    FIQ_STACK_START:
     .word 0x0badc0de
    #endif 

    /*
     * the actual start code
     */
    @复位后执行程序
    @真正的初始化从这里开始了。其实在CPU一上电以后就是跳到这里执行的
    reset:
     /*
      * set the cpu to SVC32 mode
      */
    @更改处理器模式为管理模式
    @对状态寄存器的修改要按照:读出-修改-写回的顺序来执行
    @   31 30 29 28 ---   7   6   -   4    3   2   1   0
        N  Z  C  V        I   F       M4   M3  M2  M1  M0
                                       0   0   0  0   0     User26 模式
                                       0   0   0  0   1     FIQ26 模式
                                       0   0   0  1   0     IRQ26 模式
                                       0   0   0  1   1     SVC26 模式
                                       1   0   0  0   0     User 模式
                                       1   0   0  0   1     FIQ 模式
                                       1   0   0  1   0     IRQ 模式
                                       1   0   0  1   1     SVC 模式
                                       1   0   1  1   1     ABT 模式
                                       1   1   0  1   1     UND 模式
                                       1   1   1  1   1     SYS 模式 

     mrs r0,cpsr
    @将cpsr的值读到r0中

    //mrs 程序状态寄存器到通用寄存器的数据传送指令
     bic r0,r0,#0x1f
    @清除M0~M4
     //bic 位清除指令

    orr r0,r0,#0xd3
    @禁止IRQ,FIQ中断,并将处理器置于管理模式
    //orr 数据处理指令

     msr cpsr,r0

     //msr 通用寄存器到程序状态寄存器的数据传送指令

    @以下是点灯了,这里应该会牵涉到硬件设置,移植的时候应该可以不要
    /*****************************************************************************

    ** these steps are not included.

    ** 

    bl coloured_LED_init
     bl red_LED_on 

    @针对AT91RM9200进行特殊处理
    #if defined(CONFIG_AT91RM9200DK) || defined(CONFIG_AT91RM9200EK)
     /*
      * relocate exception table
      */
     ldr r0, =_start
     ldr r1, =0x0
     mov r2, #16
    copyex:
     subs r2, r2, #1
    @sub带上了s用来更改进位标志,对于sub来说,若发生借位则C标志置0,没有则为1,这跟adds指令相反!要注意。
     ldr r3, [r0], #4
     str r3, [r1], #4
     bne copyex
    #endif 

    @针对S3C2400和S3C2410进行特殊处理
    @CONFIG_S3C2400、CONFIG_S3C2410等定义在include/configs/下不同开发板的头文件中
    #if defined(CONFIG_S3C2400) || defined(CONFIG_S3C2410)
     /* turn off the watchdog */ 

    @关闭看门狗定时器的自动复位功能并屏蔽所有中断,上电后看门狗为开,中断为关
    # if defined(CONFIG_S3C2400)
    #  define pWTCON  0x15300000
    #  define INTMSK  0x14400008 /* Interupt-Controller base addresses */
    #  define CLKDIVN 0x14800014 /* clock divisor register */
    #else @s3c2410的配置
    #  define pWTCON  0x53000000  
    @pWTCON定义为看门狗控制寄存器的地址(s3c2410和s3c2440相同)
    #  define INTMSK  0x4A000008 /* Interupt-Controller base addresses */
    @INTMSK定义为主中断屏蔽寄存器的地址(s3c2410和s3c2440相同)
    #  define INTSUBMSK  0x4A00001C
    @INTSUBMSK定义为副中断屏蔽寄存器的地址(s3c2410和s3c2440相同)
    #  define CLKDIVN  0x4C000014 /* clock divisor register */
    @CLKDIVN定义为时钟分频控制寄存器的地址(s3c2410和s3c2440相同)
    # endif
    @至此寄存器地址设置完毕 

     ldr     r0, =pWTCON
     mov     r1, #0x0
     str     r1, [r0]
    @对于S3C2440和S3C2410的WTCON寄存器的[0]控制允许或禁止看门狗定时器的复位输出功能,设置为“0”禁止复位功能。 

     /*
      * mask all IRQs by setting all bits in the INTMR - default
      */
     mov r1, #0xffffffff
     ldr r0, =INTMSK
     str r1, [r0]
    # if defined(CONFIG_S3C2410)
     ldr r1, =0x3ff  @2410好像应该为7ff才对(不理解uboot为何是这个数字)
     ldr r0, =INTSUBMSK
     str r1, [r0]
    # endif
    @对于S3C2410的INTMSK寄存器的32位和INTSUBMSK寄存器的低11位每一位对应一个中断,相应位置“1”为不响应相应的中断。对于S3C2440的INTSUBMSK有15位可用,所以应该为0x7fff了。 

     /* FCLK:HCLK:PCLK = 1:2:4 */
     /* default FCLK is 120 MHz ! */
     ldr r0, =CLKDIVN
     mov r1, #3
     str r1, [r0]
    @时钟分频设置,FCLK为核心提供时钟,HCLK为AHB(ARM920T,内存@控制器,中断控制器,LCD控制器,DMA和主USB模块)提供时钟,@PCLK为APB(看门狗、IIS、I2C、PWM、MMC、ADC、UART、GPIO、@RTC、SPI)提供时钟。分频数一般选择1:4:8,所以HDIVN=2,PDIVN=1,@CLKDIVN=5,这里仅仅是配置了分频寄存器,关于MPLLCON的配置肯@定写在lowlevel_init.S中了
    @归纳出CLKDIVN的值跟分频的关系:
    @0x0 = 1:1:1  ,  0x1 = 1:1:2 , 0x2 = 1:2:2  ,  0x3 = 1:2:4,  0x4 = 1:4:4,  0x5 = 1:4:8, 0x6 = 1:3:3,
    0x7 = 1:3:6
    @S3C2440的输出时钟计算式为:Mpll=(2*m*Fin)/(p*2^s)
    S3C2410的输出时钟计算式为:Mpll=(m*Fin)/(p*2^s)
    m=M(the value for divider M)+8;p=P(the value for divider P)+2
    M,P,S的选择根据datasheet中PLL VALUE SELECTION TABLE表格进行, 
    我的开发板晶振为16.9344M,所以输出频率选为:399.65M的话M=0x6e,P=3,S=1
    @s3c2440增加了摄像头,其FCLK、HCLK、PCLK的分频数还受到CAMDIVN[9](默认为0),CAMDIVN[8](默认为0)的影响
    #endif /* CONFIG_S3C2400 || CONFIG_S3C2410 */ 

     /*
      * we do sys-critical inits only at reboot,
      * not when booting from ram!
      */

    ****************************************************************************/

    //I have these instead

    #if (CONFIG_OMAP34XX)

    /* Copy vectors to mask ROM indirect addr */

    adr r0, _start  @r0 <- current position of code

    add r0, r0, #4  @skip reset vector

    mov r2, #64     @r2 <- size to copy

    add r2, r0, r2  @r2 <- source end address

    mov r1, #SRAM_OFFSET0  @build vect addr

    mov r3, #SRAM_OFFSET1

    add r1, r1, r3

    mov r3, #SRAM_OFFSET2

    add r1, r1, r3

    next:

    ldmia r0!, {r3 - r10}   @copy from source address [r0]

    stmia  r1!, {r3 - r10}   @copy to   target address [r1]

    cmp r0, r2  @until source end address [r2]

    bne next  @loop until equal */

    #if !defined(CONFIG_SYS_NAND_BOOT) && !defined(CONFIG_SYS_ONENAND_BOOT)

    /* No need to copy/exec the clock code - DPLL adjust already done

    *in NAND/oneNAND Boot.

    */

    bl cpy_clk_code  @put dpll adjust code behind vectors

    #endif /* NAND Boot */

    #endif

    @选择是否初始化CPU
    #ifndef CONFIG_SKIP_LOWLEVEL_INIT
     bl cpu_init_crit

    //bl 带返回的跳转指令
    @执行CPU初始化,BL完成跳转的同时会把后面紧跟的一条指令地址保存到连接寄存器LR(R14)中。以使子程序执行完后正常返回。
    #endif 

    @调试阶段的代码是直接在RAM中运行的,而最后需要把这些代码固化到Flash中,因此U-Boot需要自己从Flash转移到RAM中运行,这也是重定向的目的所在。通过adr指令得到当前代码的地址信息:如果U-boot是从RAM开始运行,则从adr,r0,_start得到的地址信息为r0=_start=_TEXT_BASE=TEXT_BASE=0x33F80000;如果U-boot从Flash开始运行,即从处理器对应的地址运行,则r0=0x0000,这时将会执行copy_loop标识的那段代码了。 _TEXT_BASE 定义在board/smdk2410/config.mk中
    #ifndef CONFIG_SKIP_RELOCATE_UBOOT
    relocate:    /* relocate U-Boot to RAM     */
     adr r0, _start  /* r0 <- current position of code   */
     ldr r1, _TEXT_BASE  /* test if we run from flash or RAM */
     cmp     r0, r1  /* don't reloc during debug         */
     beq     stack_setup
     ldr r2, _armboot_start
    @_armboot_start为_start地址
     ldr r3, _bss_start
    @_bss_start为数据段地址
     sub r2, r3, r2  /* r2 <- size of armboot            */
     add r2, r0, r2  /* r2 <- source end address         */ 

    copy_loop:
     ldmia r0!, {r3-r10}  /* copy from source address [r0]    */

    @从源地址[r0]读取8个字节到寄存器,每读一个就更新一次r0地址
    @ldmia:r0安字节增长
     stmia r1!, {r3-r10}  /* copy to   target address [r1]    */
    @LDM(STM)用于在寄存器所指的一片连续存储器和寄存器列表的寄存@器间进行数据移动,或是进行压栈和出栈操作。
    @格式为:LDM(STM){条件}{类型}基址寄存器{!},寄存器列表{^}
    @对于类型有以下几种情况: IA 每次传送后地址加1,用于移动数

    @据块
        IB 每次传送前地址加1,用于移动数据块
        DA 每次传送后地址减1,用于移动数据块
        DB 每次传送前地址减1,用于移动数据块
        FD 满递减堆栈,用于操作堆栈(即先移动指针再操作数据,相当于DB)
        ED 空递减堆栈,用于操作堆栈(即先操作数据再移动指针,相当于DA)
        FA 满递增堆栈,用于操作堆栈(即先移动指针再操作数据,相当于IB)
        EA 空递增堆栈,用于操作堆栈(即先操作数据再移动指针,相当于IA)
    (这里是不是应该要涉及到NAND或者NOR的读写?没有看出来) 

     cmp r0, r2   /* until source end addreee [r2]    */
     ble copy_loop
    #endif /* CONFIG_SKIP_RELOCATE_UBOOT */ 

     /* Set up the stack          */
    @初始化堆栈
    stack_setup:
    ldr r0, _TEXT_BASE  /* upper 128 KiB: relocated uboot   */

    @获取分配区域起始指针,

    sub r0, r0, #CONFIG_SYS_MALLOC_LEN /* malloc area    */

    @CFG_MALLOC_LEN=128*1024+CFG_ENV_SIZE=128*1024+0x1@0000=192K

    sub r0, r0, #CONFIG_SYS_GBL_DATA_SIZE /* bdinfo   */

    @CFG_GBL_DATA_SIZE    128---size in bytes reserved for initial data 用来存储开发板信息
    #ifdef CONFIG_USE_IRQ

    @这里如果需要使用IRQ, 还有给IRQ保留堆栈空间, 一般不使用.
     sub r0, r0, #(CONFIG_STACKSIZE_IRQ+CONFIG_STACKSIZE_FIQ)
    #endif
     sub sp, r0, #12  /* leave 3 words for abort-stack    */ 

    /******************************************************************************

    *one more line here

    *and sp,sp,#~7   /*8 byte aligned for (ldr/str) d */

    ******************************************************************************/

    @该部分将未初始化数据段_bss_start----_bss_end中的数据清零
    clear_bss:
     ldr r0, _bss_start  /* find start of bss segment        */
     ldr r1, _bss_end  /* stop here                        */
     mov r2, #0x00000000  /* clear value                     */ 

    clbss_l:

    str r2, [r0]  /* clear loop...                    */
     add r0, r0, #4
     cmp r0, r1
     ble clbss_l

    /******************************************************************************

    *clbss_l:

    str r2, [r0]    @ clear BSS location

    cmp r0, r1      @ are we at the end yet

    add r0, r0, #4  @ increment clear index pointer

    bne clbss_l     @ keep clearing till at end

    ******************************************************************************/

    /******************************************************************************

    *here three more lines to deal with mmu initialization 

    #ifdef CONFIG_ARCH_MMU

      Bl board_mmu_init

    #endif

    ******************************************************************************/

    @跳到阶段二C语言中去
     ldr pc, _start_armboot 

    _start_armboot: .word start_armboot
    @start_armboot在/lib_arm/中,到这里因该是第一阶段已经完成了吧,下面就要去C语言中执行第二阶段了吧

     /*
     *************************************************************************
     * CPU_init_critical registers
     *
     * setup important registers
     * setup memory timing
     *************************************************************************
     */
    @CPU初始化

    @在“relocate: /* relocate U-Boot to RAM */ ”之前被调用

    #ifndef CONFIG_SKIP_LOWLEVEL_INIT
    cpu_init_crit:     

    /*
      * in my file : Invalidate L1 I/D

      */
     mov r0, #0   @set up for MCR
     mcr p15, 0, r0, c8, c7, 0 @invalidate TLBs
     mcr p15, 0, r0, c7, c5, 0 @invalidate icache

    /*************************************************************************

    *not in my file

    /*
      * flush v4 I/D caches
      */
    @初始化CACHES
     mov r0, #0
     mcr p15, 0, r0, c7, c7, 0 /* flush v3/v4 cache */
     mcr p15, 0, r0, c8, c7, 0 /* flush v4 TLB */

     /*
      * disable MMU stuff and caches
      */
     mrc p15, 0, r0, c1, c0, 0
     bic r0, r0, #0x00002300 @ clear bits 13, 9:8 (--V- --RS)
     bic r0, r0, #0x00000087 @ clear bits 7, 2:0 (B--- -CAM)
     orr r0, r0, #0x00000002 @ set bit 2 (A) Align
     orr r0, r0, #0x00001000 @ set bit 12 (I) I-Cache
     mcr p15, 0, r0, c1, c0, 0
    @对协处理器的操作还是看不懂,暂时先不管吧,有时间研究一下ARM技术手册的协处理器部分。 

     /*
      * before relocating, we have to setup RAM timing
      * because memory timing is board-dependend, you will
      * find a lowlevel_init.S in your board directory.
      */
    @初始化RAM时钟,因为内存是跟开发板密切相关的,所以这部分在/开发板目录/lowlevel_init.S中实现
     mov ip, lr
    @保存LR,以便正常返回,注意前面是通过BL跳到cpu_init_crit来的。
    @(ARM9有37个寄存器,ARM7有27个)
    37个寄存器=7个未分组寄存器(R0~R7)+ 2×(5个分组寄存器R8~R12)+6×2(R13=SP,R14=lr 分组寄存器) + 1(R15=PC) +1(CPSR) + 5(SPSR)
    用途和访问权限:
    R0~R7:USR(用户模式)、fiq(快速中断模式)、irq(中断模式)、svc(超级用法模式)、abt、und
    R8~R12:R8_usr~R12_usr(usr,irq,svc,abt,und)
             R8_fiq~R12_fiq(fiq)
    R11=fp
    R12=IP(从反汇编上看,fp和ip一般用于存放SP的值)
    R13~R14:R13_usr R14_usr(每种模式都有自己的寄存器)
    SP ~lr :R13_fiq R14_fiq
              R13_irq R14_irq
              R13_svc R14_svc
              R13_abt R14_abt
              R13_und R14_und
    R15(PC):都可以访问(即PC的值为当前指令的地址值加8个字节)
    R16    :((Current Program Status Register,当前程序状态寄存器))
               SPSR _fiq,SPSR_irq,SPSR_abt,SPSR_und(USR模式没有) 

    #if defined(CONFIG_AT91RM9200EK) 

    #else
     bl lowlevel_init

    @在重定向代码之前,必须初始化内存时序,因为重定向时需要将@flash中的代码复制到内存中lowlevel_init在@/board/smdk2410/lowlevel_init.S中。                

    #endif
     mov lr, ip
     mov pc, lr
    @返回到主程序 

    #endif /* CONFIG_SKIP_LOWLEVEL_INIT */ 

    /*

    * Jump to board specific initialization...

    * The Mask ROM will have already initialized

    * basic memory. Go here to bump up clock rate and handle

    * wake up conditions.

    */

    mov ip, lr           @ persevere link reg across call

    bl  lowlevel_init    @ go setup pll,mux,memory

    mov lr, ip           @ restore link

    mov pc, lr           @ back to my caller

    *************************************************************************/

    /*
     *************************************************************************
     *
     * Interrupt handling
     *
     *************************************************************************
     */
    @这段没有看明白,不过好像跟移植关系不是很大,先放一放。
    @
    @ IRQ stack frame.
    @
    #define S_FRAME_SIZE 72

    #define S_OLD_R0 68
    #define S_PSR  64
    #define S_PC  60
    #define S_LR  56
    #define S_SP  52

    #define S_IP  48
    #define S_FP  44
    #define S_R10  40
    #define S_R9  36
    #define S_R8  32
    #define S_R7  28
    #define S_R6  24
    #define S_R5  20
    #define S_R4  16
    #define S_R3  12
    #define S_R2  8
    #define S_R1  4
    #define S_R0  0

    #define MODE_SVC 0x13
    #define I_BIT  0x80

    /*
     * use bad_save_user_regs for abort/prefetch/undef/swi ...
     * use irq_save_user_regs / irq_restore_user_regs for IRQ/FIQ handling
     */

     .macro bad_save_user_regs
     sub sp, sp, #S_FRAME_SIZE  @carve out a frame on current user stack
     stmia sp, {r0 - r12}   @ Save user registers ( now in svc mode ) r0-r12


     ldr r2, _armboot_start
     sub r2, r2, #(CONFIG_STACKSIZE) @no such line
     sub r2, r2, #(CONFIG_SYS_MALLOC_LEN)
     sub r2, r2, #(CONFIG_SYS_GBL_DATA_SIZE+8)  @ set base 2 words into abort stack
     ldmia r2, {r2 - r3}   @ get values for aborted pc and cpsr ( into parm regs )
     add r0, sp, #S_FRAME_SIZE  @ grab pointer to old stack

     add r5, sp, #S_SP
     mov r1, lr
     stmia r5, {r0 - r3}   @ save sp_SVC, lr_SVC, pc, cpsr
     mov r0, sp            @ (param register)

     .endm

     .macro irq_save_user_regs
     sub sp, sp, #S_FRAME_SIZE
     stmia sp, {r0 - r12}   @ Calling r0-r12
     /*

    * next 6 lines, use register r8 instead of r7

    */

    add     r7, sp, #S_PC                   @!!R7 needs to be saved!!

    @ a reserved stak spot would be good
     stmdb   r7, {sp, lr}^                   @ Calling SP, LR
     str     lr, [r7, #0]                    @ Save calling PC
     mrs     r6, spsr
     str     r6, [r7, #4]                    @ Save CPSR
     str     r0, [r7, #8]                    @ Save OLD_R0
     mov r0, sp
     .endm

     .macro irq_restore_user_regs
     ldmia sp, {r0 - lr}^   @ Calling r0 - lr
     mov r0, r0
     ldr lr, [sp, #S_PC]   @ Get PC
     add sp, sp, #S_FRAME_SIZE
     subs pc, lr, #4   @ return & move spsr_svc into cpsr
     .endm

     .macro get_bad_stack
     ldr r13, _armboot_start  @ setup our mode stack( enter in banked mode)
     sub r13, r13, #(CONFIG_STACKSIZE)  @ no such line
     sub r13, r13, #(CONFIG_SYS_MALLOC_LEN) @move past malloc pool
     sub r13, r13, #(CONFIG_SYS_GBL_DATA_SIZE+8) @ reserved a couple spots in abort stack

     str lr, [r13]   @ save caller lr in position 0 of saved stack
     mrs lr, spsr    @ get the spsr
     str     lr, [r13, #4] @ save spsr in position 1 of saved stack

     mov r13, #MODE_SVC   @ prepare SVC-Mode
     @ msr spsr_c, r13
     msr spsr, r13       @ switch modes, make sure moves will execute
     mov lr, pc          @ capture return pc
     movs pc, lr         @ jump to next instruction & switch modes
     .endm

    /*********************************************************
     * more settings here

    .macro get_bad_stack_swi

    sub r13, r13, #4    @ space on current stack for scratch reg.

    str r0, [r13]   @ save R0's value.

    Ldr r0, _armboot_start  @ get data regions start

    sub r0, r0, #(CONFIG_SYS_MALLOC_LEN)   @ move past malloc pool

    subr0, r0, #(CONFIG_SYS_GBL_DATA_SIZE + 8)  @ move past gbl and a couple

    @ spots for abort stack

    str lr, [r0]    @ save caller lr in position 0 of saved stack

    mrs r0, spsr    @ get the spsr

    str lr, [r0, #4]  @ save spsr in position 1 of saved stack

    ldr r0, [r13]   @ restore r0

    add r13, r13, #4 @ pop stack entry

    .endm


     ********************************************************/

     .macro get_irq_stack   @ setup IRQ stack
     ldr sp, IRQ_STACK_START
     .endm

     .macro get_fiq_stack   @ setup FIQ stack
     ldr sp, FIQ_STACK_START
     .endm

    /*********************************************************
     * exception handlers
     ********************************************************/
    @异常向量处理
    @每一个异常向量处其实只放了一条跳转指令(因为每个异常向量只

    @有4个字节不能放太多的程序),跳到相应的异常处理程序中。
     .align  5
    undefined_instruction:
     get_bad_stack
     bad_save_user_regs
     bl do_undefined_instruction

     .align 5
    software_interrupt:
     get_bad_stack
     bad_save_user_regs
     bl do_software_interrupt

     .align 5
    prefetch_abort:
     get_bad_stack
     bad_save_user_regs
     bl do_prefetch_abort

     .align 5
    data_abort:
     get_bad_stack
     bad_save_user_regs
     bl do_data_abort

     .align 5
    not_used:
     get_bad_stack
     bad_save_user_regs
     bl do_not_used

    #ifdef CONFIG_USE_IRQ

     .align 5
    irq:
     get_irq_stack
     irq_save_user_regs
     bl do_irq
     irq_restore_user_regs

     .align 5
    fiq:
     get_fiq_stack
     /* someone ought to write a more effiction fiq_save_user_regs */
     irq_save_user_regs
     bl do_fiq
     irq_restore_user_regs

    #else

     .align 5
    irq:
     get_bad_stack
     bad_save_user_regs
     bl do_irq

     .align 5
    fiq:
     get_bad_stack
     bad_save_user_regs
     bl do_fiq

    #endif /*CONFIG_USE_IRQ*/
    /****************************************************************************

    * more lines in my file

    /*

    *   v7_flush_dcache_all()

    *

    *   Flush the whole D-cache.

    *

    *   Corrupted registers: r0-r5, r7, r9-r11

    *

    *   - mm- mm_struct describing address space

    */

    .align 5

    .global v7_flush_dcache_all

    v7_flush_dcache_all:

    stmfd   r13!, {r0 - r5, r7, r9 - r12, r14}

    mov r7, r0  @ take a backup of device type

    cmp r0, #0x3    @ check if the device type is GP

    moveq r12, #0x1 @ set up to invalide L2

    smi:    .word 0x01600070    @ Call SMI monitor (smieq)

    cmp r7, #0x3    @ compare again in case its

    @ lost

    beq finished_inval  @ if GP device, inval done

    @ above

    mrc p15, 1, r0, c0, c0, 1   @ read clidr

    ands    r3, r0, #0x7000000  @ extract loc from clidr

    mov r3, r3, lsr #23 @ left align loc bit field

    beq finished_inval  @ if loc is 0, then no need to

    @ clean

    Mov r10, #0 @ start clean at cache level 0

    inval_loop1:

    add r2, r10, r10, lsr #1    @ work out 3x current cache

    @ level

    mov r1, r0, lsr r2  @ extract cache type bits from clidr

    and r1, r1, #7  @ mask of the bits for current

    @ cache only

    cmp r1, #2  @ see what cache we have at

    @ this level

    blt skip_inval  @ skip if no cache, or just

    @ i-cache

    mcr p15, 2, r10, c0, c0, 0  @ select current cache level

    @ in cssr

    mov r2, #0  @ operand for mcr SBZ

    mcr p15, 0, r2, c7, c5, 4   @ flush prefetch buffer to

    @ sych the new cssr&csidr,

    @ with armv7 this is 'isb',

    @ but we compile with armv5

    mrc p15, 1, r1, c0, c0, 0   @ read the new csidr

    and r2, r1, #7  @ extract the length of the

    @ cache lines

    add r2, r2, #4  @ add 4 (line length offset)

    ldr r4, =0x3ff

    ands    r4, r4, r1, lsr #3  @ find maximum number on the

    @ way size

    clz r5, r4  @ find bit position of way

    @ size increment

    ldr r7, =0x7fff

    ands    r7, r7, r1, lsr #13 @ extract max number of the

    @ index size

    inval_loop2:

    mov r9, r4  @ create working copy of max

    @ way size

    inval_loop3:

    orr r11, r10, r9, lsl r5    @ factor way and cache number

    @ into r11

    orr r11, r11, r7, lsl r2    @ factor index number into r11

    mcr p15, 0, r11, c7, c6, 2  @ invalidate by set/way

    sub sr9, r9, #1 @ decrement the way

    bge inval_loop3

    subs    r7, r7, #1  @ decrement the index

    bge inval_loop2

    skip_inval:

    add r10, r10, #2    @ increment cache number

    cmp r3, r10

    bgt inval_loop1

    finished_inval:

    mov r10, #0 @ swith back to cache level 0

    mcr p15, 2, r10, c0, c0, 0  @ select current cache level

    @ in cssr

    mcr p15, 0, r10, c7, c5, 4  @ flush prefetch buffer,

    @ with armv7 this is 'isb',

    @ but we compile with armv5

    Ldmfd r13!, {r0 - r5, r7, r9 - r12, pc}

    *

    ******************************************************************************/

    @可知start.S的流程为:异常向量——上电复位后进入复位异常向量——跳到启动代码处——设置处理器进入管理模式——关闭看门狗——关闭中断——设置时钟分频——关闭MMU和CACHE——进入lowlever_init.S——检查当前代码所处的位置,如果在FLASH中就将代码搬移到RAM中

  • 相关阅读:
    java程序员究竟应该掌握点什么
    Java程序员集合框架面试题
    数组名和数组名取地址的区别
    二维、三维数组转一维数组
    函数指针 行指针 指针数组
    转:如何成为一个优秀的程序员
    转:最小堆的数组实现
    for_each使用方法详解[转]
    c++虚函数的作用是什么?
    转:C语言 可变参数
  • 原文地址:https://www.cnblogs.com/cainiaoaixuexi/p/3118894.html
Copyright © 2011-2022 走看看