zoukankan      html  css  js  c++  java
  • Linux学习--理解硬链接与软链接

    Linux 的文件与曼目录

    现代操作系统为解决信息能独立于进程之外被长期储存引入了文件,文件作为进程创建信息的逻辑单元可被多个进程并发使用。在Unix系统中,操作系统为磁盘上的文本与图像,鼠标与键盘灯输入设备及网络交互等 I/O 操作设计了一组通用API,使他们被处理时均可统一使用字节流方式。换言之,Unix系统中除进程之外的一切皆是文件,而Linux保持了这一特性。为了便于文件的管理,Linux还引入了目录(有时也被称为文件夹)这一概念,目录使文件被分类管理,且目录的引入使Linux的文件系统形成一个层级结构的目录树。下图所示的是普通Linux系统的顶层目录结构,其中/dev 是存放了设备相关文件的目录

    /              根目录
    ├── bin     存放用户二进制文件
    ├── boot    存放内核引导配置文件
    ├── dev     存放设备文件
    ├── etc     存放系统配置文件
    ├── home    用户主目录
    ├── lib     动态共享库
    ├── lost+found  文件系统恢复时的恢复文件
    ├── media   可卸载存储介质挂载点
    ├── mnt     文件系统临时挂载点
    ├── opt     附加的应用程序包
    ├── proc    系统内存的映射目录,提供内核与进程信息
    ├── root    root 用户主目录
    ├── sbin    存放系统二进制文件
    ├── srv     存放服务相关数据
    ├── sys     sys 虚拟文件系统挂载点
    ├── tmp     存放临时文件
    ├── usr     存放用户应用程序
    └── var     存放邮件、系统日志等变化文件

    Linux 与其他类Unix系统一样并不区分文件和目录:目录是记录了其他文件名的文件。使用命令mkdir 创建目录时,若期望创建的目录的名称与现有的文件名(或目录名)重复,则会创建失败。

     
    Linux 将设备当作文件进行处理,下图展示了如何打开设备文件/dev/input/event5 并读取文件内容。文件 event5 表示一种输入设备,其可能是鼠标或键盘等。查看文件/proc/bus/input/devices 可知 event5 对应设备的类型。设备文件 /dev/input/event5 使用read() 以字符流方式被读取。结构体input_event 被定义在内核头文件 linux/input.h 中
     
    int fd;
    struct input_event ie;
    fd = open("/dev/input/event5", O_RDONLY);
    read(fd, &ie, sizeof(struct input_event));
    printf("type = %d  code = %d  value = %d
    ",
                ie.type, ie.code, ie.value);
    close(fd);
    硬链接与软链接的联系和区别
    我们知道文件都有文件名与数据,这在Linux上被分成两个部分:用户数据(user data)与元数据(meta data)。用户数据,即文件数据块(data block),数据块是记录文件真实内容的地方;二元数据则是文件的附加属性,如文件大小,创建时间,所有者等信息。在 Linux 中,元数据中的 inode 号(inode 是文件元数据的一部分但其并不包含文件名,inode 号即索引节点号)才是文件的唯一标识而非文件名。文件名仅是为了方便人们的记忆和使用,系统或程序通过inode 号寻找正确的文件数据块。下图展示了系统通过文件名获取文件内容的过程。
     
     
    # stat /home/harris/source/glibc-2.16.0.tar.xz 
     File: `/home/harris/source/glibc-2.16.0.tar.xz'
     Size: 9990512      Blocks: 19520      IO Block: 4096   regular file 
    Device: 807h/2055d      Inode: 2485677     Links: 1 
    Access: (0600/-rw-------)  Uid: ( 1000/  harris)   Gid: ( 1000/  harris) 
    ... 
    ... 
    # mv /home/harris/source/glibc-2.16.0.tar.xz /home/harris/Desktop/glibc.tar.xz 
    # ls -i -F /home/harris/Desktop/glibc.tar.xz 
    2485677 /home/harris/Desktop/glibc.tar.xz

    在 Linux 系统中查看 inode 号 可使用命令 stat 或 ls -i(若是 AIX 系统,则使用命令 istat )。在上图中使用命令mv移动并重命名文件glibc-2.16.0.tar.xz 其结果不影响文件的 用户数据及inode 号,文件移动前后 inode 号均为:2485677.

    为了解决文件的共享使用,Linux 系统引入两种链接:硬链接(hard link)和软链接(又称符号链接,即soft link 或 symbolic link)。链接为Linux系统解决了文件的共享使用,还带来了隐藏文件路径,增加权限安全及节省储存等好处。若一个inode号对应多个文件名,则称这些文件为硬链接。换言之,硬链接就是同一个文件使用多个别名。硬链接可由命令 link 或 ln 创建。如下是对文件oldfile 创建硬链接。

    link oldfile newfile 
    ln oldfile newfile

    由于硬链接是有着相同 inode 号仅文件名不同的文件,因此硬链接存在以下几个特性:

    • 文件有相同的 inode 及 data block;
    • 只能对已存在的文件进行创建;
    • 不能交叉文件系统进行硬链接创建;
    • 不能对目录进行创建,只可对文件创建;
    • 删除一个硬链接文件并不影响其他相同 inode 号的文件
    # ls -li 
    total 0 
     
    // 只能对已存在的文件创建硬连接
    # link old.file hard.link 
    link: cannot create link `hard.link' to `old.file': No such file or directory 
     
    # echo "This is an original file" > old.file 
    # cat old.file 
    This is an original file 
    # stat old.file 
     File: `old.file'
     Size: 25           Blocks: 8          IO Block: 4096   regular file 
    Device: 807h/2055d      Inode: 660650      Links: 2 
    Access: (0644/-rw-r--r--)  Uid: (    0/    root)   Gid: (    0/    root) 
    ... 
    // 文件有相同的 inode 号以及 data block 
    # link old.file hard.link | ls -li 
    total 8 
    660650 -rw-r--r-- 2 root root 25 Sep  1 17:44 hard.link 
    660650 -rw-r--r-- 2 root root 25 Sep  1 17:44 old.file 
     
    // 不能交叉文件系统
    # ln /dev/input/event5 /root/bfile.txt 
    ln: failed to create hard link `/root/bfile.txt' => `/dev/input/event5': 
    Invalid cross-device link 
     
    // 不能对目录进行创建硬连接
    # mkdir -p old.dir/test 
    # ln old.dir/ hardlink.dir 
    ln: `old.dir/': hard link not allowed for directory 
    # ls -iF 
    660650 hard.link  657948 old.dir/  660650 old.file

    文件 old.file 与 hard.link 有着相同的 inode 号:660650 及文件权限,inode 是随着文件的存在而存在,因此只有当文件存在时才可以创建硬链接,即当inode 存在且链接计数器(link count)不为 0 时。inode 号仅在各文件系统下是唯一的,当 Linux 挂在多个文件系统后将出现 inode 号重复的现象,如下图所示,文件 t3.jpg,sync,及123.txt 并无关联,却有着相同的 inode 号,因此硬链接创建是不可跨文件系统的。设备文件目录/dev 使用的文件系统是 devtmpfs ,而 /root 使用的是磁盘文件系统 ext4。下图展示了使用命令 df 查看当前系统中挂载的文件系统类型,各文件系统 inode 使用情况及文件系统挂载点。

    查找有相同 inode 号的文件

    # df -i --print-type 
    Filesystem     Type       Inodes  IUsed    IFree IUse% Mounted on 
    /dev/sda7      ext4      3147760 283483  2864277   10% / 
    udev           devtmpfs   496088    553   495535    1% /dev 
    tmpfs          tmpfs      499006    491   498515    1% /run 
    none           tmpfs      499006      3   499003    1% /run/lock 
    none           tmpfs      499006     15   498991    1% /run/shm 
    /dev/sda6      fuseblk  74383900   4786 74379114    1% /media/DiskE 
    /dev/sda8      fuseblk  29524592  19939 29504653    1% /media/DiskF 
     
    # find / -inum 1114 
    /media/DiskE/Pictures/t3.jpg 
    /media/DiskF/123.txt 
    /bin/sync

    值得一提的是,Linux 系统存在 inode 号被用完但磁盘空间还有剩余的情况。我们创建一个5M大小的ext4类型的mo.img文件,并将其挂载至/mnt。然后我们使用一个shell脚本将其挂载在 /mnt 下ext4文件系统的inode 耗尽,下图

    # dd if=/dev/zero of=mo.img bs=5120k count=1 
    # ls -lh mo.img 
    -rw-r--r-- 1 root root 5.0M Sep  1 17:54 mo.img 
    # mkfs -t ext4  -F ./mo.img 
    ... 
    OS type: Linux 
    Block size=1024 (log=0) 
    Fragment size=1024 (log=0) 
    Stride=0 blocks, Stripe width=0 blocks 
    1280 inodes, 5120 blocks 
    256 blocks (5.00%) reserved for the super user 
    ... 
    ... 
    Writing superblocks and filesystem accounting information: done 
     
    # mount -o loop ./mo.img /mnt 
    # cat /mnt/inode_test.sh 
    #!/bin/bash 
     
    for ((i = 1; ; i++)) 
    do 
       if [ $? -eq 0 ]; then 
           echo  "This is file_$i" > file_$i 
       else 
           exit 0 
       fi 
    done 
     
    # ./inode_test.sh 
    ./inode_test.sh: line 6: file_1269: No space left on device 
     
    # df -iT /mnt/; du -sh /mnt/ 
    Filesystem     Type Inodes IUsed IFree IUse% Mounted on 
    /dev/loop0     ext4   1280  1280     0  100% /mnt 
    1.3M    /mnt/

    硬链接不能对目录创建是受限于文件系统的设计。现 Linux 文件系统中的目录均隐藏了两个特殊的目录:当前目录(.)与父目录(..)。查看这两个特殊目录的 inode 号可知其实这两目录就是两个硬链接(注意目录 /mnt/lost+found/ 的 inode 号)。若系统允许对目录创建硬链接,则会产生目录环。

    # ls -aliF /mnt/lost+found 
    total 44 
    11 drwx------ 2 root root 12288 Sep  1 17:54 ./ 
    2 drwxr-xr-x 3 root root 31744 Sep  1 17:57 ../ 
     
    # stat  /mnt/lost+found/ 
     File: `/mnt/lost+found/'
     Size: 12288        Blocks: 24         IO Block: 1024   directory 
    Device: 700h/1792d      Inode: 11          Links: 2 
    Access: (0700/drwx------)  Uid: (    0/    root)   Gid: (    0/    root) 
    Access: 2012-09-01 17:57:17.000000000 +0800 
    Modify: 2012-09-01 17:54:49.000000000 +0800 
    Change: 2012-09-01 17:54:49.000000000 +0800 
    Birth: -

    软链接与硬链接不同,若文件用户数据块中存放的内容是另一个文件的路径名的指向,则该文件就是软链接。软链接就是一个普通文件,只是数据库内容有点特殊。软链接有着自己的 inode 号以及用户数据块。因此软链接的创建与使用没有类似硬链接的诸多限制:

    • 软链接有自己的文件属性及权限等;
    • 可对不存在的文件或目录创建软链接;
    • 软链接可交叉文件系统;
    • 软链接可对文件或目录创建;
    • 创建软链接时,链接计数 i_nlink 不会增加;
    • 删除软链接并不影响被指向的文件,但若被指向的原文件被删除,则相关软链接被称为死链接(即dangling link,若被指向路径文件被重新创建,死链接可以恢复正常的软链接)。

    软链接的访问

     

     软链接特性展示
    # ls -li 
     total 0 
     
     // 可对不存在的文件创建软链接
     # ln -s old.file soft.link 
     # ls -liF 
     total 0 
     789467 lrwxrwxrwx 1 root root 8 Sep  1 18:00 soft.link -> old.file 
     
     // 由于被指向的文件不存在,此时的软链接 soft.link 就是死链接
     # cat soft.link 
     cat: soft.link: No such file or directory 
     
     // 创建被指向的文件 old.file,soft.link 恢复成正常的软链接
     # echo "This is an original file_A" >> old.file 
     # cat soft.link 
     This is an original file_A 
     
     // 对不存在的目录创建软链接
     # ln -s old.dir soft.link.dir 
     # mkdir -p old.dir/test 
     # tree . -F --inodes 
     . 
    ├── [ 789497]  old.dir/ 
    │   └── [ 789498]  test/ 
    ├── [ 789495]  old.file 
    ├── [ 789495]  soft.link -> old.file 
    └── [ 789497]  soft.link.dir -> old.dir/

    当然软链接的用户数据也可以是另一个软链接的路径,其解析过程是递归的。但需注意:软链接创建时原文件的路径指向使用绝对路径较好。使用相对路径创建的软链接被移动后该软链接文件成为死链接

     
    $ ls -li 
    total 2136 
    656627 lrwxrwxrwx 1 harris harris       8 Sep  1 14:37 a -> data.txt
    656662 lrwxrwxrwx 1 harris harris       1 Sep  1 14:37 b -> a 
    656228 -rw------- 1 harris harris 2186738 Sep  1 14:37 data.txt 6

    链接相关命令

    在 Linux 中查看当前系统已挂着的文件系统类型除上述使用命令df ,还可以使用命令 mount 或查看文件 /proc/mounts

    # mount 
    /dev/sda7 on / type ext4 (rw,errors=remount-ro) 
    proc on /proc type proc (rw,noexec,nosuid,nodev) 
    sysfs on /sys type sysfs (rw,noexec,nosuid,nodev) 
    ... 
    ... 
    none on /run/shm type tmpfs (rw,nosuid,nodev)

    命令 ls 或 stat 可帮助我们区分软链接与其他文件并查看文件 inode 号,但较好的方式还是使用 find 命令,其不仅可查找某文件的软链接,还可以用于查找相同 inode 的所有硬链接

    // 查找在路径 /home 下的文件 data.txt 的软链接
    # find /home -lname data.txt 
    /home/harris/debug/test2/a 
     
    // 查看路径 /home 有相同 inode 的所有硬链接
    # find /home -samefile /home/harris/debug/test3/old.file 
    /home/harris/debug/test3/hard.link 
    /home/harris/debug/test3/old.file 
     
    # find /home -inum 660650 
    /home/harris/debug/test3/hard.link 
    /home/harris/debug/test3/old.file 
     
    // 列出路径 /home/harris/debug/ 下的所有软链接文件
    # find /home/harris/debug/ -type l -ls 
    656662 0 lrwxrwxrwx 1 harris harris 1 Sep 1 14:37 /home/harris/debug/test2/b -> a
    656627 0 lrwxrwxrwx 1 harris harris 8 Sep 1 14:37 /home/harris/debug/test2/a -> 
    data.txt
    789467 0 lrwxrwxrwx 1 root root 8 Sep 1 18:00 /home/harris/debug/test/soft.link -> 
    old.file 
    789496    0 lrwxrwxrwx   1 root     root            7 Sep  1 18:01 
    /home/harris/debug/test/soft.link.dir -> old.dir

    系统根据磁盘的大小默认设定了 inode 的值,如若必要,可在格式文件系统前对该值进行修改。如键入命令 mkfs -t ext4 -I 512/dev/sda4 ,将使磁盘设备 /dev/sda4 格式成 inode 大小是 512 字节的 ext4文件系统。

    // 查看磁盘分区 /dev/sda7 上的 inode 值
    # dumpe2fs -h /dev/sda7 | grep "Inode size"
    dumpe2fs 1.42 (29-Nov-2011) 
    Inode size:              256 
     
    # tune2fs -l /dev/sda7 | grep "Inode size"
    Inode size:              256

    Linux VFS

    Linux 有着极其丰富的文件系统,大体上可分如下几类:

    1. 网络文件系统,如 nfs,cifs 等。
    2. 磁盘文件系统,如 ext4,ext3 等。
    3. 特殊文件系统,如 proc,sysfs,ramfs,tmpfs 等。

    实现以上这些文件系统并在Linux 下共存的基础就是 Linux VFS (Virtual File System 又称 Virtual Filesystem Switch),即虚拟文件系统。VFS 作为一个通用的文件系统,抽象了文件系统的四个基本概念:文件,目录项(dentry),索引节点(inode)即挂载点,其在内核中为用户空间层的文件系统提供了相关接口。VFS实现了 open(),read() 等系统调用使得cp等用户空间程序可跨文件系统。VFS真正实现了上述内容中:在Linux 中除进程之外一切皆是文件。

    VFS 在系统中的架构

    Linux VFS 存在四个基本对象:超级块对象(superblock object),索引节点对象(inode object),目录项对象(dentry object)及文件对象(file object)。超级块对象代表一个已安装的文件系统;索引节点对象代表一个文件;目录项对象代表一个目录项,如设备文件 event5 在路径 /dev/input/event5 中,其存在四个目录项对象:/、dev/、input/、event5。文件对象代表由进程打开的文件。这四个对象与进程及磁盘文件建的关系如下图,其中 d_inode 即为硬链接。为文件路径的快速解析,Linux VFS 设计了目录项缓存(Directory EntryCach,即 dcache)。

    VFS的对象之间的处理

    Linux 文件系统中的 inode

    在 Linux 中,索引节点结构存在于系统内存及磁盘,其可区分成 VFS inode 与实际文件系统的 inode。VFS inode 作为实际文件系统中 inode 的抽象,定义了结构体 inode 与其相关的操作 inode_operations 

    VFS 中的 inode 与 inode_operations 结构体

    struct inode {
        ...
        const struct inode_operations  *i_op;  // 索引节点操作
        unsigned long    i_ino;  //索引节点号
        atomic_t            i_count;    //引用计数器
        unsigned int       i_nlink;    // 硬链接数码  
        ...
    }
    
    struct inode_operationis {
        ...
        int (*create) (struct inode *, struct dentry *, int struct nameidata *);
        int (*link) (struct dentry *, struct inode *, struct dentry *);
        int (*unlink) (struct inode *, struct dentry *);
        int (*synlink) (struct inode *, struct dentry *, const char *);
        int (*mkdir) (struct inode *,struct dentry *,int); 
        int (*rmdir) (struct inode *,struct dentry *); 
        ...
    }    

    如上图所见,每个文件存在两个计数器:i_count 与 i_nlink,即引用计数与硬链接计数。结构体 inode 中的 i_count 用于跟踪文件被访问的数量,而 i_nlink 则是上述使用 ls -l 等命令查看到的文件硬链接数。或者说 i_count 跟踪文件在内存中的情况,而 i_nlink 则是磁盘计数器。当文件被删除时,则 i_nlink 先被设置成0,文件的这个两个计数器使得Linux 系统升级或程序更新变得容易。系统或程序可在不关闭的情况下(即文件 i_count 不为 0 ),将新文件已同样的文件名进行替换,新的文件有自己的 inode 及 data block,旧文件会在相关进程关闭后被完整的删除。

    文件系统 ext4 中的 inode

    struct ext_inode {
        ...
        __le32 i_atime;    // 文件内容最后一次访问的时间
        __le32 i_ctime;    // inode修改时间
        __le32 i_mtime;   // 文件内容最后一次修改时间
        __le16 i_links_count; // 硬链接计数
        __le32 i_block2_lo;    // Block 计数
        __le32 i_block[EXT$_N_BLOCKS];  //  指向具体的block
       ...  
    };

    上图展示的是文件系统 ext4 中对 inode 的定义(见内核源码 fs/ext4/ext4.h)。其中三个时间的定义可对应于命令 stat 中看到三个时间。i_links_count 不仅用于文件的硬链接计数,也用于目录数跟踪(目录并不显示硬链接数, 命令 ls -ld  查看到的是子目录数)。由于文件系统 ext3 对i_links_count 有限制,其最大数为:32000(该限制在 ext4 中被取消)。

    结束语

    本文最初描述了 Linux 系统中文件与目录被引入的原因及 Linux 处理文件的方式,然后我们通过区分硬链接与软链接的不同,了解 Linux 中的索引节点的相关知识,并以此引出了 inode 的结构体。索引节点结构体存在于 Linux VFS 以及实际文件系统中,VFS 作为通用文件模型是 Linux 中 “一切皆是文件” 的实现的基础。文章并未深入 Linux VFS ,也没有涉及实际文件系统的实现,文章只是从 inode 了解 Linux 的文件系统的相关内容。若想深入文件系统的内容,查看内核文档 Documentation/filesystems/。

  • 相关阅读:
    Asp.NET 4.0 ajax实例DataView 模板编程1
    ASP.NET 4.0 Ajax 实例DataView模板编程 DEMO 下载
    部分东北话、北京话
    .NET 培训课程解析(一)
    ASP.NET 4.0 Ajax 实例DataView模板编程2
    ASP.NET Web Game 架构设计1服务器基本结构
    ASP.NET Web Game 构架设计2数据库设计
    TFS2008 基本安装
    Linux上Oracle 11g安装步骤图解
    plsql developer远程连接oracle数据库
  • 原文地址:https://www.cnblogs.com/xushuhai/p/10072291.html
Copyright © 2011-2022 走看看