前面, 我们已经讨论了内核所作的在队列中优化请求顺序的工作; 这个工作包括排列请求和, 或许, 甚至延迟队列来允许一个预期的请求到达. 这些技术在处理一个真正的旋转的磁盘驱动器时有助于系统的性能. 但是, 许多面向块的设备, 例如闪存阵列, 用于数字相机的存储卡的读取器、u盘等, 并且 RAM 盘真正地有随机存取的性能, 包含从高级的请求队列逻辑中获益. 其他设备, 例如软件 RAID 阵列或者被逻辑卷管理者创建的虚拟磁盘, 没有这个块层的请求队列被优化的性能特征. 对于这类设备, 它最好直接从块层接收请求, 并且根本不去烦请求队列.
这时候我们就不用内核提供的IO调度器来优化排列和合并请求,不用内核的__make_request 帮我们处理bio,而是我们自己处理bio
数据流程
当我们初始化一个请求队列
- struct request_queue *blk_init_queue(request_fn_proc *rfn, spinlock_t *lock)
- {
- return blk_init_queue_node(rfn, lock, -1);
- }
把请求队列和这个内核已经实现好的函数绑定起来,__make_request就是负责制造请求request 的
- blk_init_queue_node(request_fn_proc *rfn, spinlock_t *lock, int node_id)
- {
- struct request_queue *q = blk_alloc_queue_node(GFP_KERNEL, node_id);
- ......
- blk_queue_make_request(q, __make_request);
- ......
- }
- static int __make_request(struct request_queue *q, struct bio *bio)
这个bio就是最基本的读写不同扇区的请求,经过__make_request处理后,经过优化返回request
但是,在这里已经不需要了,我们要直接处理bio,来一个处理一个。
分配“请求队列”
request_queue_t *blk_alloc_queue(int gfp_mask);
对于FLASH、RAM盘等完全随机访问的非机械设备,并不需要进行复杂的I/O调度,这个时候,应该使用上述函数分配1个“请求队列”,并使用如下函数来绑定“请求队列”和“制造请求”函数。
void blk_queue_make_request(request_queue_t * q, make_request_fn * mfn);
void blk_queue_hardsect_size(request_queue_t *queue, unsigned short max);
该函数用于告知内核块设备硬件扇区的大小,所有由内核产生的请求都是这个大小的倍数并且被正确对界。但是,内核块设备层和驱动之间的通信还是以512字节扇区为单位进行。
绑定请求队列和“制造请求”函数
void blk_queue_make_request(struct request_queue *q, make_request_fn *mfn)
一个"制造请求"函数来处理bio, make_request 函数有这个原型:
- typedef int (make_request_fn) (request_queue_t *q, struct bio *bio);
参考代码:
- #include <linux/init.h>
- #include <linux/module.h>
- #include <linux/kernel.h>
- #include <linux/fs.h>
- #include <linux/errno.h>
- #include <linux/types.h>
- #include <linux/fcntl.h>
- #include <linux/vmalloc.h>
- #include <linux/hdreg.h>
- #include <linux/blkdev.h>
- #include <linux/blkpg.h>
- #include <asm/uaccess.h>
- #define BLK_NAME "ram_blk"
- #define BLK_MAJOR 222
- #define DISK_SECTOR_SIZE 512 //每扇区大小
- #define DISK_SECTOR 1024 //总扇区数,
- #define DISK_SIZE (DISK_SECTOR_SIZE*DISK_SECTOR)//总大小,共0.5M
- typedef struct//设备结构体
- {
- unsigned char *data;
- struct request_queue *queue;
- struct gendisk *gd;
- } disk_dev;
- disk_dev device;//定义设备结构体
- //--------------------------------------------------------------------------
- //在硬盘等带柱面扇区等的设备上使用request,可以整理队列。但是ramdisk等可以
- //使用make_request
- static int disk_make_request(struct request_queue *q,struct bio *bio)
- {
- int i;
- char *mem_pbuf;
- char *disk_pbuf;
- disk_dev *pdevice;
- struct bio_vec *pbvec;
- /*在遍历段之前先判断要传输数据的总长度大小是否超过范围*/
- i=bio->bi_sector*DISK_SECTOR_SIZE+bio->bi_size;
- if(i>DISK_SIZE)//判断是否超出范围
- goto fail;
- pdevice=(disk_dev*)bio->bi_bdev->bd_disk->private_data;//得到设备结构体
- disk_pbuf=pdevice->data+bio->bi_sector*DISK_SECTOR_SIZE;//得到要读写的起始位置
- /*开始遍历这个bio中的每个bio_vec*/
- bio_for_each_segment(pbvec,bio,i)//循环分散的内存segment
- {
- mem_pbuf=kmap(pbvec->bv_page)+pbvec->bv_offset;//获得实际内存地址
- switch(bio_data_dir(bio))
- {//读写
- case READA:
- case READ:
- memcpy(mem_pbuf,disk_pbuf,pbvec->bv_len);
- break;
- case WRITE:
- memcpy(disk_pbuf,mem_pbuf,pbvec->bv_len);
- break;
- default:
- kunmap(pbvec->bv_page);
- goto fail;
- }
- kunmap(pbvec->bv_page);//清除映射
- disk_pbuf+=pbvec->bv_len;
- }
- bio_endio(bio,0);//这个函数2.6.25和2.6.4是不一样的,
- return 0;
- fail:
- bio_io_error(bio);//这个函数2.6.25和2.6.4是不一样的,
- return 0;
- }
- int blk_open(struct block_device *dev, fmode_t no)
- {
- return 0;
- }
- int blk_release(struct gendisk *gd, fmode_t no)
- {
- return 0;
- }
- int blk_ioctl(struct block_device *dev, fmode_t no, unsigned cmd, unsigned long arg)
- {
- return -ENOTTY;
- }
- static struct block_device_operations blk_fops=
- {
- .owner=THIS_MODULE,
- .open=blk_open,//
- .release=blk_release,//
- .ioctl=blk_ioctl,//
- };
- int disk_init(void)
- {
- if(!register_blkdev(BLK_MAJOR,BLK_NAME));//注册驱动
- {
- printk("register blk_dev succeed ");
- }
- device.data=vmalloc(DISK_SIZE);
- device.queue=blk_alloc_queue(GFP_KERNEL);//生成队列
- blk_queue_make_request(device.queue,disk_make_request);/*注册make_request 绑定请求制造函数*/
- printk("make_request succeed ");
- device.gd=alloc_disk(1);//生成gendisk
- device.gd->major=BLK_MAJOR;//主设备号
- device.gd->first_minor=0;//此设备号
- device.gd->fops=&blk_fops;//块文件结构体变量
- device.gd->queue=device.queue;//请求队列
- device.gd->private_data=&device;
- sprintf(device.gd->disk_name,"disk%c",'a');//名字
- set_capacity(device.gd,DISK_SECTOR);//设置大小
- add_disk(device.gd);//注册块设备信息
- printk("gendisk succeed ");
- return 0;
- }
- void disk_exit(void)
- {
- del_gendisk(device.gd);
- put_disk(device.gd);
- unregister_blkdev(BLK_MAJOR,BLK_NAME);
- vfree(device.data);
- printk("free succeed ");
- }
- module_init(disk_init);
- module_exit(disk_exit);
- MODULE_LICENSE("Dual BSD/GPL");