我发起了一个 .Net 开源数据库项目 SqlNet

zoukankan html css js c++ java

我发起了一个 .Net 开源数据库项目 SqlNet

大家好，我发起了一个 .Net 开源数据库项目 SqlNet 。

项目计划是用 C# 写一个关系数据库。

可以先参考我之前写的 2 篇文章：

谈谈数据库原理 https://www.cnblogs.com/KSongKing/p/9492315.html

论数据库 B Tree 索引在固态硬盘上的离散存储 https://www.cnblogs.com/KSongKing/p/9501686.html

根据上面说的， SqlNet 中的表数据和索引数据的存储打算使用链式存储（离散存储）。

但这样的做法是存在一些风险或者说可能的问题的。

因为现有的文件流驱动程序硬件控制指令硬件控制电路都是基于顺序读写的模式来设计的，所以用顺序读写架构下的指令来实现随机读写，效率应该会有所降低。简单的，我们可以这样看，在现有的架构下，需要 2 个步骤来完成 1 次随机读写： 1 设定流位置（Position）， 2 读写。而真正的随机读写应该是像读写内存一样在一个指令里指定地址 + 数据， 1 个指令就完成对指定地址的读写。

这中间可能还有很多细节，不过这个要测试起来应该很麻烦，而且自己测试不一定准确，所以懒得测了，就按照这个设计开始吧。 ^ ^

我们可以参考这篇文章：http://ssd.zol.com.cn/608/6082318.html

这篇文章是固态硬盘性能测试报告，包括了连续读连续写随机读随机写，其中所说的 “Intel 600P” 的连续读可以达到 1800M/s ，连续写可以达到 500M/s ，随机读接近 480M/s ，随机写接近 400M/s 。所以。

文中的随机读和随机写是指 “4K随机读” 和 “4K随机写” ，就是说是以 4K 为基本单位进行随机读写，而我们的数据库的随机读写的单位在 insert 的时候是行。一个栏位比较多的行，数据量可能是 1K ，如果栏位比较多，栏位里的内容也比较长（比如字符串比较长），那么也很容易达到 4K 。所以 4K 作为读写的最小单位进行的测试基本上跟我们的数据库的使用场景也差不多。当然 update 和 delete 的写入数据量会比较小， update 只写入更i新的栏位数据， delete 只修改行的上一行的 Next 指针，以及将本行标识为已删除。

不过这些我想不是问题，理论上，这些问题在未来都可以解决。未来出现专门用于固态硬盘随机读写的文件流驱动程序硬件控制指令硬件控制电路就可以了。

仔细再一想，固态硬盘做为外部设备，先设置读写位置(Position) ，再批量读写，这个也是合理的。

这好像有点绕，哈哈哈哈。

总之，这么说，现有的文件流驱动程序硬件控制指令硬件控制电路如果对 SqlNet 的支持还不是最优，那么，随着技术的发展，是可以得到优化的。

要采用链式存储，就需要实现一个内存堆分配的机制。将数据文件（Data File）看作一个地址空间，在这个地址空间上实现一个堆机制。

堆机制可以自己设计，不过先研究一下已有的实现原理，比如 C# , Java , C++ 的。

采用了链式存储，就不需要使用传统的数据块（Data Block）的存储方式了，当然相对的，需要实现一个堆机制。

但是仔细再一想，固态硬盘是一个外部设备，每一笔资料都要单独读取，这个性能消耗应该会比连续批量读取大很多。

所以，我觉得还是要采用传统的 Data Block 的方式。

实际上， Data Block 本身就是线性表和链表两者的结合。 Data Block 是一个线性表，多个 Data Block 之间通过链表的方式连接起来。

所以，从这里可以看到， Data Block 的大小（Size）是一个关键。 Size 太大，则可能浪费过多的磁盘空间，同时 insert 时需要向后移动的行数也会很多。

Size 太小，则读取的效率会降低，最坏的情况就是退化成一个纯粹的链表，比如每个 Data Block 只包含一行。这样就又恢复到 “链式存储” 了。 ^^

什么情况下，每个 Data Block 只包含一行呢？比如我们设定每个 Data Block 的大小是 4M ，如果 1行资料的大小接近 4M ，那么，这个 Data Block 就只能包含 1 行的资料。

所以，从这里可以看出， Data Block 的 Size 需要根据 Table (Schema) 来决定。不同的 Table ， Data Block Size 是不一样的。或者说， Data Block 应该叫做 “Table Block” 。

我们在创建 Table 时会指定 Table Schema ，包括有哪些列，列的数据类型，根据这些我们可以计算出一行所需的最大空间，我们设定， 1 个 Table Block 包含 1024 行，那么，加入 1 行所需的最大空间是 4K ，那么，这张 Table 的 Table Block Size 就应该是 4K * 1024 = 4M 。

这种做法会造成存储空间的浪费，因为比如字符串类型的数据的长度是不定的，在传统的数据库中有 char , varchar , nchar , nvarchar 等 4 种类型表示字符串。

对于变长字符串，如果要兼顾到读取查找插入更新的效率的话，情况可能比较复杂。

不过我们可以先实现简单的实现，比如，我们可以先只支持定长的 char 类型。

但，这样根据 Table Schema 来决定 Table Block Size 的做法也有问题。在行 size 很大时，会产生一些问题。什么时候行 size 很大呢？比如列很多，或者列 size 很大，都可能导致行 size 很大。假设行 size 是 1 M ，根据上面的设定， 1 个 Table Block 应该有 1024 行， 1 个 Table Block 的大小就是 1M * 1024 = 1G 。

1 G 的 Table Block 看起来是挺大的，这会导致什么问题呢？

在 insert 的时候，如果没有聚集索引，新增一行就是将新行添加为表的最后一行。如果有聚集索引（比如主键），会将新行根据索引排序插入到指定的位置。而插入会导致这个 Table Block 内在这个新行之后的所有行都向后移动（参考线性表的插入操作）。

1 G 的 Table Block 需要向后移动的数据量是很大的，如果新行插入的位置是比较靠近 Table Block 的开始位置，那么需要向后移动的数据可能接近 1 G 。

还有在 update 的时候，对于长度可变的列，比如 varchar 或者 nvarchar 的列，新值如果比旧值的长度更长，同样会向后移动数据。需要移动本行的 update 的列之后所有列的数据，以及本行之后所有行的数据。

同上，对于 1 G 的 Table Block ，如果 update 的位置靠近 Table Block 的开始位置，那么需要向后移动的数据可能接近 1 G 。

所以，我们还是回到固定大小的 Table Block ，或者说 Data Block 。 ^^

对于固定大小的 Data Block ，首先 1 行的长度不允许超过 Data Block Size 。那么，回到上面提出过的问题，当行 size 比较大时，可能 1 个 Data Block 只包含 1 行，此时，存储结构将 “退化” 为一个链表。但仔细一想，这并没有关系，不管 1 个 Data Block 里包含几行， insert 和 update 时需要移动的数据最多接近 Data Block Size 。假设 Data Block Size 是 1 M ，那么需要移动的数据最多接近 1 M 。

对于读取效率，每次读取的数据就是 1 个 Data Block ，即 1 M 。

综上，存储结构的设计就清楚了，而在这个存储结构里， Data Block Size 是一个关键参数。

我想我们可以设定 Data Block Size 为 1 M 。

下面，我们先来解决第 1 个问题，索引。

为什么索引是第一个问题呢？索引是高效查询的基础，如果表有聚集索引（比如主键），那么聚集索引的存储就是表数据的存储。而主键是广泛使用的，甚至可以说是必需的（见三大范式），根据主键查询也是广泛使用的，所以索引是第 1 个问题，可以说是数据库的基础。解决了索引的存储检索问题，也就解决了数据库的存储检索问题。

我理解的 B Tree 索引：

实际上， B Tree 索引所代表的查询原理是一种普遍的索引原理，为什么叫 “B Tree” ，就不知道了。 ^^

B Tree 索引是一个树形结构，但为了能够从外部存储器（磁盘）高效的读取，我们需要将 B Tree 索引顺序的排列起来，存放到 Data Block 里。

顺序排列起来存放到 Data Block 里的 B Tree 索引如下：

一个 Data Block 存放满了，就存到下一个 Data Block 里，上文说过， Data Block 之间通过链表的方式连接起来。或者说，一张表的数据，或者索引，就是一个 Data Block 作为元素组成的链表。

B Tree 索引的效率如何呢？可以看到，上面图中的 B Tree 索引的每个节点（索引项）有 4 个子节点，这大概叫做 “4 阶索引” 。 4 阶索引的检索流程如下：

假如要检索的内容是一个中文字符，按 Unicode 存储的话占 2 个字节(Byte) ，对于 4 阶索引来说，每次检索 2 位(bit) ， 2 位代表了 4 种情况： 00 , 01 , 10 , 11 。

2 个字节包含了 16 位，那么就要检索 16/2 = 8 次，（每一次检索就是检索一个 B Tree 节点(索引项)）。

如果要检索的内容是一串字符，字符的长度是 64 个字节(Byte) ，相当于是 32 个中文，那么检索次数是 (64 * 8) / 2 = 64 * 4 = 256 次。

所以 B Tree 索引的时间复杂度和行数无关，和检索内容的长度有关。具体的说， B Tree 索引的时间复杂度是 O(length * 8 / 2) ， length 是检索内容的长度（Byte 数）。

每次检索（检索一个索引项）需要判断 4 种情况： 00 , 01 , 10 , 11 ，如果每次检索话费的时间是 4ns (4 纳秒) ，那么查找 32 个中文的字符串的时间就是 256 * 4ns = 1024ns 约等于 1 微秒。

以此类推，查找长度为 320 个中文字符的字符串的时间是 1 微秒 * 10 = 10 微秒。

查找长度为 3200 个中文字符的字符串的时间是 1 微秒 * 100 = 100 微秒。

Sql Server 中的 nvarchar 类型长度可达 4000 ，就是说可以存储 4000 个中文字符。这个可以作为参考。

假设我们的数据库中某列的长度平均是 100 个中文字符，用于查找该列的内容也是按平均 100 个中文字符计算，按照上面的估算，可以估算按照索引查找该列的时间约是 3.4 微秒，假设按 4 微秒算，那么每秒查询次数（QPS）可以达到 25万次 / 秒，呵呵呵，实际能不能达到这个效果，就不知道了。需要测试。

从这里，我们再次体会到，测试是一个专业，是和开发不可分割的一部分，和开发一起组成软件生产力。测试是 DevOps 的主干力量。

等，我好像是第二次讲上面这句话了。 -_- 第一次是在《Socket-Vs-WebSocket-TestTool》这篇文章里： https://www.cnblogs.com/KSongKing/p/9455439.html

上面的估算是针对一个 CPU 核的，如果 CPU 有多个核，比如 4 核，那么 QPS 可以达到 25万 * 4 = 100万次 / 秒，如果是 8 核，可以达到 25万 * 8 = 200万次 / 秒。

B Tree 在某些场合会显得比较 “白痴” 。比如只有一行数据，要检索的列的长度比较长，比如 4000个中文字符，检索内容（查询条件）也是 4000个中文字符的字符串，根据上面的推算，以 4000个字符的字符串作为查询条件的检索会花费比较长的时间。而如果是循环遍历比较字符串的话，只需循环 1 次，比较 1 次字符串就可以得出结果了。对于索引而言， 4000 个中文字符需要检索 4000 * 2 * 8 / 2 = 3.2万个索引项。天！

看起来索引跑了个马拉松，而循环遍历字符串只跑了 400米。

但仔细一想，字符串比较的时间花费跟字符串长度也有关系，对于 ASCII 码的话，每个字节(Byte)作一次比较，循环比较直到最后一个字符（如果中间有字符不同则可结束循环返回 false），对于 Unicode 的话，每 2 个字节作一次比较，可以理解是 1 次 Int16 整数的比较，但也要循环比较 4000 次。

而从这又联想到，对于大字符串的比较有没有更优化的算法？我们会想到计算 Hash ，可以计算 2 个字符串的 Hash 值进行比较，若相同则表示字符串相同。但 Hash 计算相当于是对大整数的计算，具体的算法上可能也是会按 Byte 来计算，或者按 Int64(64位整数) 来计算，即对于大字符串，每次取 8 个字节(Byte) 来进行整数运算，以此来计算 Hash 。但即使每次取 8 个字节来计算，也要循环计算 1000 次。

所以。然后。

上述的效率对比问题在行数较少检索内容长度较长的时候都存在。

索引，或者说 B Tree 索引，应该是广泛的应用于数据存储管理的各种场合。比如操作系统的文件系统。

这一点，我们会在《浅谈操作系统原理》 https://www.cnblogs.com/KSongKing/p/9495999.html 一文中探讨，当然，现在这篇文章里还没有具体内容。嘿嘿嘿。

到这里，看起来，问题差不多解决了。但，还有一个问题，就是排序规则。

为了让数据按照人们习惯的排序方式排序，索引也需要按照人们习惯的排序方式排序，实际上，索引的排序规则，本身就是检索规则。

所以排序规则是索引的重要组成部分。

比如，我们的中文习惯按照音序排序，就像新华字典那样。

那么，要实现索引的排序和按排序规则检索，要怎么办呢？

要实现排序规则，需要给字符编一个排序编码，就像字符编码（比如 Unicode）那样。

和 Unicode 一样，排序编码也是 2 个字节，编码是按照音序来，比如 “啊” 字大概是 “0000 0000 0000 0001” 吧！

不过上面假设是只包含中文的情况，如果把字母和特殊字符包括进来，那字母和特殊字符应该会排在汉字前面。

那要怎么知道这个字符的排序编码是多少呢？需要一张 Unicode 和排序编码的对照表。我们把这个对照表称为排序编码表。

这样根据字符的 Unicode 可以查找到对应的排序编码。

排序编码表也是一个 B Tree 索引。这样可以快速查找。

根据 Unicode 查找排序编码， Unicode 的长度是 2 个字节，所以查找的时间花费是 8 * 2 / 2 = 8 ，即 O(8) 。

所以还是很快的。

在有排序编码的情况下，索引实际上是根据排序编码建立，检索也是根据排序编码检索，也就是说，索引项里存的 2 位(bit) 数据都是排序编码的 bit 。

字符的 Unicode 只有在索引最终指向的数据项才会保存。

有了索引之后，就可以开始写数据库引擎了，索引是数据库的基础。也是最基本单元。

首先，我们可以用索引来建立数据库的元数据引擎。

元数据，就是有多少张表，每张表有哪些列，列的数据类型，表的起始 Data Block ，表有哪些索引，索引的起始 Data Block 等等。

数据库要运作，首先要能高效的管理和查询元数据。这是基础。在这个基础上，才能进行表和数据的存储管理。

接下来，我们要对 insert update 导致数据移动的问题进行一些优化。

上文不止一次的提到，在 insert 和 update 可变长类型（如 varchar , nvarchar）时会导致数据移动，我们再来 Review 一下：

1 insert 会导致 Data Block 中插入的数据之后的数据全部要向后移动。

2 update 可变长类型如果新值比旧值长，会导致 Data Block 中旧值之后的数据全部要向后移动。

3 update 可变长类型如果新值比旧值短，会导致 Data Block 中旧值之后的数据全部要向前移动。

上面的 3 种情况相当于是线性表的插入删除操作。

这些情况对性能的影响是挺大的。所以需要作一些改良。可以引入一些 “链式存储”（链表）的特性，来弥补这部分不足。

比如 insert 一笔资料的时候，具体的举例，比如，有一个 Data Block ，我们称之为 Data Block 1 ，里面存了 2 行， A 行和 C 行。现要在 A 行和 C 行之间插入 B 行，由于 A 行 C 行的数据是顺序连续的排列的，所以如果将 B 行数据插入在 A行和 C 行之间，就会需要 C 行数据向后移动，如果采用链表的方式，新建一个 Data Block （称之为 Data Block 2），将 B 行写入 Data Block 2，让 A 行的 Next 指针指向 Data Block 2 中的 B 行，同时让 B 行的 Next 指针指向 Data Block 1 中的 C 行。这样就可以了。这里的指针包含 2 个字段，一个是 Data Block 的位置，另一个是数据在 Data Block 中的起始位置。这里的 “位置” 是指文件流里的 “位置” 这个概念（如 C# 中的 FileStream.Position 属性）。 Data Block 的位置是指 Data Block 在数据文件（Data File）中的起始位置，数据在 Data Block 中的位置指数据的起始位置相对于 Data Block 起始位置的位置。

对于可变长类型，比如 varchar , nvarchar ，应采用指针的方式存储，即可变长类型的值不保存在行中，而是独立存储，行通过指针指向值。在 update 时，如果新值的长度大于旧值，而旧值后面又连续存储了其它数据，则应新申请一块空间来存储新值，并修改行内该列的指针，使指针指向新值的位置。新申请的空间可能在同一个 Data Block 里，也可能在一个已有的 Data Block 的空闲空间（Free Space）里，也可能会在一个新的 Data Block 里。

如果包含指针的数据和指针指向的数据在同一个 Data Block ，那么指针里的 Data Block 位置字段可以为 -1 ，表示在同一个 Data Block 。所谓 “包含指针的数据” 是指比如行； “指针指向的数据” 比如行的下一行，或者行的可变长类型列的值。

显然，这样会造成一些空闲空间（Free Space），或者 “碎片” 。

看起来我们需要引入一些管理空闲空间（Free Space）的机制。可以用一个空闲空间表（Free Space List）来管理 Free Space 。Free Space List 是一个线性表，长度设为 10 ，就是说，最多只保存 10 个 Free Space 。当有超过 10 个的 Free Space 产生时，如果新的 Free Space 的大小小于 Free Space List 中当前最小的 Free Space ，则不会添加到 Free Space List，如果大于，则会移除当前最小的 Free Space ，将新的 Free Space 添加进 Free Space List 。

在 insert update 需要写入数据的时候，就到 Free Space List 里查找大小足够的 Free Space ，若找不到大小足够的 Free Space ，则申请一个新的 Data Block 。

Free Space List 的每一个表项描述一个 Free Space ，表项应包含 3 个字段， 1 Free Space 所在的 Data Block 的起始位置， 2 Free Space 的起始位置， 3 Free Space 的结束位置。 Free Space 的起始位置和结束位置是相对于 Data Block 起始位置的相对位置。

大量 delete 数据的时候会产生很多 Free Space ，如果只保存 10 个 Free Space ，会造成大量存储空间浪费。算了，还是全部 Free Space 都保存吧，有多少保存多少。而且也不要线性表了，还是用链表来作为 Free Space List 。这就跟内存堆一样了。关于内存堆，可以参考我写的另一篇文章《漫谈 C++ 的内存堆实现原理》 https://www.cnblogs.com/KSongKing/p/9527561.html 。

如果整个 Data Block 都空闲出来了，就直接归还数据库引擎，不需要再保存到 Free Space List 。

对于 “碎片” ，可以通过 Job 的方式定期或不定期整理。

现在，在技术上，我们还需要实现一个系统，或者说机制，或者说库，或者说模块，来实现将数据文件（Data File）里的 Data Block 读取到内存里并构成对象图（对象树）以及将更新过的数据写入数据文件对应的 Data Block 的对应的位置，或者将新创建的 Data Block 写入数据文件。所谓对象图（对象树），就是上述的行与行，行与可变长类型列的值之间的链表关系（指针关系）。

好了，有了上述的这些，可以开始写数据库了。

好的，我们进一步来讨论一下具体的做法。

我们需要一个 DataManager 类和一个 DataBaseManager 类。

DataManager 负责底层的数据存取。 DataBaseManager 负责关系数据的管理（表索引 ……）。

DataBaseManager 会调用 DataManager 。

DataManager 要实现的，是一个类似内存映像或者虚拟内存的一个机制。将内存和数据文件（Data File），映射成一个虚拟的存储空间。我将这个机制，称为 “虚拟存储” 。

这样， DataBaseManager 就可以不需要考虑数据在内存和数据文件中存储的细节而只需关注关系数据的管理即可。

DataManager 要实现内存映像或者虚拟内存，可以这样做，首先，定义一个数据存储的单元，类似虚拟内存里的页，我们可以叫做 Data Block 。上文中也定义了 Data Block，不过现在的 Data Block 和上文的 Data Block 意义不一样。上文的 Data Block 是关系数据层面的，比如一张表的数据会存在多个 Data Block 中，以及一行资料最大长度不能超过一个 Data Block 的大小等等。这些对于现在的 Data Block 来讲，都不存在了。

所以，这就是大的架构。

结论： SqlNet 是基于离散存储的新一代数据库。离散存储可以解决大数据量大并发频繁 insert 索引排序（移动）造成的瓶颈的问题。

SqlNet 的离散存储基于虚拟存储和堆。

有关于堆，我在《漫谈 C++ 的内存堆实现原理》 https://www.cnblogs.com/KSongKing/p/9527561.html   一文中作了探讨。

基于离散存储的数据库诞生的土壤是硬件的发展，以固态硬盘和大容量内存为代表。

还有另一个因素是关系数据库的发展到了新的突破的时候了。

或者可以这么说，离散存储使得关系数据库向分布式并行计算的方向发展更加可行和有效。

查看全文

相关阅读:
gdb调试core文件
 设计模式之工厂模式
 设计模式之简单工厂模式
 正确理解python的装饰器
 深入理解MVC架构
 django的模板系统过滤器笔记
 python net-snmp 的使用
 用django写个CMS系统
 django的CMS系统（内容管理系统）
RESTful 的通俗解释

原文地址：https://www.cnblogs.com/KSongKing/p/9501739.html

我发起了一个 .Net 开源 数据库 项目 SqlNet

我发起了一个 .Net 开源数据库项目 SqlNet