在重点介绍GIT的一些操作之前,我们首先来说一说GIT的前世今生,了解整个版本控制的变迁能够让我们知道该如何去选择这些工具,另外通过这些技术的变迁也能够让我们对现在的技术有着更加深入的理解,在正式介绍之前之前我们首先搞清楚一些问题:1 什么是GIT?2 GIT和其他的版本控制工具比较有什么优势?带着这些问题我们来一步步去分析并进行总结。
1 什么是GIT ?
在了解这个问题之前我们需要了解一下整个软件版本控制的发展历程:什么是“版本控制”?我为什么要关心它呢? 版本控制是一种记录一个或若干文件内容变化,以便将来查阅特定版本修订情况的系统。我们对保存着软件源代码的文件作版本控制,但实际上,你可以对任何类型的文件进行版本控制,关于文件的版本控制方面这里借用一个别人举出的一个例子,在大学毕业的时候我们都需要进行论文的提交,常用的我们会按照日期进行管理,然后我们的整个文档目录就会成为下面的样子,时间一长可能真的就搞不清楚了,最后就会造成灾难性的后果,所以从一开始就有人要着手解决这个问题啦,所以也有很多不同的版本控制系统问世,下面就简单介绍一下他的历史。
本地版本控制系统
就像上面举出的这个例子一样许多人习惯用复制整个项目目录的方式来保存不同的版本,或许还会改名加上备份时间以示区别。 这么做唯一的好处就是简单,但是特别容易犯错。 有时候会混淆所在的工作目录,一不小心会写错文件或者覆盖意想外的文件。
为了解决这个问题,人们很久以前就开发了许多种本地版本控制系统,大多都是采用某种简单的数据库来记录文件的历次更新差异,下面通过一张图来表示这种本地版本控制系统。
这本本地化的版本系统能够在一个人进行文件协作时提供相当的帮助,但是有一个巨大的问题就是多人之间怎么协作?这个是个硬伤,所以有了下面的版本控制的历史演变。
集中化的版本控制系统
接下来人们又遇到一个问题,如何让在不同系统上的开发者协同工作? 于是,集中化的版本控制系统(Centralized Version Control Systems,简称 CVCS)应运而生。 这类系统,诸如 CVS、Subversion 以及 Perforce 等,都有一个单一的集中管理的服务器,保存所有文件的修订版本,而协同工作的人们都通过客户端连到这台服务器,取出最新的文件或者提交更新。 多年以来,这已成为版本控制系统的标准做法,这里面最常用的应该就是SVN了,这在很长的一段时间内都是很流行并且还是非常常用的,当然现在用的也是非常多的,比如在一个局域网内部署这样一个服务器,然后多人协作开发确实也是一件非常好的解决办法,下面也通过一张图片来表明这种协作的关系图。
这种做法带来了许多好处,特别是相较于老式的本地 VCS 来说。 现在,每个人都可以在一定程度上看到项目中的其他人正在做些什么。 而管理员也可以轻松掌控每个开发者的权限,并且管理一个 CVCS 要远比在各个客户端上维护本地数据库来得轻松容易。但是事分两面,有好有坏。 这么做最显而易见的缺点是中央服务器的单点故障。 如果宕机一小时,那么在这一小时内,谁都无法提交更新,也就无法协同工作。 如果中心数据库所在的磁盘发生损坏,又没有做恰当备份,毫无疑问你将丢失所有数据——包括项目的整个变更历史,只剩下人们在各自机器上保留的单独快照。 本地版本控制系统也存在类似问题,只要整个项目的历史记录被保存在单一位置,就有丢失所有历史更新记录的风险。鉴于以上各种弊端,后面的分布式版本控制系统就应运而生了,这个版本最开始出现是在Linus Torvalds
为了解决Linux系统的源代码管理而开发的,这里有一段当时的初衷的资料:2005 年,开发 BitKeeper 的商业公司同 Linux 内核开源社区的合作关系结束,他们收回了 Linux 内核社区免费使用 BitKeeper 的权力。Linus 不想倒退回到没有高效版本管理的时代;而除了 BitKeeper 之外,没有其他软件可以做到更好的远程协同;并且 Linus 还很在意代码的完整性和整个管理流程。为此,自己动手研发一个软件成为了当时唯一的解决方案,这个解决方案就是Git。
分布式版本控制系统
于是分布式版本控制系统(Distributed Version Control System,简称 DVCS)面世了。 在这类系统中,像 Git、Mercurial、Bazaar 以及 Darcs 等,客户端并不只提取最新版本的文件快照,而是把代码仓库完整地镜像下来。 这么一来,任何一处协同工作用的服务器发生故障,事后都可以用任何一个镜像出来的本地仓库恢复。 因为每一次的克隆操作,实际上都是一次对代码仓库的完整备份,下面就来一张图片来介绍一下。
这样做的好处当然是非常多的,许多这类系统都可以指定和若干不同的远端代码仓库进行交互。籍此,你就可以在同一个项目中,分别和不同工作小组的人相互协作。 你可以根据需要设定不同的协作流程,比如层次模型式的工作流,而这在以前的集中式系统中是无法实现的,当然这样做好处就是非常多的,但是就有可能造成了学习难度的增加,但好在现在的互联网这么发达,很多问题都能够找到最终的解决方案。
这种复杂度的提升体现在哪些方面呢?下面通过一组图片来介绍两者之间的一些区别,通过这张结构图你就能很好的去理解了。
SVN结构:
GIT结构:
通过这一组对比,你应该对整个复杂性方面有个大概的了解了吧,当然后面我也会通过相关章节来分别介绍这些常用的命令,从而让GIT的使用不再是那么神秘了,下面的一节我们重点将要来讲述GIT的安装部署及如何在GitHub上面建立远程仓库,请关注。