浅析 Git 思想和工作原理

从根本上来讲,Git是一个内容寻址文件系统,并在此之上提供了一个版本控制系统的用户界面,它是一个非常强大且易用的工具,理解Git的工作原理,能够帮助我们更容易学习和使用Git。

本文不会像书籍里那样,一条条讨论checkout、branch、remote等诸如此类动词形式的高层命令和底层命令,本文主要从宏观方向传达Git的思想和工作原理,能够使初学者更加理解,更利于学习。

git
git

直接记录快照,而非差异比较

Git 和其他版本控制系统的主要差别在于,Git 只关心文件数据的整体是否发生变化,而大多数其他系统则只关心文件内容的具体差异。这类系统(CVS,Subversion,Perforce,Bazaar 等等)每次记录有哪些文件作了更新,以及都更新了哪些行的什么内容:


其他系统在每个版本中记录着各个文化的具体差异

Git 并不保存这些前后变化的差异数据。实际上,Git 更像是把变化的文件作快照后,记录在一个微型的文件系统中。每次提交更新时,它会纵览一遍所有文件的指纹信息并对文件作一快照,然后保存一个指向这次快照的索引。为提高性能,若文件没有变化,Git 不会再次保存,而只对上次保存的快照作一链接。Git 的工作方式就如下图所示。


Git保存每次更新时的文件快照

这是 Git 同其他系统的重要区别。它完全颠覆了传统版本控制的套路,并对各个环节的实现方式作了新的设计。Git 更像是个小型的文件系统,但它同时还提供了许多以此为基础的超强工具,而不只是一个简单的 VCS。

工作区和暂存区

Git 和其他版本控制系统的一个不同之处就是有暂存区的概念。

工作区(Working Directory)

在电脑中能看到的目录,比如我建立的gittest就是一个工作区


工作区
版本库(Repository)

工作区中的隐藏目录.git,就是Git的版本库。

工作区和版本库

Git的版本库里存了很多东西,其中最重要的就是称为stage(或者叫index)的暂存区,还有Git为我们自动创建的第一个分支master,以及指向master的一个指针叫HEAD。

回忆在我上一篇博客中提到的将文件添加到版本库的流程图:

将文件添加到版本库

通过以上两幅图不难看出,需要提交的文件经过add后先都放到暂存区index(或者叫stage)中,然后经过commit指令,一次性提交暂存区的所有修改到head。一旦提交后,暂存区清空,同时若对工作区没有做任何修改,那么工作区就是干净的(working directory clean)

文件的三种状态

对任何一个文件,在Git内都有三种状态:

  • 已提交(committed):表示该文件已经被安全的保存在本地数据库中了
  • 已修改(modified):表示修改了某个文件,但还没有提交保存
  • 已暂存(staged):表示把已修改的文件放在下次提交时要保存的清单中
文件流转图

所谓的暂存区域只不过是个简单的文件,一般都放在 Git 目录中。有时候人们会把这个文件叫做索引文件,不过标准说法还是叫暂存区域。

我们可以从文件所处的位置来判断状态:

  • Git 目录中保存着的特定版本文件----->已提交状态
  • 作了修改并已放入暂存区域----->已暂存状态
  • 自上次取出后,作了修改但还没有放到暂存区域----->已修改状态

重要的 .git 目录

当一个新目录或已有目录执行git init时,Git会创建一个.git目录。这个目录包含了几乎所有Git存储和操作的对象。若想备份或复制一个版本库,只需把这个目录拷贝至另一处即可。对于一个全新的版本库,该目录结构如下所示:

目录结构图
  • description文件:仅供GitWeb程序使用
  • config文件:包含项目特有的配置选项
  • info目录:包含一个全局性排除(global exclude)文件,用以放置那些不希望被记录在 .gitignore文件中的忽略模式(ignored patterns)
  • hooks目录:包含客户端或服务端的钩子脚本(hook scripts)
  • HEAD文件:指示目前被检出的分支
  • index文件:保存暂存区信息
  • objects目录:存储所有数据内容
  • refs 目录:存储指向数据(分支)的提交对象的指针

关于Git底层命令和高层命令的原理讨论,很大一部分都在这个目录中,要想了解具体的原理,可以看这本书,这里仅仅列出了每部分的功能,有个大体了解。

基本的 Git 工作流程

  1. 在工作目录中修改某些文件。
  2. 对修改后的文件进行快照,然后保存到暂存区域。
  3. 提交更新,将保存在暂存区域的文件快照永久转储到 Git 目录中。

分析 Git 命令

有了上述介绍,我们可以对 Git 的命令有更深的理解,这里以将文件添加到代码库为例进行分析:我们都知道需要两步,第一步add,第二步commit,但为什么要分两步呢?每一步都做了什么呢?

(1)git commit -a:相当于运行 git add 把所有当前目录下的文件加入暂存区域再运行 git commit
(2)git commit <file_name>:进行一次包含最后一次提交加上工作目录中文件快照的提交,并且文件被添加到暂存区域
(3)git checkout HEAD -- <file_name>:回滚到复制最后一次提交

以上仅仅分析了添加文件到代码库的过程,更多命令详解看这里

参考资料

廖雪峰的git在线教程
免费的git书箱 progit2
Git思想和基本工作原理
图解Git

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,547评论 6 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,399评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,428评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,599评论 1 274
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,612评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,577评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,941评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,603评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,852评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,605评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,693评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,375评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,955评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,936评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,172评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 43,970评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,414评论 2 342

推荐阅读更多精彩内容

  • Git是目前最流行的版本管理系统,也是最先进的分布式版本控制系统(distributed version cont...
    pro648阅读 5,672评论 1 17
  • 法国生物学家乔治·居维叶认为,“天才,首先是注意力。 注意力不集中直接影响孩子的学习 注意力不集中的孩子在上课听讲...
    耿锐鹏阅读 428评论 0 1
  • 如果你經常在天亮前噩夢連連,讀些有安撫功效的小說最能鎮定心神,請在床邊放一摞寫河流的小說,在滔滔奔流的河水中飄回睡...
    蘿卜阅读 250评论 0 1
  • 2017-07-03 点点 点滴看世界 《不可思议的朋友》是一部关于自闭症儿童成长的用心之作,取材于真实故事。 用...
    点滴看世界阅读 472评论 0 0
  • 我被推进了一个混乱的黑洞,不知道怎么去简化所有的一切,这样的生活,焦灼而让人心死!
    一根芦苇的私语阅读 209评论 0 0