一、读懂diff
diff是Unix/Linux系统的一个很重要的工具程序。
它用来比较两个文本文件的差异,是代码版本管理的基石之一。
diff <文件1> <文件2>
diff就会告诉你,这两个文件有何差异。
1. diff的三种格式
- 正常格式
- 上下文格式
- 合并格式
2. 创建示例文件
touch test1
vim test1 //写入12345
cat test1
cp test1 test2
vim test2//修改5位6 12346
cat test2
3. 正常格式
diff test1 test2
解析:
-
5c5
:用来说明改变的位置。前面的5表示第一个文件第5行改变,a(add),c(change),d(delete)。后面的5表示第二个文件变动行。 -
< 5
:前面的小于号,表示要从test1当中删除的内容。 -
---
:test1和test2的分割线。 -
> 6
:前面的大于号,表示要从test2当中增加该内容。
4. 上下文格式
上面的结果显示太简单不易理解,所以加入上下文的方式。它的使用方法是加入c参数(代表context)
为了更明显的显示上下文的效果 我们把文件改成如下内容:
diff -c test1 test2
解析:
-
***
:表示修改前的文件。 -
---
:表示修改后的文件。 -
6,13
:表示显示的行6-13行。这时不仅显示发生变化的行内容,变化内容前面三行和后面三行。 - 另外,文件内容的每一行最前面,还有一个标记位。
如果为空,表示该行无变化;
如果是感叹号(!),表示该行有改动;
如果是减号(-),表示该行被删除;
如果是加号(+),表示该行为新增。
5. 合并格式
如果两个文件相似度很高,那么上下文格式的diff,将显示大量重复的内容,比较浪费空间。
使用方式加一个参数u
diff -u test1 test2
6. git格式的diff
版本管理系统git,使用的是合并格式diff的变体。
git diff
解析:
- 进行比较的是,a版本的test1(即变动前)和b版本的test2(即变动后)。
- 第二行表示两个版本的git哈希值(index区域的fcb0de4对象,与工作目录区域的1e628d3对象进行比较),最后的六位数字是对象的模式(普通文件,644权限 读写-读-读 =>属主-组成员-其他用户)。
7. diff程序原理
在diff里面,我们比较的两个文件叫做old和new,而一般是按行来比较。这里我们可以抽象成一个字符串的比较,比如:
old: abc
new: abcd
那么其中的每一个字符都可以表示文件里面的一行。那么diff里面用到的比较思想是从old和new里面找出最长的subsequence。这是基于LCS(Longest Common Subsequnece)算法。
子序列的概念是......举例说明吧:
a b c d e
f g h
i
a b c h
d f g ij
那么最长公共子序列就是:abcdfgi(不需要连续)。
lcs = (A, B) ->
result = 0
if A.length is 0 or B.length is 0
result
else if A[0] is B[0]
result = 1 + lcs(A[1..], B[1..])
else
result = Math.max(lcs(A, B[1..]), lcs(A[1..], B))
使用递归来计算最长的相似元素的长度。
矩阵的列是old,横坐标是new
二、首先了解一下虚拟DOM
1. 对前端状态管理的小总结
在最开始我们对于状态改变更新对应的视图,都是操作dom。但是对于复杂的应用程序来说,无疑这是很低效率,不便于维护的。
于是,出现了MVC等架构模式,希望能从代码组织方式来降低维护这种复杂应用程序的难度。但是 MVC 架构没办法减少你所维护的状态,也没有降低状态更新你需要对页面的更新操作(前端来说就是DOM操作),你需要操作的DOM还是需要操作,只是换了个地方。
于是,后来人们想出了 MVVM 模式,只要在模版中声明视图组件是和什么状态进行绑定的,双向绑定引擎就会在状态更新的时候自动更新视图。
MVVM 可以很好的降低我们维护状态 -> 视图的复杂程度。但是这不是唯一的办法,还有一个非常直观的方法,可以大大降低视图更新的操作:一旦状态发生了变化,就用模版引擎重新渲染整个视图,然后用新的视图更换掉旧的视图。最大的问题就是这样做会很慢,因为即使一个小小的状态变更都要重新构造整棵 DOM,性价比太低。Virtual DOM 就是这么做的,只是加了一些特别的步骤来避免了整棵 DOM 树变更。
2. Virtual DOM
DOM很慢,轻微的操作都可能导致页面重新排版,非常耗性能。
相对于DOM对象,js对象处理起来更快,而且更简单。
Virtual DOM算法原理就是:用 JavaScript 对象表示 DOM 信息和结构,当状态变更的时候,重新渲染这个 JavaScript 的对象结构。 我们用新的对象树去比对旧的对象树,记录差异,然后应用到真正的DOM树上面去。这样我们就不需要重新构造整个DOM树了。本质就是:在js和DOM之间做了一个缓存。
3. 对React Virtual DOM 的误解
React 从来没有说过 “React 比原生操作 DOM 快”。React 的基本思维模式是每次有变动就整个重新渲染整个应用。如果没有 Virtual DOM,简单来想就是直接重置 innerHTML。很多人都没有意识到,在一个大型列表所有数据都变了的情况下,重置 innerHTML 其实是一个还算合理的操作... 真正的问题是在 “全部重新渲染” 的思维模式下,即使只有一行数据变了,它也需要重置整个 innerHTML,这时候显然就有大量的浪费。
框架的意义在于为你掩盖底层的 DOM 操作,让你用更声明式的方式来描述你的目的,从而让你的代码更容易维护。
没有任何框架可以比纯手动的优化 DOM 操作更快,因为框架的 DOM 操作层需要应对任何上层 API 可能产生的操作,它的实现必须是普适的。在构建一个实际应用的时候,我们不可能为每一个地方都去做手动优化,出于可维护性的考虑,这显然不可能。
框架给你的保证是,你在不需要手动优化的情况下,我依然可以给你提供过得去的性能。
4. React:虚拟DOM Diff算法基础学习
步骤1:用js对象模拟DOM树
步骤2:DOM Diff算法
即给定任意两棵树,找到最少的转换步骤。但是标准的的Diff算法复杂度需要O(n^3),这里n表示的是树的节点的总数。这显然无法满足性能要求。要达到每次界面都可以整体刷新界面的目的,势必需要对算法进行优化。这看上去非常有难度,然而Facebook工程师却做到了,他们结合Web界面的特点做出了两个简单的假设,使得Diff算法复杂度直接降低到O(n),这相当于一个一层的for循环。
- Web 中DOM节点跨层次的移动操作很少,可以忽略不计
- 拥有相同类的两个组件将会生成相似的树形结构,拥有不同类的两个组件将会生成不同的树形结构。
- 对于同一层次的一组子节点,它们可以通过唯一的id进行区分。
基于以上三个前提策略,React对diff算法进行了优化。使得算法的复制度降到了O(n)。
tree diff
DOM的diff算法实际上只会对树进行逐层的比较。
【示例1】React diff 的执行情况:create A -> create B -> create C -> delete A。
当出现节点跨层级移动时,并不会出现想象中的移动操作,而是以 A 为根节点的树被整个重新创建,这是一种影响 React 性能的操作,因此 React 官方建议不要进行 DOM 节点跨层级的操作。所以保持稳定的DOM结构会有助于性能的提升。
component diff
- 对于同一类型的组件,会按照原策略继续比较 virtual DOM tree。
- 对于不同类型的组件,直接整个替换,即使结构非常相似。
element diff
当节点处于同一层级时,React diff 提供了三种节点操作,分别为:INSERT_MARKUP(插入)、MOVE_EXISTING(移动)和 REMOVE_NODE(删除)。
ABCD--->BADC 这样我们需要做的就很多了,我们需要删除ABCD 然后插入DCBA。
React 发现这类操作繁琐冗余,因为这些都是相同的节点,但由于位置发生变化,导致需要进行繁杂低效的删除、创建操作,其实只要对这些节点进行位置移动即可。
针对这一现象,React 提出优化策略:允许开发者对同一层级的同组子节点,添加唯一 key 进行区分,虽然只是小小的改动,性能上却发生了翻天覆地的变化!
那么对于上面的例子,我们就可以只移动AC,BD不做任何操作。
那么,如此高效的 diff 到底是如何运作的呢?
首先对新集合的节点进行循环遍历,for (name in nextChildren),通过唯一 key 可以判断新老集合中是否存在相同的节点,if (prevChild === nextChild),如果存在相同节点,则进行移动操作,但在移动前需要将当前节点在老集合中的位置与 lastIndex 进行比较,
if (在老集合中的节点位置 < lastIndex),则进行节点移动操作,否则不执行该操作。这是一种顺序优化手段,lastIndex 一直在更新,表示访问过的节点在老集合中最右的位置(即最大的位置),如果新集合中当前访问的节点比 lastIndex 大,说明当前访问节点在老集合中就比上一个节点位置靠后,则该节点不会影响其他节点的位置,因此不用添加到差异队列中,即不执行移动操作,只有当访问的节点比 lastIndex 小时,才需要进行移动操作。
待补充