TCP/IP 系列文章
网络基础知识(一)
TCP/IP基础知识(二)
物理层(三)
数据链路层(四)
IP 协议(五)
IP 协议相关技术(六)
TCP与UDP(七)
一、数据链路层
1.1 数据链路层概览
数据链路层位于物理层和网络层之间,其设计的初衷就是顺利为网络层提供数据服务,不考虑可靠性,可靠性的部分由传输层的TCP协议实现。在数据链路层中,数据不再像物理层那样以 0、1 序列的形式存在,它们被分割为一个一个的 “帧” ,然后再进行传输。
如上图中,箭头表示数据的具体流动方向和过程。其中路由器负责路由转发(需要最高层到网络层进行 IP 协议的分析)。
数据链路的信道主要有两种模式:点对点信道和广播信道。前者使用一对一的点对点通信方式;后者使用一对多的广播通信方式,过程比较复杂。针对上图我们也可以在逻辑上将整个通信过程看成是两端数据链路层之间点对点的通信,如下图。
1.2 数据链路和链路的区别
- 链路的是指从一个结点到相邻结点的一段物理线路,其中没有任何其他的交换结点。
- 数据链路则是指在物理线路上添加上控制数据传输的协议的硬件和软件。因此数据链路是比链路更为深刻的内涵。
1.3 数据链路层具体过程
数据链路层的数据传输单元为“帧”,数据链路层的任务是将上层的数据封装成帧交给物理层传输和分析物理层提交的数据帧,提取出上层数据交给网络层。
具体过程如下:
- 1、信源的数据链路层把网络层交下来的 IP 数据报添加首部和尾部封装成帧。如何封装成帧,请看 1.4 小节。
- 2、信源把封装好的数据帧发送给信宿的数据链路层;
- 3、若新宿的数据链路层收到的帧无差错,则从收到的帧中提取出IP数据报上交给网络层,否则丢弃这个帧;
1.4 封装成帧
数据链路层的主要工作是添加一个帧头部和帧尾部,不同的数据链路层协议可能格式不同,但是基本格式都差不多。
这里的数据部分,一般有一个最大程度,我们称为MTU,在 MAC 物理地址里一般是1500个字节。这里要说的是,当数据是由可打印的 ASC2 码组成的文件时,可以使用特殊的帧定字符来标明一个帧的开始和结束。比如使用 SOH(Start Of Header) - - 0x01 和 EOT(End Of Transmission) -- 0x04 来表示,这样数据链路层就可以识别出帧的开始和结束部位。
二、数据链路相关技术
数据链路层中几个重要的概念:分组交换、MAC 地址、根据 MAC 地址转发、错误检测等。
2.1 分组交换
分组交换是指将较大的数据分割为若干个较小的数据,然后依次发送。使用分组交换的原因是不同的数据链路有各自的最大传输单元(MTU: Maximum Transmission Unit)。不同的数据链路就好比不同的运输渠道,一辆卡车(对应通信介质)的载重量为 5 吨。那么通过卡车运送 20 吨的货物就需要把这些货物分成四部分,每份重 5 吨。如果运输机的载重量是 30 吨,那么这些货物不需要分割,直接一架运输机就可以拉走。
以以太网(一种数据链路)为例,它的MTU是 1500 字节,也就是通过以太网传输的数据,必须分割为若干帧,每个帧的数据长度不超过 1500 字节。如果上层传来的数据超过这个长度,数据链路层需要分割后再发送。
2.2 MAC地址
MAC 地址是被录入到网卡 ROM 中的一串数字,长度为 48 比特,它在世界范围内唯一(不考虑虚拟机自定义 MAC 地址)。由于 MAC 地址的唯一性,它可以被用来区分不同的节点,一旦指定了 MAC 地址,就不可能出现不知道往哪个设备传输数据的情况。
2.3 帧的格式
关于帧的格式,这里以以太网帧为例说明。
如上图,以太网帧最前端有一个前导码,由数字0和1组合而成,表示以太网帧的开始,也是对端网卡能够确保预期同步的标志。前导码的末尾是一个叫做 SFD 的域,值为 11 。在这个域之后是以太网的本体。
一台网帧本体的前端是以太网的首部,公 14 个字节。分别是 6 个字节的目标 MAC 地址、6 个字节的源 MAC 地址以及 2 个字节的上层协议类型。紧随其后的是数据,一个数据帧能容纳数据的范围是 46 - 1500 字节。帧末尾是一个 4 个字节的 FCS(帧检验序列)。关于 FCS 看下面的 2.4。
2.4 错误检测
现实的通信链路都不会是理想的,这就是说,传输过程中有可能1 变成 0 或 0 变成 1 ,这种情况就叫做比特差错
。数据链路层提供了循环冗余检验 CRC 方法来检测比特差错,其主要使用了帧检验序列 FCS 来检测比特错误。发送数据前先计算帧的数据部分得出 FCS 添加在数据部分后,接收端收到数据后添加上 FCS 后计算验证。
需要注意的是数据链路层并没有向网络层提供可靠传输服务,传输差错一类是比特差错,还有一类是帧丢失、帧重复或帧失序。完整的传输错误控制是在TCP中实现的。
2.5 交换机自学过程
交换机是一种在数据链路层工作的网络设备,它有多个端口,可以连接不同的设备。交换机根据每个帧中的目标 MAC 地址决定向哪个端口发送数据,此时需要参考“转发表”
转发表并非手动设置,而是交换机自动学习得到的。当某个设备向交换机发送帧时,交换机将帧的源 MAC 地址和接口对应起来,作为一条记录添加到转发表中。这一过程就叫做自学过程。自学过程的详细流程如下图。