我们都知道,TCP/IP协议分为4层,从上至下是应用层->传输层->网络层->链路层,借用实验楼的图片来说明一下。
用户发送的数据从上往下,被层层封装加上每层的帧头,达到接收方以后再被从下往上层层解包,如下图所示:
我们平时说TCP/IP协议,其实应该是TCP/IP协议族,下图只罗列了部分协议及其所在层次。
用TCP/IP来给这个协议族命名,足以说明这两个协议的重要性,也许有人会说,如果没有TCP/IP我们就无法在网络中传输数据了吗?为什么TCP/IP要设计成4层,数据传输从软件->硬件两层不就够了吗?那么接下来就来看看这其中的道理。
准备工作##
-
先用ifconfig看一下本地网卡的信息,标注出来的是无线网卡的一些信息,等会儿要用。
-
Mac上用Homebrew安装Wireshark
用Wireshark监听eth0的数据。
开始分析##
问题一:如果我们撇开传输层(TCP/UDP)和网络层(IP),仅仅只保留应用层和链路层,那么数据能否正常传输呢?
理论上是可以的,因为链路层是和硬件打交道的(也就是网卡),假设我们将应用层的HTTP协议,直接加上Ethernet的帧头,用MAC地址进行广播,通过网卡接收和发送,也可以在局域网内部进行传输。但是让我们来看看Ethernet的帧头包含什么内容。
来张抓包截图
目的地址+源地址+类型一共14个字节,帧头没有多余的数据可以来保证传输的可靠性。如果都依赖应用层协议来保证自身传输的可靠性,FTP、SMTP、POP3...都要做重复的事,那么为什么不把这些内容抽离出来,单独做一个协议呢?伟大的TCP正是基于这个诉求而产生的,三次握手应该都知道吧,抓个包看看。
第一次
第二次
第三次
三次握手保证了连接的可靠性,所以为了让应用层协议更简单,单独抽离出传输层协议是少不了的。
问题二:网络层的IP可以不要吗?
现在应用层->传输层->链路层,满足了内容可靠传输的需求了,但是依靠MAC地址也仅仅只能在局域网内广播,如果没有IP就不能在Internet范围内进行传输,于是乎IP协议又进入了我们的视野。应用层->传输层->网络层->链路层圆满了。
问题三:传输层的UDP是什么鬼东西?
我们知道好多协议是不需要可靠传输的,比如DNS。那是不是我们依然可以只通过应用层->网络层->链路层,暂时撇开传输层的TCP协议。答案似乎也是可以的,可是你有没有想过,应用层协议千千万,从上面的IP帧头可以知道,IP协议只有一个字节的内容可以识别协议类型,最多256种。而应用层和下一层(传输层)的约定是通过服务端口,来决定数据传输的最终目的地,单单靠一个字节的资源是无法满足服务端的服务需求。
无图无真相
所以TCP/UDP都包含了两个字节用来保存端口号,最多到65535。你可以认为UDP协议啥事都不干,就是指定了Server和Client的端口,但是你离不开它,仅仅靠网络层是无法直接和应用层打交道的。
顺手抓个DNS的包
无论是基于可靠性传输的TCP还是不可靠传输的UDP,都是在传输层,其对应应用层协议,都离不开IP+端口号,这也是socket接口的传输基石。
socket是一套API,为什么要有socket接口?
socket起源于UNIX,在Unix一切皆文件哲学的思想下,socket是一种"打开—读/写—关闭"模式的实现,服务器和客户端各自维护一个"文件",在建立连接打开后,可以向自己文件写入内容供对方读取或者读取对方内容,通讯结束时关闭文件。
以使用TCP协议通讯的socket为例,它把可靠传输机制代码封装成了接口函数API,即socket , 同时用TCP Port来辨别其服务的应用层协议。而应用层协议只需要对自己的协议本身和协议数据做解释,完成端对端的会话。
所以,socket连接和HTTP连接根本就不是一个层面的东西,现在要弄清楚他们的差异也不难是吧。socket只是一套API接口,是用来创建TCP/UDP连接的方法,所以HTTP连接也是通过socket接口来创建。
最后举个简单的例子,假设HTTP Server的服务进程监听了3000端口,Client端通过socket接口向Server的3000端口发起连接请求,经过3次握手以后创建了连接。之后Client又发送了一个HTTP Request,数据经过网卡转发和IP路由到达Server,Server层层解包以后从TCP的帧头获取到目的端口3000,将数据丢给3000端口,HTTP Server的应用进程一直在这个端口监听数据,一旦有数据过来就会进行处理。至于这个数据处理是开异步线程还是异步回调又或者是更简单的协程,那就是Server应用实现的问题了,和协议无关。
我是咕咕鸡,一个还在不停学习的全栈工程师。
热爱生活,喜欢跑步,家庭是我不断向前进步的动力。