数据封装
当我们应用程序用TCP传输数据的时候,数据被送入协议栈中,然后逐个通过每一层,知道最后到物理层数据转换成比特流,送入网络。而再这个过程中,每一层都会对要发送的数据加一些首部信息。整个过程如下图。
如图可以看出,每一层数据是由上一层数据+本层首部信息组成的,其中每一层的数据 ,称为本层的协议数据单元 ,即PDU.
应用层数据在传输层添加TCP报头后得到的PDU被称为 Segment(数据段 ),图示为TCP段
传输层的数据(TCP段)传给网络层,网络层添加IP报头得到的PDU被称为Packet(数据包); 图示为IP数据包
网络层数据报(IP数据包)被传递到数据链路层,封装数据链路层报头得到的PDU被称为Frame(数据帧),图示为以太网帧。
最后,帧被转换为比特,通过网络介质传输。这种协议栈逐层向下传递数据,并添加报头和报尾的过程称为封装。
数据格式
需要注意的是,这里所说的以太网帧,与我们常说的以太网是不一样的。下面我们就来介绍每一层数据的 首部信息 内容。
首先我们知道世界上有个协会叫作IEEE,即电子工程师协会,里面有个分会,叫作IEEE802委员会,是专门来制定局域网各种标准的。而802下面还有个分部,叫作802.3.就是我们经常提到的 IEEE802.3,这个部门制定的规范叫以太网规范,这个以太网规范中就定义了上面提到的“以太网首部”,这个以太网规范,实际只定义了数据链路层中的MAC层和物理层规范。(注意数据链路层包括MAC子层和LLC子层两个子层,而LLC子层是在IEEE802.2中规范的)。
以太网帧格式
以太网常用帧格式有两种,一种是Ethernet II,另一种是IEEE 802.3 格式。这两种格式区别是:Ethernet II中包含一个Type字 段,。其中Type字段描述了,以太网首部 后面所跟数据包的类型,例如Type为0x8000时为IP协议包,Type为8060时,后面为ARP协议包。以太网中多数数据帧使用的是Ethernet II帧格式。
<h3>Ethernet II帧格式:</h3>
前导码:Ethernet II是由8个8‘b10101010构成,IEEE802.3由7个8‘b10101010+1个字节SFD..
目的地址:目的设备的MAC物理地址。
源 地址 :发送设备的MAC物理地址。
类型(Ethernet II):以太网首部 后面所跟数据包的类型,例如Type为0x8000时为IP协议包,Type为8060时,后面为ARP协议包。
长度(IEEE802.3):当长度小于1500时,说明该帧为IEEE802.3帧格式,大于1500时,说明该帧为Ethernet II帧格式。
数据:数据长度最小为46字节,不足46字节时,填充至46字节。因为最小帧长度是64字节,所以,46+6+6+2+4=64。(不算前导码)
FCS: 就是CRC校验值
以太网首部:
IP数据报格式【每行32位】:
<span style=”font-size: inherit;”>
以字节为单位,16bit最大值 ,所以一个IP数据报最大为65535字节。当数据部分超过1500字节时,会被分片处理后转发。</span>IP数据报总长度:首部+数据部分
IP数据报首部以4字节为单位,最大值1111,则首部最大为15*4=60字节,默认20字节。首部由两部分组成,其中固定部分为可选字段之前的5行即20字节,可选字段长度为4字节的整数倍,最大值为60-20=40字节。
版本:IP协议版本。IPV4:0100 IPV6:0110
首部长度:最大60字节,默认20字节。
服务类型:前3位为优先字段权,现在已经被忽略。接着4位用来表示最小延迟、最大吞吐量、最高可靠性和最小费用。
总长度:整个IP报的长度,单位为字节,最大65535字节。
标识:长度16bit,对属于同一个数据报的各个分片进行标识。
标志:长度3bit,第二个bit位表示DF字段:DF=0:数据报可以进行分片,DF=1:数据报不可以进行分片。第三个bit位表示MF字段:MF=0:当前分片是最后一个分片,MF=1:当前分片不是最后一个分片。
片偏移:13bit,表示各个分片的编号。其数值等于每个分片第一个数据字节编号除8。
生存周期TTL:长度8bit,最大255。封包的生存时间。通常用通过的路由器的个数来衡量,比如初始值设置为32,则每通过一个路由器处理就会被减一,当这个值为0的时候就会丢掉这个包,并用ICMP消息通知源主机。
协议号:定义了数据的协议,分别为:TCP、UDP、ICMP和IGMP。
定义为:
#define PROTOCOL_TCP 0x06
#define PROTOCOL_UDP 0x11
#define PROTOCOL_ICMP 0x06
#define PROTOCOL_IGMP 0x06
首部校验和:采用CRC-16循环冗余校验码。校验的首先将该字段设置为0,然后将IP头的每16位进行二进制取反求和,将结果保存在校验和字段。
源IP地址:将IP地址看作是32位数值则需要将网络字节顺序转化位主机字节顺序。转化的方法是:将每4个字节首尾互换,将2、3字节互换。
目的IP地址:转换方法和来源IP地址一样。
在网络协议中,IP是面向非连接的,所谓的非连接就是传递数据的时候,不检测网络是否连通。所以是不可靠的数据报协议,IP协议主要负责在主机之间寻址和选择数据包路由。
ICMP协议的头结构:
类型(8位) | 代码(8位) | 校验和(8位) |
类型或者代码 |
类型:一个8位类型字段,表示ICMP数据包类型。(2)代码:一个8位代码域,表示指定类型中的一个功能。如果一个类型中只有一种功能,代码域置为0。(3)检验和:数据包中ICMP部分上的一个16位检验和。
TCP协议的头结构:
来源端口(2字节) | 目的端口(2字节) | ||||
序号(4字节) | 确认序号(4字节) | ||||
头长度(4位) | 保留(6位) | ||||
URG | ACK | PSH | RST | SYN | PIN |
窗口大小(2字节) | 校验和(16位) | ||||
紧急指针(16位) | 选项(可选) | ||||
数据 | |||||
TCP源端口(Source Port):16位的源端口包含初始化通信的端口号。源端口和IP地址的作用是标识报文的返回地址。(2)TCP目的端口(Destination Port):16位的目的端口域定义传输的目的。这个端口指明报文接收计算机上的应用程序地址接口。
序列号(Sequence Number):TCP连线发送方向接收方的封包顺序号。
确认序号(Acknowledge Number):接收方回发的应答顺序号。
头长度(Header Length):表示TCP头的双四字节数,如果转化为字节个数需要乘以4。
URG:是否使用紧急指针,0为不使用,1为使用。
ACK:请求/应答状态。0为请求,1为应答。
PSH:以最快的速度传输数据。
RST:连线复位,首先断开连接,然后重建。
SYN:同步连线序号,用来建立连线。
FIN:结束连线。如果FIN为0是结束连线请求,FIN为1表示结束连线。
窗口大小(Window):目的机使用16位的域告诉源主机,它想收到的每个TCP数据段大小。
校验和(Check Sum):这个校验和和IP的校验和有所不同,不仅对头数据进行校验还对封包内容校验。
紧急指针(Urgent Pointer):当URG为1的时候才有效。TCP的紧急方式是发送紧急数据的一种方式。
<h2>UDP协议的头结构:</h2>
源端口(2字节) | 目的端口(2字节) |
封报长度(2字节) | 校验和(2字节) |
数据 |
源端口(Source Port):16位的源端口域包含初始化通信的端口号。源端口和IP地址的作用是标识报文的返回地址。(2)目的端口(Destination Port):6位的目的端口域定义传输的目的。这个端口指明报文接收计算机上的应用程序地址接口。(3)封包长度(Length):UDP头和数据的总长度。(4)校验和(Check Sum):和TCP和校验和一样,不仅对头数据进行校验,还对包的内容进行校验。
<h2>ARP报头结构:</h2>
硬件类型 | 协议类型 | |
硬件地址长度 | 协议长度 | 操作类型 |
发送方的硬件地址(0-3字节) | ||
源物理地址(4-5字节) | 源IP地址(0-1字节) | |
源IP地址(2-3字节) | 目标硬件地址(0-1字节) | |
目标硬件地址(2-5字节) | ||
目标IP地址(0-3字节) | ||
(1)硬件类型字段指明了发送方想知道的硬件接口类型,以太网的值为1;(2)协议类型字段指明了发送方提供的高层协议类型,IP为0800(16进制);(3)硬件地址长度和协议长度指明了硬件地址和高层协议地址的长度,这样ARP报文就可以在任意硬件和任意协议的网络中使用;(4)操作字段用来表示这个报文的类型,ARP请求为1,ARP响应为2,RARP请求为3,RARP响应为4;(5)发送方的硬件地址(0-3字节):源主机硬件地址的前3个字节;(6)发送方的硬件地址(4-5字节):源主机硬件地址的后3个字节;(7)发送方IP(0-1字节):源主机硬件地址的前2个字节;(8)发送方IP(2-3字节):源主机硬件地址的后2个字节;(9)目的硬件地址(0-1字节):目的主机硬件地址的前2个字节;(10)目的硬件地址(2-5字节):目的主机硬件地址的后4个字节;(11)目的IP(0-3字节):目的主机的IP地址。
ARP的工作原理如下:
1. 首先,每台主机都会在自己的ARP缓冲区(ARP Cache)中建立一个 ARP列表,以表示IP地址和MAC地址的对应关系。
2. 当源主机需要将一个数据包要发送到目的主机时,会首先检查自己 ARP列表中是否存在该 IP地址对应的MAC地址,如果有﹐就直接将数据包发送到这个MAC地址;如果没有,就向本地网段发起一个ARP请求的广播包,查询此目的主机对应的MAC地址。此ARP请求数据包里包括源主机的IP地址、硬件地址、以及目的主机的IP地址。
3. 网络中所有的主机收到这个ARP请求后,会检查数据包中的目的IP是否和自己的IP地址一致。如果不相同就忽略此数据包;如果相同,该主机首先将发送端的MAC地址和IP地址添加到自己的ARP列表中,如果ARP表中已经存在该IP的信息,则将其覆盖,然后给源主机发送一个 ARP响应数据包,告诉对方自己是它需要查找的MAC地址;
4. 源主机收到这个ARP响应数据包后,将得到的目的主机的IP地址和MAC地址添加到自己的ARP列表中,并利用此信息开始数据的传输。如源主机一直没有收到ARP响应数据包,表示ARP查询失败