数据封装
当我们应用程序用TCP传输数据的时候,数据被送入协议栈中,然后逐个通过每一层,知道最后到物理层数据转换成比特流,送入网络。而再这个过程中,每一层都会对要发送的数据加一些首部信息。整个过程如下图。

如图可以看出,每一层数据是由上一层数据+本层首部信息组成的,其中每一层的数据 ,称为本层的协议数据单元   ,即PDU.

应用层数据在传输层添加TCP报头后得到的PDU被称为 Segment(数据段 ),图示为TCP段

传输层的数据(TCP段)传给网络层,网络层添加IP报头得到的PDU被称为Packet(数据包); 图示为IP数据包

网络层数据报(IP数据包)被传递到数据链路层,封装数据链路层报头得到的PDU被称为Frame(数据帧),图示为以太网帧。

最后,帧被转换为比特,通过网络介质传输。这种协议栈逐层向下传递数据,并添加报头和报尾的过程称为封装。
数据格式
需要注意的是,这里所说的以太网帧,与我们常说的以太网是不一样的。下面我们就来介绍每一层数据的 首部信息 内容。
首先我们知道世界上有个协会叫作IEEE,即电子工程师协会,里面有个分会,叫作IEEE802委员会,是专门来制定局域网各种标准的。而802下面还有个分部,叫作802.3.就是我们经常提到的 IEEE802.3,这个部门制定的规范叫以太网规范,这个以太网规范中就定义了上面提到的“以太网首部”,这个以太网规范,实际只定义了数据链路层中的MAC层和物理层规范。(注意数据链路层包括MAC子层和LLC子层两个子层,而LLC子层是在IEEE802.2中规范的)。
以太网帧格式
以太网常用帧格式有两种,一种是Ethernet II,另一种是IEEE 802.3 格式。这两种格式区别是:Ethernet II中包含一个Type字 段,。其中Type字段描述了,以太网首部 后面所跟数据包的类型,例如Type为0x8000时为IP协议包,Type为8060时,后面为ARP协议包。以太网中多数数据帧使用的是Ethernet II帧格式。
<h3>Ethernet II帧格式:</h3>

前导码:Ethernet II是由8个8‘b10101010构成,IEEE802.3由7个8‘b10101010+1个字节SFD..

目的地址:目的设备的MAC物理地址。

源 地址 :发送设备的MAC物理地址。

类型(Ethernet II):以太网首部 后面所跟数据包的类型,例如Type为0x8000时为IP协议包,Type为8060时,后面为ARP协议包。

长度(IEEE802.3):当长度小于1500时,说明该帧为IEEE802.3帧格式,大于1500时,说明该帧为Ethernet II帧格式。

数据:数据长度最小为46字节,不足46字节时,填充至46字节。因为最小帧长度是64字节,所以,46+6+6+2+4=64。(不算前导码)

FCS: 就是CRC校验值
  以太网首部:

IP数据报格式【每行32位】:
<span style=”font-size: inherit;”>
以字节为单位,16bit最大值 ,所以一个IP数据报最大为65535字节。当数据部分超过1500字节时,会被分片处理后转发。</span>IP数据报总长度:首部+数据部分

IP数据报首部以4字节为单位,最大值1111,则首部最大为15*4=60字节,默认20字节。首部由两部分组成,其中固定部分为可选字段之前的5行即20字节,可选字段长度为4字节的整数倍,最大值为60-20=40字节。

版本:IP协议版本。IPV4:0100 IPV6:0110

首部长度:最大60字节,默认20字节。

服务类型:前3位为优先字段权,现在已经被忽略。接着4位用来表示最小延迟、最大吞吐量、最高可靠性和最小费用。

总长度:整个IP报的长度,单位为字节,最大65535字节。

标识:长度16bit,对属于同一个数据报的各个分片进行标识。

标志:长度3bit,第二个bit位表示DF字段:DF=0:数据报可以进行分片,DF=1:数据报不可以进行分片。第三个bit位表示MF字段:MF=0:当前分片是最后一个分片,MF=1:当前分片不是最后一个分片。

片偏移:13bit,表示各个分片的编号。其数值等于每个分片第一个数据字节编号除8。

生存周期TTL:长度8bit,最大255。封包的生存时间。通常用通过的路由器的个数来衡量,比如初始值设置为32,则每通过一个路由器处理就会被减一,当这个值为0的时候就会丢掉这个包,并用ICMP消息通知源主机。

协议号:定义了数据的协议,分别为:TCP、UDP、ICMP和IGMP。

定义为:

#define PROTOCOL_TCP 0x06

#define PROTOCOL_UDP 0x11

#define PROTOCOL_ICMP 0x06

#define PROTOCOL_IGMP 0x06

首部校验和:采用CRC-16循环冗余校验码。校验的首先将该字段设置为0,然后将IP头的每16位进行二进制取反求和,将结果保存在校验和字段。

源IP地址:将IP地址看作是32位数值则需要将网络字节顺序转化位主机字节顺序。转化的方法是:将每4个字节首尾互换,将2、3字节互换。

目的IP地址:转换方法和来源IP地址一样。

在网络协议中,IP是面向非连接的,所谓的非连接就是传递数据的时候,不检测网络是否连通。所以是不可靠的数据报协议,IP协议主要负责在主机之间寻址和选择数据包路由。
ICMP协议的头结构:

类型(8位)代码(8位)校验和(8位)
类型或者代码

类型:一个8位类型字段,表示ICMP数据包类型。(2)代码:一个8位代码域,表示指定类型中的一个功能。如果一个类型中只有一种功能,代码域置为0。(3)检验和:数据包中ICMP部分上的一个16位检验和。
TCP协议的头结构:

来源端口(2字节)目的端口(2字节)
序号(4字节)确认序号(4字节)
头长度(4位)保留(6位)
URGACKPSHRSTSYNPIN
窗口大小(2字节)校验和(16位)
紧急指针(16位)选项(可选)
数据

TCP源端口(Source Port):16位的源端口包含初始化通信的端口号。源端口和IP地址的作用是标识报文的返回地址。(2)TCP目的端口(Destination Port):16位的目的端口域定义传输的目的。这个端口指明报文接收计算机上的应用程序地址接口。

序列号(Sequence Number):TCP连线发送方向接收方的封包顺序号。

确认序号(Acknowledge Number):接收方回发的应答顺序号。

头长度(Header Length):表示TCP头的双四字节数,如果转化为字节个数需要乘以4。

URG:是否使用紧急指针,0为不使用,1为使用。

ACK:请求/应答状态。0为请求,1为应答。

PSH:以最快的速度传输数据。

RST:连线复位,首先断开连接,然后重建。

SYN:同步连线序号,用来建立连线。

FIN:结束连线。如果FIN为0是结束连线请求,FIN为1表示结束连线。

窗口大小(Window):目的机使用16位的域告诉源主机,它想收到的每个TCP数据段大小。

校验和(Check Sum):这个校验和和IP的校验和有所不同,不仅对头数据进行校验还对封包内容校验。

紧急指针(Urgent Pointer):当URG为1的时候才有效。TCP的紧急方式是发送紧急数据的一种方式。
<h2>UDP协议的头结构:</h2>

源端口(2字节)目的端口(2字节)
封报长度(2字节)校验和(2字节)
数据

源端口(Source Port):16位的源端口域包含初始化通信的端口号。源端口和IP地址的作用是标识报文的返回地址。(2)目的端口(Destination Port):6位的目的端口域定义传输的目的。这个端口指明报文接收计算机上的应用程序地址接口。(3)封包长度(Length):UDP头和数据的总长度。(4)校验和(Check Sum):和TCP和校验和一样,不仅对头数据进行校验,还对包的内容进行校验。
<h2>ARP报头结构:</h2>

硬件类型协议类型
硬件地址长度协议长度操作类型
发送方的硬件地址(0-3字节)
源物理地址(4-5字节)源IP地址(0-1字节)
源IP地址(2-3字节)目标硬件地址(0-1字节)
目标硬件地址(2-5字节)
目标IP地址(0-3字节)

(1)硬件类型字段指明了发送方想知道的硬件接口类型,以太网的值为1;(2)协议类型字段指明了发送方提供的高层协议类型,IP为0800(16进制);(3)硬件地址长度和协议长度指明了硬件地址和高层协议地址的长度,这样ARP报文就可以在任意硬件和任意协议的网络中使用;(4)操作字段用来表示这个报文的类型,ARP请求为1,ARP响应为2,RARP请求为3,RARP响应为4;(5)发送方的硬件地址(0-3字节):源主机硬件地址的前3个字节;(6)发送方的硬件地址(4-5字节):源主机硬件地址的后3个字节;(7)发送方IP(0-1字节):源主机硬件地址的前2个字节;(8)发送方IP(2-3字节):源主机硬件地址的后2个字节;(9)目的硬件地址(0-1字节):目的主机硬件地址的前2个字节;(10)目的硬件地址(2-5字节):目的主机硬件地址的后4个字节;(11)目的IP(0-3字节):目的主机的IP地址。
ARP的工作原理如下:
1.   首先,每台主机都会在自己的ARP缓冲区(ARP Cache)中建立一个 ARP列表,以表示IP地址和MAC地址的对应关系。

2.   当源主机需要将一个数据包要发送到目的主机时,会首先检查自己 ARP列表中是否存在该 IP地址对应的MAC地址,如果有﹐就直接将数据包发送到这个MAC地址;如果没有,就向本地网段发起一个ARP请求的广播包,查询此目的主机对应的MAC地址。此ARP请求数据包里包括源主机的IP地址、硬件地址、以及目的主机的IP地址。

3.   网络中所有的主机收到这个ARP请求后,会检查数据包中的目的IP是否和自己的IP地址一致。如果不相同就忽略此数据包;如果相同,该主机首先将发送端的MAC地址和IP地址添加到自己的ARP列表中,如果ARP表中已经存在该IP的信息,则将其覆盖,然后给源主机发送一个 ARP响应数据包,告诉对方自己是它需要查找的MAC地址;

4.   源主机收到这个ARP响应数据包后,将得到的目的主机的IP地址和MAC地址添加到自己的ARP列表中,并利用此信息开始数据的传输。如源主机一直没有收到ARP响应数据包,表示ARP查询失败