网络工程师以太网数据格式与各种报文格式

数据封装
当我们应用程序用TCP传输数据的时候，数据被送入协议栈中，然后逐个通过每一层，知道最后到物理层数据转换成比特流，送入网络。而再这个过程中，每一层都会对要发送的数据加一些首部信息。整个过程如下图。

如图可以看出，每一层数据是由上一层数据+本层首部信息组成的，其中每一层的数据，称为本层的协议数据单元，即PDU.

应用层数据在传输层添加TCP报头后得到的PDU被称为 Segment(数据段 )，图示为TCP段

传输层的数据（TCP段）传给网络层,网络层添加IP报头得到的PDU被称为Packet(数据包); 图示为IP数据包

网络层数据报（IP数据包）被传递到数据链路层,封装数据链路层报头得到的PDU被称为Frame(数据帧)，图示为以太网帧。

最后,帧被转换为比特,通过网络介质传输。这种协议栈逐层向下传递数据,并添加报头和报尾的过程称为封装。
数据格式
需要注意的是，这里所说的以太网帧，与我们常说的以太网是不一样的。下面我们就来介绍每一层数据的首部信息内容。
首先我们知道世界上有个协会叫作IEEE，即电子工程师协会，里面有个分会，叫作IEEE802委员会，是专门来制定局域网各种标准的。而802下面还有个分部，叫作802.3.就是我们经常提到的 IEEE802.3，这个部门制定的规范叫以太网规范，这个以太网规范中就定义了上面提到的“以太网首部”，这个以太网规范，实际只定义了数据链路层中的MAC层和物理层规范。（注意数据链路层包括MAC子层和LLC子层两个子层，而LLC子层是在IEEE802.2中规范的）。
以太网帧格式
以太网常用帧格式有两种，一种是Ethernet II，另一种是IEEE 802.3 格式。这两种格式区别是：Ethernet II中包含一个Type字段,。其中Type字段描述了，以太网首部后面所跟数据包的类型，例如Type为0x8000时为IP协议包，Type为8060时，后面为ARP协议包。以太网中多数数据帧使用的是Ethernet II帧格式。
<h3>Ethernet II帧格式：</h3>

前导码：Ethernet II是由8个8‘b10101010构成，IEEE802.3由7个8‘b10101010+1个字节SFD..

目的地址：目的设备的MAC物理地址。

源地址：发送设备的MAC物理地址。

类型(Ethernet II)：以太网首部后面所跟数据包的类型，例如Type为0x8000时为IP协议包，Type为8060时，后面为ARP协议包。

长度(IEEE802.3)：当长度小于1500时，说明该帧为IEEE802.3帧格式，大于1500时，说明该帧为Ethernet II帧格式。

数据：数据长度最小为46字节，不足46字节时，填充至46字节。因为最小帧长度是64字节，所以，46+6+6+2+4=64。（不算前导码）

FCS: 就是CRC校验值
以太网首部：

IP数据报格式【每行32位】：
<span style=”font-size: inherit;”>
以字节为单位，16bit最大值，所以一个IP数据报最大为65535字节。当数据部分超过1500字节时，会被分片处理后转发。</span>IP数据报总长度：首部+数据部分

IP数据报首部以4字节为单位，最大值1111，则首部最大为15*4=60字节，默认20字节。首部由两部分组成，其中固定部分为可选字段之前的5行即20字节，可选字段长度为4字节的整数倍，最大值为60-20=40字节。

版本：IP协议版本。IPV4：0100 IPV6：0110

首部长度：最大60字节，默认20字节。

服务类型：前3位为优先字段权，现在已经被忽略。接着4位用来表示最小延迟、最大吞吐量、最高可靠性和最小费用。

总长度：整个IP报的长度，单位为字节，最大65535字节。

标识：长度16bit，对属于同一个数据报的各个分片进行标识。

标志：长度3bit，第二个bit位表示DF字段：DF=0：数据报可以进行分片，DF=1：数据报不可以进行分片。第三个bit位表示MF字段：MF=0:当前分片是最后一个分片,MF=1:当前分片不是最后一个分片。

片偏移：13bit，表示各个分片的编号。其数值等于每个分片第一个数据字节编号除8。

生存周期TTL：长度8bit，最大255。封包的生存时间。通常用通过的路由器的个数来衡量，比如初始值设置为32，则每通过一个路由器处理就会被减一，当这个值为0的时候就会丢掉这个包，并用ICMP消息通知源主机。

协议号：定义了数据的协议，分别为：TCP、UDP、ICMP和IGMP。

定义为：

＃define PROTOCOL_TCP 0x06

＃define PROTOCOL_UDP 0x11

＃define PROTOCOL_ICMP 0x06

＃define PROTOCOL_IGMP 0x06

首部校验和：采用CRC-16循环冗余校验码。校验的首先将该字段设置为0，然后将IP头的每16位进行二进制取反求和，将结果保存在校验和字段。

源IP地址：将IP地址看作是32位数值则需要将网络字节顺序转化位主机字节顺序。转化的方法是：将每4个字节首尾互换，将2、3字节互换。

目的IP地址：转换方法和来源IP地址一样。

在网络协议中，IP是面向非连接的，所谓的非连接就是传递数据的时候，不检测网络是否连通。所以是不可靠的数据报协议，IP协议主要负责在主机之间寻址和选择数据包路由。
ICMP协议的头结构：

类型（8位）	代码（8位）	校验和（8位）
类型或者代码

类型：一个8位类型字段，表示ICMP数据包类型。（2）代码：一个8位代码域，表示指定类型中的一个功能。如果一个类型中只有一种功能，代码域置为0。（3）检验和：数据包中ICMP部分上的一个16位检验和。
TCP协议的头结构：

来源端口（2字节）	目的端口（2字节）
序号（4字节）	确认序号（4字节）
头长度（4位）	保留（6位）
URG	ACK	PSH	RST	SYN	PIN
窗口大小（2字节）	校验和（16位）
紧急指针（16位）	选项（可选）
数据

TCP源端口（Source Port）：16位的源端口包含初始化通信的端口号。源端口和IP地址的作用是标识报文的返回地址。（2）TCP目的端口（Destination Port）：16位的目的端口域定义传输的目的。这个端口指明报文接收计算机上的应用程序地址接口。

序列号（Sequence Number）：TCP连线发送方向接收方的封包顺序号。

确认序号（Acknowledge Number）：接收方回发的应答顺序号。

头长度（Header Length）：表示TCP头的双四字节数，如果转化为字节个数需要乘以4。

URG：是否使用紧急指针，0为不使用，1为使用。

ACK：请求/应答状态。0为请求，1为应答。

PSH：以最快的速度传输数据。

RST：连线复位，首先断开连接，然后重建。

SYN：同步连线序号，用来建立连线。

FIN：结束连线。如果FIN为0是结束连线请求，FIN为1表示结束连线。

窗口大小（Window）：目的机使用16位的域告诉源主机，它想收到的每个TCP数据段大小。

校验和（Check Sum）：这个校验和和IP的校验和有所不同，不仅对头数据进行校验还对封包内容校验。

紧急指针（Urgent Pointer）：当URG为1的时候才有效。TCP的紧急方式是发送紧急数据的一种方式。
<h2>UDP协议的头结构：</h2>

源端口（2字节）	目的端口（2字节）
封报长度（2字节）	校验和（2字节）
数据

源端口（Source Port）：16位的源端口域包含初始化通信的端口号。源端口和IP地址的作用是标识报文的返回地址。（2）目的端口（Destination Port）：6位的目的端口域定义传输的目的。这个端口指明报文接收计算机上的应用程序地址接口。（3）封包长度（Length）：UDP头和数据的总长度。（4）校验和（Check Sum）：和TCP和校验和一样，不仅对头数据进行校验，还对包的内容进行校验。
<h2>ARP报头结构：</h2>

硬件类型	协议类型
硬件地址长度	协议长度	操作类型
发送方的硬件地址（0-3字节）
源物理地址（4-5字节）	源IP地址（0-1字节）
源IP地址（2-3字节）	目标硬件地址（0-1字节）
目标硬件地址（2-5字节）
目标IP地址（0-3字节）

（1）硬件类型字段指明了发送方想知道的硬件接口类型，以太网的值为1；（2）协议类型字段指明了发送方提供的高层协议类型，IP为0800（16进制）；（3）硬件地址长度和协议长度指明了硬件地址和高层协议地址的长度，这样ARP报文就可以在任意硬件和任意协议的网络中使用；（4）操作字段用来表示这个报文的类型，ARP请求为1，ARP响应为2，RARP请求为3，RARP响应为4；（5）发送方的硬件地址（0-3字节）：源主机硬件地址的前3个字节；（6）发送方的硬件地址（4-5字节）：源主机硬件地址的后3个字节；（7）发送方IP（0-1字节）：源主机硬件地址的前2个字节；（8）发送方IP（2-3字节）：源主机硬件地址的后2个字节；（9）目的硬件地址（0-1字节）：目的主机硬件地址的前2个字节；（10）目的硬件地址（2-5字节）：目的主机硬件地址的后4个字节；（11）目的IP（0-3字节）：目的主机的IP地址。
ARP的工作原理如下：
1. 首先，每台主机都会在自己的ARP缓冲区(ARP Cache)中建立一个 ARP列表，以表示IP地址和MAC地址的对应关系。

2. 当源主机需要将一个数据包要发送到目的主机时，会首先检查自己 ARP列表中是否存在该 IP地址对应的MAC地址，如果有﹐就直接将数据包发送到这个MAC地址；如果没有，就向本地网段发起一个ARP请求的广播包，查询此目的主机对应的MAC地址。此ARP请求数据包里包括源主机的IP地址、硬件地址、以及目的主机的IP地址。

3. 网络中所有的主机收到这个ARP请求后，会检查数据包中的目的IP是否和自己的IP地址一致。如果不相同就忽略此数据包；如果相同，该主机首先将发送端的MAC地址和IP地址添加到自己的ARP列表中，如果ARP表中已经存在该IP的信息，则将其覆盖，然后给源主机发送一个 ARP响应数据包，告诉对方自己是它需要查找的MAC地址；

4. 源主机收到这个ARP响应数据包后，将得到的目的主机的IP地址和MAC地址添加到自己的ARP列表中，并利用此信息开始数据的传输。如源主机一直没有收到ARP响应数据包，表示ARP查询失败