第 7 章 运输层

101
第 7 第 第第第 第第第第 第第第第 第第第第第 TCP/IP 第第第第 第第第第第第第第第第第第第第第第 体传 ,, UDP 第第第第第 TCP TCP 第第第第 第第第第第第第第 第第第第第第第第第第第 第第第 、、、、 T CP 第第第第第 TCP/IP 第第第第 第第第第第 体传 TCP TCP 第第第第 第第第第第第第第第第 、、 第第第第第第第第第第 第第第 TCP 第第第第第

Upload: landen

Post on 07-Jan-2016

97 views

Category:

Documents


4 download

DESCRIPTION

第 7 章 运输层. 基本内容. 传输层的概念, TCP/IP 体系中的传输层,端口的概念,用户数据报协议 UDP ,传输控制协议 TCP , TCP 报文格式、数据的编号与确认、流量控制、拥塞控制、重传机制、 TCP 的连接管理。. 重点掌握. TCP/IP 体系中的传输控制协议 TCP : TCP 报文格式、数据的编号与确认、流量控制、拥塞控制、重传机制、 TCP 的连接管理。. 7.1 运输层协议概述. 从通信和信息处理的角度看,运输层向它上面的应用层提供通信服务,它属于面向通信部分的最高层,同时也是用户功能中的最低层。. 面向信息处理. 应用层. - PowerPoint PPT Presentation

TRANSCRIPT

第 7 章 运输层

基本内容

重点掌握

传输层的概念, TCP/IP 体系中的传输层,端口的概念,用户数据报协议 UDP ,传输控制协议 TCP , TCP 报文格式、数据的编号与确认、流量控制、拥塞控制、重传机制、 TCP

的连接管理。

TCP/IP 体系中的传输控制协议 TCP : TCP 报文格式、数据的编号与确认、流量控制、拥塞控制、重传机制、 TC

P 的连接管理。

7.1 运输层协议概述

从通信和信息处理的角度看,运输层向它上面的应用层提供通信服务,它属于面向通信部分的最高层,同时也是用户功能中的最低层。

物理层

网络层

运输层

应用层

数据链路层

面向信息处理

面向通信

用户功能

网络功能

运输层为相互通信的应用进程提供了逻辑通信

5

4

3

2

1

运输层提供应用进程间的逻辑通信

主机 A 主机 B

应用进程 应用进程

路由器 1 路由器 2AP1 LAN2WANAP2

AP3

AP4

IP 层

LAN1

AP1 AP2AP4

端口 端口 5

4

3

2

1

IP 协议的作用范围运输层协议 TCP 和 UDP 的作用范围

AP3

应用进程之间的通信

两个主机进行通信实际上就是两个主机中的应用进程互相通信。 应用进程之间的通信又称为端到端的通信。 运输层的一个很重要的功能就是复用和分用。应用层不同进程的报文通过不同的端口向下交到运输层,再往下就共用网络层提供的服务。 “ 运输层提供应用进程间的逻辑通信”。“逻辑通信”的意思是:运输层之间的通信好像是沿水平方向传送数据。但事实上这两个运输层之间并没有一条水平方向的物理连接。要传送的数据是沿着图的虚线方向传送的。

运输层协议和网络层协议的主要区别

应用进程

… 应用进程

IP 协议的作用范围(提供主机之间的逻辑通信)

TCP 和 UDP 协议的作用范围(提供进程之间的逻辑通信)

因 特 网

运输层的主要功能

运输层为应用进程之间提供端到端的逻辑通信(但网络层是为主机之间提供逻辑通信)。 运输层还要对收到的报文进行差错检测。 运输层需要有两种不同的运输协议,即面向连接的 TCP 和无连接的 UDP 。

运输层向上提供可靠的和不可靠的逻辑通信信道

?应用层

运输层

发送进程

接收进程

接收进程数据 数据

全双工可靠信道

数据 数据

使用 TCP 协议 使用 UDP 协议

不可靠信道

发送进程

7.2 TCP/IP 体系中的运输层

7.2.1 运输层中的两个协议7.2.2 端口的概念

7.2.1 运输层中的两个协议

TCP/IP 的运输层有两个不同的协议:(1) 用户数据报协议 UDP (User Datagram Protocol)

(2) 传输控制协议 TCP (Transmission Control Protocol)

TCPUDP

IP

应用层

与各种网络接口

运输层

TCP 与 UDP

UDP 在传送数据之前不需要先建立连接。对方的运输层在收到 UDP 报文后,不需要给出任何确认。虽然 UDP 不提供可靠交付,但在某些情况下 UDP 是一种最有效的工作方式。 TCP 则提供面向连接的服务。 TCP 不提供广播或多播服务。由于 TCP 要提供可靠的、面向连接的运输服务,因此不可避免地增加了许多的开销。这不仅使协议数据单元的首部增大很多,还要占用许多的处理机资源。

强调两点

运输层的 UDP 用户数据报与网际层的 IP 数据报有很大区别。 IP 数据报要经过互连网中许多路由器的存储转发,但 UDP 用户数据报是在运输层的端到端抽象的逻辑信道中传送的。 TCP 报文段是在运输层抽象的端到端逻辑信道中传送,这种信道是可靠的全双工信道。但这样的信道却不知道究竟经过了哪些路由器,而这些路由器也根本不知道上面的运输层是否建立了 TCP 连接。

7.2.2 端口的概念

端口就是运输层服务访问点 TSAP 。 端口的作用就是让应用层的各种应用进程都能将其数据通过端口向下交付给运输层,以及让运输层知道应当将其报文段中的数据向上通过端口交付给应用层相应的进程。 计算机“端口”是英文 port 的义译,可以认为是计算机与外界通讯交流的出口。其中硬件领域的端口又称接口,如:USb 端口、串行端口等。软件领域的端口一般指网络中面向连接服务和无连接服务的通信协议端口,是一种抽象的软件结构,包括一些数据结构和 I/O (基本输入输出)缓冲区。

端口在进程之间的通信中所起的作用

应用层

运输层

网络层

TCP 报文段UDP

用户数据报

应用进程

TCP 复用

IP 复用

UDP 复用

TCP 报文段UDP

用户数据报

应用进程

端口端口

TCP 分用 UDP 分用

IP 分用

IP 数据报IP 数据报

发送方 接收方

端口

端口用一个 16 bit 端口号进行标志。 端口号只具有本地意义,即端口号只是为了标志本计算机应用层中的各进程。在因特网中不同计算机的相同端口号是没有联系的。

两类端口 :

一类是熟知端口,其数值一般为 0~1023 。 另一类则是一般端口,用来随时分配给请求通信的客户进程。

插口 (socket)

IP=131.6.23.13

IP=128.36.1.12

端口1500端口1501

端口1500

IP=130.42.85.15

端口25

A

B

C

连接1连接2

连接3

插口 (socket)

TCP 使用“连接” ( 而不仅仅是“端口” ) 作为最基本的抽象,同时将 TCP 连接的端点称为插口 (socket) ,或套接字、套接口。 插口和端口、 IP 地址的关系是:

IP 地址131.6.23.13 131.6.23.13

端口号15001500

131.6.23.13, 1500 131.6.23.13, 1500插口 (socket)

7.3 用户数据报协议 UDP

UDP 只在 IP 的数据报服务之上增加了很少一点的功能,即端口的功能和差错检测的功能。 虽然 UDP 用户数据报只能提供不可靠的交付,但 UDP 在某些方面有其特殊的优点。

发送数据之前不需要建立连接; UDP 的主机不需要维持复杂的连接状态表; UDP 用户数据报只有 8 个字节的首部开销; 网络出现的拥塞不会使源主机的发送速率降低;这对某些实时应用是很重要的。

端口是用报文队列来实现

UDP 端口 51000 UDP 端口 69

出队列 入队列出队列入队列

TFTP 服务器TFTP 客户

UDP 用户数据报

应用层

运输层

UDP 用户数据报的首部格式

伪首部 源端口 目的端口 长 度 检验和

数 据首 部

UDP长度源 IP 地址 目的 IP 地址 0 17

IP 数据报

字节 4 4 1 1 2

12 2 2 2 2字节

发送在前

数 据首 部UDP 用户数据报

UDP 用户数据报的首部格式

用户数据报 UDP 有两个字段:数据字段和首部字段。首部字段有 8 个字节,由 4 个字段组成,每个字段都是两个字节。

伪首部 源端口 目的端口 长 度 检验和

数 据首 部

UDP长度源 IP 地址 目的 IP 地址 0 17

IP 数据报

字节 4 4 1 1 2

12 2 2 2 2字节

发送在前

数 据首 部UDP 用户数据报

UDP 用户数据报的首部格式

在计算检验和时,临时把“伪首部”和 UDP 用户数据报连接在一起。伪首部仅仅是为了计算检验和。

伪首部 源端口 目的端口 长 度 检验和

数 据首 部

UDP长度源 IP 地址 目的 IP 地址 0 17

IP 数据报

字节 4 4 1 1 2

12 2 2 2 2字节

发送在前

数 据首 部UDP 用户数据报

计算 UDP 检验和的例子

10011001 00010011 → 153.1900001000 01101000 → 8.10410101011 00000011 → 171.300001110 00001011 → 14.1100000000 00010001 → 0 和 1700000000 00001111 → 1500000100 00111111 → 108700000000 00001101 → 1300000000 00001111 → 1500000000 00000000 → 0 (检验和)01010100 01000101 → 数据01010011 01010100 → 数据01001001 01001110 → 数据01000111 00000000 → 数据和 0 (填充)10010110 11101011 → 求和得出的结果01101001 00010100 → 检验和

153.19.8.104171.3.14.11

12 字节

伪首部8 字节

UDP 首部7 字节

数据

填充

按二进制反码运算求和将得出的结果求反码

全 0 17 15 1087 13 15 全 0数据 数据 数据 数据数据 数据 数据 全 0

7.4 传输控制协议 TCP

7.4.1 TCP 概述7.4.2 TCP 报文段的首部7.4.3 TCP 的数据编号与确认7.4.4 TCP 的流量控制与拥塞控制7.4.5 TCP 的重传机制7.4.6 采用随机早期丢弃 RED 进行拥塞控制7.4.7 TCP 的运输连接管理7.4.8 TCP 的有限状态机

7.4.1 TCP 概述

端口

发送 TCP 报文段

TCPTCP

TCPTCP接收缓存发送缓存

报文段报文段 …报文段报文段 报文段报文段

端口

发送端 接收端

向发送缓存写入数据块

从接收缓存读取数据块

应用进程 应用进程

7.4.2 TCP 报文段的首部

TCP首部

20 字节的固定首部

目 的 端 口

数据偏移

检 验 和

选 项 (长 度 可 变)

源 端 口

序 号

紧 急 指 针

窗 口

确 认 号

保 留FIN

32 bit

SYN

RST

PSH

ACK

URG

比特 0 8 16 24 31

填 充

TCP 数据部分TCP 首部TCP 报文段

IP 数据部分IP 首部发送在前

TCP首部

20字节固定首部

目 的 端 口

数据偏移

检 验 和

选 项 (长 度 可 变)

源 端 口

序 号

紧 急 指 针

窗 口

确 认 号

保 留FIN

SYN

RST

PSH

ACK

URG

比特 0 8 16 24 31

填 充

源端口和目的端口字段——各占 2 字节。端口是运输层与应用层的服务接口。运输层的复用和分用功能都要通过端口才能实现。

TCP首部

20字节固定首部

目 的 端 口

数据偏移

检 验 和

选 项 (长 度 可 变)

源 端 口

序 号

紧 急 指 针

窗 口

确 认 号

保 留FIN

SYN

RST

PSH

ACK

URG

比特 0 8 16 24 31

填 充

序号字段——占 4 字节。 TCP 连接中传送的数据流中的每一个字节都编上一个序号。序号字段的值则指的是本报文段所发送的数据的第一个字节的序号。

TCP首部

20字节固定首部

目 的 端 口

数据偏移

检 验 和

选 项 (长 度 可 变)

源 端 口

序 号

紧 急 指 针

窗 口

确 认 号

保 留FIN

SYN

RST

PSH

ACK

URG

比特 0 8 16 24 31

填 充

确认号字段——占 4 字节,是期望收到对方的下一个报文段的数据的第一个字节的序号。

TCP首部

20字节固定首部

目 的 端 口

数据偏移

检 验 和

选 项 (长 度 可 变)

源 端 口

序 号

紧 急 指 针

窗 口

确 认 号

保 留FIN

SYN

RST

PSH

ACK

URG

比特 0 8 16 24 31

填 充

数据偏移——占 4 bit ,它指出 TCP 报文段的数据起始处距离 TCP 报文段的起始处有多远。“数据偏移”的单位不是字节而是 32 bit 字( 4 字节为计算单位)。

TCP首部

20字节固定首部

目 的 端 口

数据偏移

检 验 和

选 项 (长 度 可 变)

源 端 口

序 号

紧 急 指 针

窗 口

确 认 号

保 留FIN

SYN

RST

PSH

ACK

URG

比特 0 8 16 24 31

填 充

保留字段——占 6 bit ,保留为今后使用,但目前应置为 0 。

TCP首部

20字节固定首部

目 的 端 口

数据偏移

检 验 和

选 项 (长 度 可 变)

源 端 口

序 号

紧 急 指 针

窗 口

确 认 号

保 留FIN

SYN

RST

PSH

ACK

URG

比特 0 8 16 24 31

填 充

紧急比特 URG —— 当 URG 1 时,表明紧急指针字段有效。它告诉系统此报文段中有紧急数据,应尽快传送 ( 相当于高优先级的数据 ) 。

TCP首部

20字节固定首部

目 的 端 口

数据偏移

检 验 和

选 项 (长 度 可 变)

源 端 口

序 号

紧 急 指 针

窗 口

确 认 号

保 留FIN

SYN

RST

PSH

ACK

URG

比特 0 8 16 24 31

填 充

确认比特 ACK —— 只有当 ACK 1 时确认号字段才有效。当 ACK 0 时,确认号无效。

TCP首部

20字节固定首部

目 的 端 口

数据偏移

检 验 和

选 项 (长 度 可 变)

源 端 口

序 号

紧 急 指 针

窗 口

确 认 号

保 留FIN

SYN

RST

PSH

ACK

URG

比特 0 8 16 24 31

填 充

推送比特 PSH (PuSH) —— 接收 TCP 收到推送比特置 1

的报文段,就尽快地交付给接收应用进程,而不再等到整个缓存都填满了后再向上交付。

TCP首部

20字节固定首部

目 的 端 口

数据偏移

检 验 和

选 项 (长 度 可 变)

源 端 口

序 号

紧 急 指 针

窗 口

确 认 号

保 留FIN

SYN

RST

PSH

ACK

URG

比特 0 8 16 24 31

填 充

复位比特 RST (ReSeT) —— 当 RST 1 时,表明 TCP

连接中出现严重差错(如由于主机崩溃或其他原因),必须释放连接,然后再重新建立运输连接。

TCP首部

20字节固定首部

目 的 端 口

数据偏移

检 验 和

选 项 (长 度 可 变)

源 端 口

序 号

紧 急 指 针

窗 口

确 认 号

保 留FIN

SYN

RST

PSH

ACK

URG

比特 0 8 16 24 31

填 充

同步比特 SYN —— 同步比特 SYN 置为 1 ,就表示这是一个连接请求或连接接受报文。

TCP首部

20字节固定首部

目 的 端 口

数据偏移

检 验 和

选 项 (长 度 可 变)

源 端 口

序 号

紧 急 指 针

窗 口

确 认 号

保 留FIN

SYN

RST

PSH

ACK

URG

比特 0 8 16 24 31

填 充

终止比特 FIN (FINal) —— 用来释放一个连接。当 FIN 1

时,表明此报文段的发送端的数据已发送完毕,并要求释放运输连接。

TCP首部

20字节固定首部

目 的 端 口

数据偏移

检 验 和

选 项 (长 度 可 变)

源 端 口

序 号

紧 急 指 针

窗 口

确 认 号

保 留FIN

SYN

RST

PSH

ACK

URG

比特 0 8 16 24 31

填 充

窗口字段 —— 占 2 字节。窗口字段用来控制对方发送的数据量,单位为字节。 TCP 连接的一端根据设置的缓存空间大小确定自己的接收窗口大小,然后通知对方以确定对方的发送窗口的上限。

TCP首部

20字节固定首部

目 的 端 口

数据偏移

检 验 和

选 项 (长 度 可 变)

源 端 口

序 号

紧 急 指 针

窗 口

确 认 号

保 留FIN

SYN

RST

PSH

ACK

URG

比特 0 8 16 24 31

填 充

检验和 —— 占 2 字节。检验和字段检验的范围包括首部和数据这两部分。在计算检验和时,要在 TCP 报文段的前面加上 12 字节的伪首部。

TCP首部

20字节固定首部

目 的 端 口

数据偏移

检 验 和

选 项 (长 度 可 变)

源 端 口

序 号

紧 急 指 针

窗 口

确 认 号

保 留FIN

SYN

RST

PSH

ACK

URG

比特 0 8 16 24 31

填 充

紧急指针字段 —— 占 16 bit 。紧急指针指出在本报文段中的紧急数据的最后一个字节的序号。

TCP首部

20字节固定首部

目 的 端 口

数据偏移

检 验 和

选 项 (长 度 可 变)

源 端 口

序 号

紧 急 指 针

窗 口

确 认 号

保 留FIN

SYN

RST

PSH

ACK

URG

比特 0 8 16 24 31

填 充

选项字段 —— 长度可变。 TCP 只规定了一种选项,即最大报文段长度 MSS (Maximum Segment Size) 。 MSS 告诉对方 TCP :“我的缓存所能接收的报文段的数据字段的最大长度是 MSS 个字节。”

TCP首部

20字节固定首部

目 的 端 口

数据偏移

检 验 和

选 项 (长 度 可 变)

源 端 口

序 号

紧 急 指 针

窗 口

确 认 号

保 留FIN

SYN

RST

PSH

ACK

URG

比特 0 8 16 24 31

填 充

填充字段 —— 这是为了使整个首部长度是 4 字节的整数倍。

7.4.3 TCP 的数据编号与确认

TCP 协议是面向字节的。 TCP 将所要传送的报文看成是字节组成的数据流,并使每一个字节对应于一个序号。 在连接建立时,双方要商定初始序号。 TCP 每次发送的报文段的首部中的序号字段数值表示该报文段中的数据部分的第一个字节的序号。 TCP 的确认是对接收到的数据的最高序号表示确认。接收端返回的确认号是已收到的数据的最高序号加 1 。因此确认号表示接收端期望下次收到的数据中的第一个数据字节的序号。

7.4.3 TCP 的数据编号与确认

我刚发送了10 号数据

源端口 目的端口 …序号 确认号

1028 23 10 0 …

7.4.3 TCP 的数据编号与确认

我刚发送了10 号数据

源端口 目的端口 …序号 确认号

1028 23 10 0 …

收到 10 号数据,现需 11 号数据 .

102823 11111 …

7.4.3 TCP 的数据编号与确认

我刚发送了10 号数据

源端口 目的端口 …序号 确认号

1028 23 10 0 …

收到 10 号数据,现需 11 号数据 .

102823 11111 …

1028 23 11 2 …

TCP 传输的可靠是由于使用了序号和确认

副本与重传: TCP 将发送出去的每一个报文段副本保存在自己的发送缓存中。若超时且未收到确认,则重传之;若未超时就收到确认,可删除此副本。 捎带确认: TCP 能提供全双工通信,因此通信中的每一方都不必专门发送确认报文段,而可以在传送数据时顺便把确认信息捎带传送,这样作可以提高传输效率。

报文段发送的控制机制

TCP 有三种机制控制报文的发送: TCP维持一个变量,等于 MSS (最大报文长度),当缓存的数据达到 MSS字节时,就组装成一个报文段发送出去; 发送端应用进程使用 PSH标志,指明要立即发送的报文段; 发送端计时器到,将当前缓存的数据装入报文段发送出去。

一个例子

客户端: telnet客户程序 ; 服务器:交互式编辑器 客户每输入一个字符,交给 TCP ,形成一个 IP 分组, 41

字节 接收端 TCP ,每收到一个 IP 分组,发确认分组, 40字节 若用户要求远地主机回送 1 个字符,则又要发回 41字节长的 IP 数据报和 40字节长的确认 IP 数据报。 对每个输入的字符,共需传输 162字节,共发送 4 个数据段。

报文段发送的控制机制

Nagle 算法:若数据是逐个字节地到达发送端,发送端先将第一个字符发送出去,将后面到达的字符都缓存起来。当收到对第一个字符的确认后,再将缓冲区中的所有字符装成一个报文段发送出去,同时继续对到达的字符进行缓存。只有在收到确认后才继续发送下一个报文段。 当字符到达较快而网络速度较慢时,用这样的方法可明显地减少所用的网络带宽。算法还规定,当到达的字符已达窗口大小的一半或已达到报文段的最大长度时,就立即发送一个报文段。

糊涂窗口综合症

问题:接收端的缓冲区已满,而交互式的应用进程一次只从缓冲区中读取一个字符(这样就在缓冲区产生 1 个字节的空位子),然后向发送端发送确认,并通知窗口大小为 1 个字符(但发送的数据报是 40字节长),接着发送端又发来 1 个字符(但发来的数据报是 41字节长)。接收端发回确认,仍然通知窗口为 1 个字节。这样下去就使网络的效率很低。解决办法( Clark 算法):让接收端等待一段时间,使得或者缓冲区已能有足够的空间容纳一个最长报文段,或者缓冲区已有一半的空间处于空的状态。只要出现这两种中的一种,就发出确认报文,并向发送端通知当前的窗口大小。

差错报文和乱序报文的处理

对差错报文段的处理 发送方:在设置的时间内未收到确认,则重新发送未被确认的报文段 接收方:收到差错报文段,则丢弃之,但不发否认信息;收到重复的报文段,则丢弃之,并发回确认信息

对乱序报文段的处理 接收方可将不按序的报文段丢弃 接收方可将不按序的报文段暂存于接收缓存中,待所缺序号的报文段收齐后再一起上交应用层。

7.4.4 TCP 的流量控制与拥塞控制

滑动窗口的概念 TCP 采用大小可变的滑动窗口进行流量控制。窗口大小的单位是字节。 在 TCP 报文段首部的窗口字段写入的数值就是当前给对方设置的发送窗口数值的上限。 发送窗口在连接建立时由双方商定。但在通信的过程中,接收端可根据自己的资源情况,随时动态地调整对方的发送窗口上限值 ( 可增大或减小 ) 。

收到确认即可前移

100 200 300 400 500 600 700 800 900101 201 301 401 501 601 701 8011

发送窗口

可发送 不可发送

指针

发送端要发送 900 字节长的数据,划分为 9 个 100

字节长的报文段,而发送窗口确定为 500 字节。 发送端只要收到了对方的确认,发送窗口就可前移。 发送 TCP 要维护一个指针。每发送一个报文段,指针就向前移动一个报文段的距离。

发送端已发送了 400 字节的数据,但只收到对前 200

字节数据的确认,同时窗口大小不变。 现在发送端还可发送 300 字节。

收到确认即可前移

100 200 300 400 500 600 700 800 900101 201 301 401 501 601 701 8011

发送窗口

可发送 不可发送

指针

100 200 300 400 500 600 700 800 900101 201 301 401 501 601 701 8011

可发送 不可发送

指针

发送窗口前移

已发送并被确认

已发送但未被确认

发送端收到了对方对前 400 字节数据的确认,但对方通知发送端必须把窗口减小到 400 字节。 现在发送端最多还可发送 400 字节的数据。

100 200 300 400 500 600 700 800 900101 201 301 401 501 601 701 8011

可发送 不可发送

指针

发送窗口前移

已发送并被确认

已发送但未被确认

100 200 300 400 500 600 700 800 900101 201 301 401 501 601 701 8011

已发送并被确认 可发送 不可

发送指针

发送窗口缩小

例:利用可变窗口大小进行流量控制,双方确定的窗口值是 400 。

SEQ = 1

SEQ = 201

SEQ = 401

SEQ = 301

SEQ = 101

SEQ = 501

ACK = 201, WIN = 300

ACK = 601, WIN = 0

ACK = 501, WIN = 200

主机 A 主机 B

允许 A 再发送 300 字节(序号 201 至 500 )

A 还能发送 200 字节

A 还能发送 200 字节(序号 301 至 500 )

A 还能发送 300 字节

A 还能发送 100 字节(序号 401 至 500 )

A 超时重发,但不能发送序号 500 以后的数据

允许 A 再发送 200 字节(序号 501 至 700 )

A 还能发送 100 字节(序号 501 至 700 )

不允许 A 再发送(到序号 600 的数据都已收到)

SEQ = 201 丢失!

7.4.4 TCP 的流量控制与拥塞控制

产生拥塞的原因 接收方的处理能力不足(接收容器小) 网络不够通畅(传输管道细)

解决办法 降低发送方的数据传输速率

接收方的处理能力不足

传输网络

小容量接收器

调整传输速率

接收能力接收能力

发送方

网络不够畅通

传输网络

大容量接收器

调整传输速率发送方

内部拥塞网络能力网络能力

7.4.4 TCP 的流量控制与拥塞控制

慢开始和拥塞避免 发送端的主机在确定发送报文段的速率时,既要根据接收端的接收能力,又要从全局考虑不要使网络发生拥塞。 因此,每一个 TCP 连接需要有以下两个状态变量:

接收端窗口 rwnd (receiver window) 又称为通知窗口 (advertised window) 。 拥塞窗口 cwnd (congestion window) 。

接收端窗口 rwnd 和拥塞窗口 cwnd

(1) 接收端窗口 rwnd :这是接收端根据其目前的接收缓存大小所许诺的最新的窗口值,是来自接收端的流量控制。接收端将此窗口值放在 TCP 报文的首部中的窗口字段,传送给发送端。(2) 拥塞窗口 cwnd :是发送端根据自己估计的网络拥塞程度而设置的窗口值,是来自发送端的流量控制。

发送端确定拥塞窗口的原则

只要网络没有出现拥塞,发送端就使得拥塞窗口再增大一点。以便将更多的分组发送出去。但只要网络出现拥塞,发送端就使拥塞窗口减少一些,以减少注入到网络中的分组数。

发送端如何判断网络出现拥塞呢?

是否及时收到 ACK 报文

发送窗口的上限值

发送端的发送窗口的上限值应当取为接收端窗口 rwnd 和拥塞窗口 cwnd 这两个变量中较小的一个,即应按以下公式确定: 发送窗口的上限值 Min [rwnd, cwnd]

当 rwnd < cwnd 时,是接收端的接收能力限制发送窗口的最大值。 当 cwnd < rwnd 时,则是网络的拥塞限制发送窗口的最大值。

慢开始算法的原理

在主机刚刚开始发送报文段时可先将拥塞窗口 cwnd 设置为一个最大报文段 MSS 的数值。 在每收到一个对新的报文段的确认后,将拥塞窗口增加至多一个 MSS 的数值。 用这样的方法逐步增大发送端的拥塞窗口 cwnd ,可以使分组注入到网络的速率更加合理。

状态变量慢开始门限

为了防止拥塞窗口的增长引起网络阻塞,增设一个状态变量,慢开始门限 ssthresh ,其用法为: 当 cwnd< ssthresh 时,使用慢开始算法; 当 cwnd> ssthresh 时,停止慢开始算法而改用拥塞避免算法; 当 cwnd= ssthresh 时,既可使用慢开始算法也可使用拥塞避免算法。

慢开始 (slow-start) 算法

先将拥塞窗口初值 cwnd0设为 MSS; 发送端按若发出一个最大段长的 TCP 段,并得到正确确认,将拥塞窗口变为最大段长的两倍; 每当发送端发出( 拥塞窗口 / 最大段长)个 TCP 报文段,且都按时得到确认,则拥塞窗口加倍: cwndi+1=2*cwndi; 重复上述步骤,拥塞窗口保持指数规律增长,直至发生丢包超时事件,或拥塞窗口大于门限值 ssthresh 。

拥塞避免算法

拥塞避免算法使发送端的拥塞窗口 cwnd每经过一个往返时延 RTT 就增加一个 MSS 的大小,而不管在时间 RTT 内收到几个 ACK 。具体算法如下: 若拥塞窗口大于门限值 ssthresh ,此后拥塞窗口线性增长,每一个往返时延 RTT 就增加一个最大段长MSS ,直至发生丢包超时事件; 当超时事件发生后,将门限值 ssthresh置为当前发送窗口大小的 1/2 ,拥塞窗口重新设置为一个最大段长MSS 。

慢开始和拥塞避免算法的实现举例

当 TCP 连接进行初始化时,将拥塞窗口置为 1 。图中的窗口单位不使用字节而使用报文段。 慢开始门限的初始值设置为 16 个报文段,即 ssthresh = 16 。

2 4 6 8 10 12 14 16 18 20 2200

4

8

12

16

20

24

传输次数

拥塞窗口 cwnd

进入拥塞避免

发生超时

指数规律增长

线性规律增长

ssthresh = 16

慢开始 慢开始拥塞避免 拥塞避免

更新后的 ssthresh = 12

进入拥塞避免

慢开始和拥塞避免算法的实现举例

发送端的发送窗口不能超过拥塞窗口 cwnd 和接收端窗口 rwnd

中的最小值。我们假定接收端窗口足够大,因此现在发送窗口的数值等于拥塞窗口的数值。

2 4 6 8 10 12 14 16 18 20 2200

4

8

12

16

20

24

传输次数

拥塞窗口 cwnd

进入拥塞避免

发生超时

指数规律增长

线性规律增长

ssthresh = 16

慢开始 慢开始拥塞避免 拥塞避免

更新后的 ssthresh = 12

进入拥塞避免

慢开始和拥塞避免算法的实现举例

在执行慢开始算法时,拥塞窗口 cwnd 的初始值为 1 ,发送第一个报文段 M0 。

2 4 6 8 10 12 14 16 18 20 2200

4

8

12

16

20

24

传输次数

拥塞窗口 cwnd

进入拥塞避免

发生超时

指数规律增长

线性规律增长

ssthresh = 16

慢开始 慢开始拥塞避免 拥塞避免

更新后的 ssthresh = 12

进入拥塞避免

慢开始和拥塞避免算法的实现举例

发送端收到 ACK1 (确认 M0 ,期望收到 M1 )后,将 cwnd

从 1 增大到 2 ,于是发送端可以接着发送 M1 和 M2 两个报文段。

2 4 6 8 10 12 14 16 18 20 2200

4

8

12

16

20

24

传输次数

拥塞窗口 cwnd

进入拥塞避免

发生超时

指数规律增长

线性规律增长

ssthresh = 16

慢开始 慢开始拥塞避免 拥塞避免

更新后的 ssthresh = 12

进入拥塞避免

慢开始和拥塞避免算法的实现举例

接收端发回 ACK2 和 ACK3 。发送端每收到一个对新报文段的

确认 ACK ,就把发送端的拥塞窗口加 1 。现在发送端的 cwnd

从 2 增大到 4 ,并可发送 M4 ~ M6 共 4 个报文段。

2 4 6 8 10 12 14 16 18 20 2200

4

8

12

16

20

24

传输次数

拥塞窗口 cwnd

进入拥塞避免

发生超时

指数规律增长

线性规律增长

ssthresh = 16

慢开始 慢开始拥塞避免 拥塞避免

更新后的 ssthresh = 12

进入拥塞避免

慢开始和拥塞避免算法的实现举例

发送端每收到一个对新报文段的确认 ACK ,就把发送端的拥塞窗口加 1 ,因此拥塞窗口 cwnd 随着传输次数按指数规律增长。

2 4 6 8 10 12 14 16 18 20 2200

4

8

12

16

20

24

传输次数

拥塞窗口 cwnd

进入拥塞避免

发生超时

指数规律增长

线性规律增长

ssthresh = 16

慢开始 慢开始拥塞避免 拥塞避免

更新后的 ssthresh = 12

进入拥塞避免

慢开始和拥塞避免算法的实现举例

当拥塞窗口 cwnd 增长到慢开始门限值 ssthresh 时(即当 c

wnd = 16 时),就改为执行拥塞避免算法,拥塞窗口按线性规律增长。

2 4 6 8 10 12 14 16 18 20 2200

4

8

12

16

20

24

传输次数

拥塞窗口 cwnd

进入拥塞避免

发生超时

指数规律增长

线性规律增长

ssthresh = 16

慢开始 慢开始拥塞避免 拥塞避免

更新后的 ssthresh = 12

进入拥塞避免

慢开始和拥塞避免算法的实现举例

假定拥塞窗口的数值增长到 24 时,网络出现超时(表明网络拥塞了)。

2 4 6 8 10 12 14 16 18 20 2200

4

8

12

16

20

24

传输次数

拥塞窗口 cwnd

进入拥塞避免

发生超时

指数规律增长

线性规律增长

ssthresh = 16

慢开始 慢开始拥塞避免 拥塞避免

更新后的 ssthresh = 12

进入拥塞避免

慢开始和拥塞避免算法的实现举例

更新后的 ssthresh 值变为 12 (即发送窗口数值 24 的一半),拥塞窗口再重新设置为 1 ,并执行慢开始算法。

2 4 6 8 10 12 14 16 18 20 2200

4

8

12

16

20

24

传输次数

拥塞窗口 cwnd

进入拥塞避免

发生超时

指数规律增长

线性规律增长

ssthresh = 16

慢开始 慢开始拥塞避免 拥塞避免

更新后的 ssthresh = 12

进入拥塞避免

慢开始和拥塞避免算法的实现举例

当 cwnd = 12 时改为执行拥塞避免算法,拥塞窗口按按线性规律增长,每经过一个往返时延就增加一个 MSS 的大小。

2 4 6 8 10 12 14 16 18 20 2200

4

8

12

16

20

24

传输次数

拥塞窗口 cwnd

进入拥塞避免

发生超时

指数规律增长

线性规律增长

ssthresh = 16

慢开始 慢开始拥塞避免 拥塞避免

更新后的 ssthresh = 12

进入拥塞避免

乘法减小和加法增大

“乘法减小”是指不论在慢开始阶段还是拥塞避免阶段,只要出现一次超时(即出现一次网络拥塞),就把慢开始门限值 ssthresh 设置为当前的拥塞窗口值乘以 0.5 。 当网络频繁出现拥塞时, ssthresh 值就下降得很快,以大大减少注入到网络中的分组数。 “ 加法增大”是指执行拥塞避免算法后,当收到对所有报文段的确认就将拥塞窗口 cwnd 增加一个 MSS 大小,使拥塞窗口缓慢增大,以防止网络过早出现拥塞。

7.4.4 TCP 的流量控制与拥塞控制

快重传 快重传算法规定,发送端只要一连收到三个重复的 ACK

即可断定有分组丢失了,就应立即重传丢失的报文段而不必继续等待为该报文段设置的重传计时器的超时。 快重传并非取消重传计时器,而是在某些情况下可更早地重传丢失的报文段。

实例分析

发送端连续发送了 M1~M4 共 4 个报文段,当接收端收到 M1 、

M2 后,发出确认 ACK2 和 ACK3 。若M3丢失,接收端收到

M4 后,发现其序号不对而缓存之,并发出重复的确认 ACK3 。

发送端知道网络可能拥塞,也可能 M3滞留在网络某处,于是

继续发送 M5 和 M6 报文。接收端收到 M5 和 M6 后又连续发送

了 2 个 ACK3 确认。这样,发送端共收到 4 个 ACK3 ,其中 3

个是重复的。 快重传:发送端只要一共连收到 3 个重复的 ACKi ,就断定

报文段丢失了,并立即重传报文段 i ,而不必等待Mi 的重传

计时器超时再重传。

快重传举例

M1, M2

ACK2, ACK3

M4

主机 A 主机 B

B 确认 M1 和 M2

A 发送 M1 和 M2

A 收到了三个重复的确认 ACK3 ,就立即重传 M3 ,而不必等待超时重传。

M3 丢失!A 发送 M3 但丢失了A 发送 M4

ACK3

M5 A 发送 M5

ACK3 B 发送第二个重复确认 ACK3M6 A 发送 M6

ACK3

M3

B 发送第三个重复确认 ACK3

B 只能再次确认 M2 (因为 M3 没有收到)

快恢复算法

(1) 当发送端收到连续三个重复的 ACK 时,就重新设置慢开始门限 ssthresh 。(2) 与慢开始不同之处是拥塞窗口 cwnd 不是设置为 1 ,而是设置为 ssthresh + 3 MSS 。 (3) 若收到的重复的 ACK 为 n 个( n > 3 ),则将 cwnd

设置为 ssthresh + n MSS 。(4) 若发送窗口值还容许发送报文段,就按拥塞避免算法继续发送报文段。(5) 若收到了确认新的报文段的 ACK ,就将 cwnd 缩小到 ssthresh 。

7.4.5 TCP 的重传机制

重传机制是 TCP 中最重要和最复杂的问题之一。 TCP 每发送一个报文段,就对这个报文段设置一次计时器。只要计时器设置的重传时间到但还没有收到确认,就要重传这一报文段。

往返时延的方差很大

由于 TCP 的下层是一个互连网环境, IP 数据报所选择的路由变化很大。因而运输层的往返时延的方差也很大。

时间

数据链路层

运输层

T1 T2 T3

往返时延的概率分布

问题:取 T2 ,间隔过短,引起不必要的数据重传;取 T3 ,间隔过长,使得网络性能下降。解决办法:动态调整重发超时时间间隔。

往返时延的自适应算法

记录每一个报文段发出的时间,以及收到相应的确认报文段的时间。这两个时间之差就是报文段的往返时延。 将各个报文段的往返时延样本加权平均,就得出报文段的平均往返时延 RTT 。 每测量到一个新的往返时延样本,就按下式重新计算一次平均往返时延 RTT : 平均往返时延 RTT

(旧的 RTT) (1 ) (新的往返时延样本 )

在上式中, 0 1 。

参数 的选择

若 很接近于 1 ,表示新算出的平均往返时延 RTT 和原来的值相比变化不大,而新的往返时延样本的影响不大 (RTT

值更新较慢 ) 。 若选择 接近于零,则表示加权计算的平均往返时延 RTT

受新的往返时延样本的影响较大 (RTT 值更新较快 ) 。 典型的 值为 7/8 。

超时重传时间 RTO

计时器的 RTO 应略大于上面得出的 RTT ,即: RTO RTT

这里 是个大于 1 的系数。 若取 很接近于 1 ,发送端可及时地重传丢失的报文段,因此效率得到提高。 但若报文段并未丢失而仅仅是增加了一点时延,那么过早地重传反而会加重网络的负担。 因此 TCP 原先的标准推荐将 值取为 2 。

往返时间的测量相当复杂

TCP 报文段 1 没有收到确认。重传此报文(即报文段 2 )后,收到了确认报文段 ACK 。 如何判定此确认报文段是对原来的报文段 1 的确认,还是对重传的报文段 2 的确认?

往返时延 RTT?

发送一个TCP 报文段

超时重传TCP 报文段 收到 ACK

时间1 2

往返时延 RTT?

是对哪一个报文段的确认?

Karn 算法

在计算平均往返时延 RTT 时,只要报文段重传了,就不采用其往返时延样本。 这样得出的平均往返时延 RTT 和重传时间就较准确。

新的问题:报文段的时延突然增大了许多,该怎么办?

修正的 Karn 算法

报文段每重传一次,就将重传时间增大一些: 新的重传时间 (旧的重传时间 )

系数 的典型值是 2 。 当不再发生报文段的重传时,才根据报文段的往返时延更新平均往返时延 RTT 和重传时间的数值。

7.4.6 采用随机早期丢弃 RED 进行拥塞控制

TCP 的拥塞控制和网络层采取的策略有密切联系,因为网络层的策略可能影响到多个 TCP 连接!一般在缓存队列满时采用尾部丢弃策略,即总丢弃新到达的数据报。 尾部丢弃策略会导致上层的 TCP 进入拥塞控制的慢开始状态。

7.4.6 采用随机早期丢弃 RED 进行拥塞控制

使路由器的队列维持两个参数,即队列长度最小门限 THmin

和最大门限 THmax 。

RED 对每一个到达的数据报都先计算平均队列长度 LAV 。

若平均队列长度小于最小门限 THmin ,则将新到达的数据

报放入队列进行排队。 若平均队列长度超过最大门限 THmax ,则将新到达的数据

报丢弃。 若平均队列长度在最小门限 THmin 和最大门限 THmax 之间,

则按照某一概率 p 将新到达的数据报丢弃。

RED 将路由器的到达队列划分成为三个区域

从队首发送

最小门限 THmin

最大门限 THmax

数据报到达

平均队列长度 Lav

排队丢弃 以概率 p 丢弃

丢弃概率 p 与 THmin 和 Thmax 的关系

当 LAV Thmin 时,丢弃概率 p = 0 。

当 LAV Thmax 时,丢弃概率 p = 1 。

当 THmin LAV THmax 时, 0 p 1 。

例如,按线性规律变化,从 0 变到 pmax 。

最小门限 THmin最大门限 THmax

平均队列长度 Lav

数据报丢弃概率 p1.0

0

pmax

瞬时队列长度和平均队列长度的区别

队列长度

时间

瞬时队列长度

平均队列长度

LAV=(1-δ)×(旧的 LAV)+ δ ×( 当前队长的样本 )

丢弃概率 p=ptemp/(1-count ×ptemp) , count变量表示新入队的数

据报数(未被丢弃) 其中 ptemp=pmax ×(Lav-THmin)/(THmax-THmin)

结论

随机早期丢弃 RED 好处就是当平均队列长度超过门限值 T

Hmin 时,就会有少量的数据报被丢弃,这就使得有少量的 TC

P 连接会减少其窗口值,使得到达路由器的数据报的数量减少。结果,队列平均长度就减少了,从而避免了网络拥塞的发生。

7.4.7 TCP 的运输连接管理

运输连接就有三个阶段:连接建立、数据传送和连接释放。运输连接管理就是使运输连接的建立和释放都能正常地进行。 连接建立过程中要解决以下三个问题:

要使每一方能够确知对方的存在。 要允许双方协商一些参数(如最大报文段长度,最大窗口大小,服务质量等)。 能够对运输实体资源(如缓存大小)进行分配。

TCP 连接采用客户 - 服务器方式:客户主动发出连接请求,服务器被动等待连接的建立。

用三次握手建立 TCP 连接

SYN, SEQ = x

主机 B

SYN, ACK, SEQ = y, ACK= x 1

ACK, SEQ = x + 1, ACK = y 1

被动打开主动打开

确认

确认

主机 A

连接请求

为什么要发送第三个报文?

建立 TCP 连接

A 的 TCP 向 B 发出连接请求报文段,其首部中的同步比特 SYN 应置为 1 ,并选择序号 x ,表明传送数据时的第一个数据字节的序号是 x 。 B 的 TCP 收到连接请求报文段后,如同意,则发回确认。 B 在确认报文段中应将 SYN 置为 1 ,其确认号应为 x

1 ,同时也为自己选择序号 y 。 A 收到此报文段后,向 B 给出确认,其确认号应为 y 1 。 A 的 TCP 通知上层应用进程,连接已经建立。 当运行服务器进程的主机 B 的 TCP 收到主机 A 的确认后,也通知其上层应用进程,连接已经建立。

TCP 连接释放的过程

FIN, SEQ = x

ACK, SEQ = y, ACK= x 1

ACK, SEQ = x + 1, ACK = y 1

应用进程释放连接

A 不再发送报文

FIN, ACK, SEQ = y, ACK = x + 1

主机 B主机 A

通知主机应用进程

应用进程释放连接

B 不再发送报文

确认

确认从 A 到 B 的连接就释放了,连接处于半关闭状态。相当于 A 向 B 说:“我已经没有数据要发送了。但你如果还发送数据,我仍接收。” 至此,整个连接已经全部释放。

作业: P278 7-26 、 7-32