网络性能常用指标-网络延时分析
网络延时包括传播延时、传输延时、排队延时和路由器执行时间。
传播延时(propagation delay)是电信号或光信号从一个点传播到另一个点所花的时间。延时定义为电/光在铜缆或光纤中的速度的函数。本质上数据信号大约以真空光速的2/3即每秒钟192000公里的速度在电信网中传播。事实上,随着网络在国家或国际范围的扩展,传播延时成了总延时最大的部分,并且不可能减小。传播延时是广域网(WAN)性能永远比不上局域网(LAN)的主要原因。站点或节点之间的距离越大,广域网(WAN)的速度越慢。
传输延时(transmission delay)是以给定传输速率传输一定数量的数据所花的时间。可以直接了当地用数学表示这一延时。例如,一条速率为100kbps的链路,传输1000千(1兆)比特的数据需要10秒钟,而用一条速率为500kbps的链路来传输只需2秒钟。你可以在网络中创建一个传输速率表。你将可以看到,在传输大量数据时,传输延时特别明显。
注意
增大广域网(WAN)链路带宽确实可以减少传输延时,但不能减少传播延时。如果用一个具有一定宽度和长度的管道来作类比,增大管道的宽度跟带宽的增加相似,但这并不能减小管道长度。因此,如果一个应用程序受限于带宽,增大带宽将可以改善性能。但是,我们的经验表明,绝大多数交互式客户机/服务器应用程序发送的数据量相对较少,因此主要受传播延时的影响。
排队延时(queuing delay):当网络中许多设备(包括客户和服务器)同时想在网络上发送数据时就会出现排队延时。在媒质接入延时情形,每个网络设备在得到发送机会之前将停止发送其数据包。在排队延时情形,所有的数据包都发给同一设备(通常是路由器),这个设备可以接入广域网(WAN)。传输带宽是决定路由器发送全部排队数据包所需时间的主要因素。例如,如果路由器上积压的容量为10KB,在56kbps链路上发送完排队要花费1秒多。另一方面,在发送速率为1544kbps的T1链路上则只需不到1/10秒的时间。路由器执行时间(latency)是路由器将一个数据包从一个接口传送到另一个接口所需的时间。这通常是一个小数值。Cisco路由器的执行时间可以通过利用不同的交换路径来减小。尽管延时本身很小,但如果有许多跳(hop),端到端路由器执行时间就会变成一个显著的因素。如何将执行时间减到最小,成了大型网络设计的一个主要挑战。路由器执行时间在校园网中比在公司内部网(Intranet)中更成其为问题。
处理(transaction)时间通常花在三个方面:数据包穿过网络,服务器检索数据,客户机接收数据和要求更多的数据。
初步假设客户机向服务器请求发送数据。因此,至少两个点的测量是必需的:客户机本地网络和服务器本地网络。在客户机端,将测量客户机延时。在数据包层次上,这是客户机接收到一帧数据到它请求下一帧数据之间的延时。同样在客户机网络上,要测量复合(网络+服务器)延时。第二个测量是在服务器网络上进行,测量服务器延时。
客户机和服务器之间的交互作用越多,来回传递的数据包越多,该应用程序对网络延时就越敏感。这种敏感性部分是因为存在一个跟每次交换有关的周转时间。例如,客户机发送之后就等待服务器的响应,以便再次发送。这样,网络延时的任何增加,都将引起周转时间2倍的增加;首先是从客户机到服务器的网络延时增加,其次是返回的延时增加。
在局域网(LAN)中,这个周转时间可能为几秒钟。但在一个横跨一个国家或全球的公司广域网(WAN)中,周转时间可能数十或数百秒。显然,对应用程序来说周转时间的这种增加可能是灾难性的。这种延时是许多应用程序开发项目失败的主要理由之一。例如,50ms的网络延时(在加州圣何塞和NC雷利之间100ms是相当典型的网络延时)将使应用程序的响应时间增加2秒。
在分析响应时间时需要问下列一些问题:
应用程序要求多少次周转?应用程序流量的这种检查可以用协议分析工具或网络探测工具来实现。这是了解应用程序流量图的第一步,结果可能显示出单个应用程序处理需要数十或数百次网络周转。
网络延时是多少?前面已经提到,这个延时量度对应用程序响应时间性能是基本的。知道网络延时还有助于网络设计决策。例如,1000英里T1链路的延时比相似的卫星连接延时要小。
数值t1, t2和t3的总和是否落在服务级别协议或运行目标所要求的响应时间之内?如果回答“否”,可能还有机会调节应用程序,将周转次数减少,改善性能。还有可能该应用程序不能按用户的期望运行。
查看这一点的另一个方法是,当你评估一个用于跨广域网(WAN)应用的程序时,它发送的数据越多就越糟,数据越少越好。对较大较慢的广域网,这尤其正确。它们将难以承受应用程序发送大量数据、要求大量处理。因此,在检查应用程序响应时间时,有必要检查应用程序协议行为、网络性能以及客户机/服务器的性能和可扩展性。