e平台主机通道支配器应该增加该QP的网络注入速率正在收集换取机中,当入口流量大于出口流量的带宽时会产生收集堵塞。楷模的例子是众个发送方同时向统一个主意地发送收集数据。换取机的缓存可能措置短暂的堵塞,然则当堵塞太久时,换取机的缓存就会过载。当换取机缓存过载时,下一个收到的新的数据包就会被抛弃。丢包会下降运用职能,由于重传和传输契约的丰富性会带来延迟。无损收集告竣了流掌握机制,它可能正在缓存溢出前暂停入口流量,制止了丢包地步。然而,流掌握自己会形成堵塞宣扬的题目。

  为了判辨堵塞宣扬题目,斟酌下面的图示。假设换取机1上的端口A到E都正在向端口G发送收集数据包,以致于端口G以100%的才干来授与数据而且转发。假设,相接的换取机2端口F也正在向换取机1的端口G发送数据,速度是全豹链途带宽的20%。由于端口G的出口仍旧满载了,端口F将会重传数据包直到被流掌握机制暂停。此时,端口G将会显露堵塞,然而此时没有负效应,由于全面的端口城市被端口G尽疾的办事。

  现正在斟酌换取机2上的一个端口X,以链途带宽的20%速率向换取机1上的端口Y发送数据。端口G这个堵塞源并不处于端口X到端口Y的旅途上。这种状况下,你也许会以为端口F只操纵了换取机间链途的20%带宽,盈余的80%带宽对付端口X是可用的。然而并非这样,由于来自端口F的流量最终触发流掌握机制使得换取机间的链途处于暂停发送,而且另日自端口X的流量降为20%而不是潜正在可用的80%带宽。

  堵塞掌握用来省略有损收集中的丢包地步或者无损收集中的堵塞宣扬地步。它也省略换取机缓存的占用,进而省略了延迟和刷新突发流量的容忍度。操纵的本领是限定导致堵塞底子因由的端口(A-F)的收集流注入速度,是以其他端口(X)发来的收集流就不会被影响。通过限定端口A-F的注入速度为端口G可能措置的速度,端口A-F不该当考查到显著的职能低落(终于,它们的数据包无论何如也要守候),然而从端口X到端口Y发送的数据包该当可以平常的转发,由于流掌握机制不会发送暂停帧(堵塞掌握主意是保留换取机的缓存占用率低,是以流掌握机制就不会被触发)。眼前的RoCE堵塞掌握依赖显式堵塞告诉(Explicit Congestion Notification, ECN)来运转。

  ECN最初正在RFC 3168文档为TCP/IP契约所界说,它通过正在IP头部嵌入一个堵塞指示器和正在TCP头部嵌入一个堵塞确认告竣。兼容ECN的换取机和途由器会正在检测到堵塞时对收集数据包打象征。IP头部的堵塞指示也可能用于RoCEv2的堵塞掌握。下面是IP头部的前四个帧的格局:

  RoCEv2程序界说了RoCEv2堵塞统制(RCM)。RCM供给了避免堵塞热门和优化链途含糊量的才干。启用了RCM后,链途上早期的堵塞会被报告给收集流的源,然后收集流的源会下降它们的注入速度,是以防范了链途上的缓存饱和与减少列队延迟带来的负面效益。堵塞统制与共存的TCP/UDP/IP流量也是闭联的。然而,假设对RoCEv2和其他流量操纵了分歧优先级,每个优先级都有一个带宽分拨,堵塞和堵塞反响(指收集源针对堵塞采用的行为)效益不该当相互影响。

  为了发出堵塞信号,RCM依赖于RFC 3168中界说的ECN机制。一朝RoCEv2流量显露了堵塞,收集开发正在数据包的IP头部对ECN域实行象征。这个堵塞指示器被主意终端节点服从BTH(Base Transport Header,存正在于IB数据段中)中的FECN堵塞指示标识来讲明事理。换句话说,当被ECN象征过的数据包达到它们底本要达到的主意地时,堵塞告诉就会被反应给源节点,源节点再通过对有题目的QP实行收集数据包的速度限定来回应堵塞告诉。

  RCM是一个可选的标准作为。告竣了RCM的RoCEv2主机通道适配器该当服从下面的准则来运转:

  当收到一个有用的RoCEv2数据包时,它的IP.ECN域的值假设是11(二进制),那么这个主机通道适配器该当出现一个RoCEv2的CNP,送回给所收到的包的源节点(格局轨则如下)。这个主机通道适配器该当对众个被ECN象征为统一个QP的的数据包发送一个单个CNP即可。

  当收到一个RoCEv2的CNP时,主机通道适配器该当对RoCEv2 CNP中象征的QP奉行减缓注入速度。这个速度变更总量由一个可摆设的速度减缓参数来决意。

  当被ECN象征的QP自从比来收到的RoCEv2 CNP包先导历程了一个可摆设的暂停时长或者凌驾一个仍旧发送的可摆设的字节数之后,主机通道独揽器该当减少该QP的收集注入速度。

  3.途由器正在产生堵塞的队伍上授与到数据包时,不是立地抛弃,也许会先查抄ECN域确定是否开启了ECN性能,假设是,就正在IP头部掀开CE位。

  5.授与方会对开启CE位且类型为RoCE的数据包实行过滤,触发事故,然后再将数据包开释到平常措置流程中。

  6-7.为了避免因为出现流量的负载,授与方该当将针对每个QP出现的堵塞告诉堆积起来。 正在若干微秒内将一个CN数据包发送回注入方QP上。数据包中的ECN位扶植为01来验证该数据包没有被IP途由器丢掉。IBA的BTH头部将会服从上述的格局来界说。

  10.CNP包达到源注入方节点。注入方节点对ECN位为01且类型为RoCE的数据包实行过滤,然后对指示的收集流运用速度限定算法。

  量化堵塞告诉IEEE程序(802.Qau)以有限带宽时延的以太网收集为历久保活的收集流供给了堵塞掌握。这是IEEE数据核心桥接(DCB)契约套件中的一部门,还席卷ETS,PFC,和DCBX。QCN正在二层以太收集上订定,而且是针对硬件告竣的。QCN合用全面的以太网帧和全面的传输,而且主机端和换取机端的作为也正在程序中细致轨则。QCN的摆设和音信提取可能合用mlnx_qcn下令。

  DC-QCN算法是基于数据核心TCP(DCTCP)和量化告诉算法的联合,而且和微软磋议院协同开采的。最初的算法正在SIGCOMM15论文Congestion control for large scale RDMA deployments中提出。DC-QCN算法依赖于换取机端的ECN象征。ECN是商用数据核心换取机的一般特色。正在数据包IP头部中的查分办事域中的两个比特位用来提示堵塞。一朝换取机端显露了堵塞,这两个比特位就被置为11(CE)。

  象征堵塞是队伍长度的概率函数,如下图所示。队伍长度的两个门限值界说了象征概率。当队伍长度低于门限值下限时,ECN位不会被象征。当队伍长度凌驾门限值上限时,全面从该队传记输的收集包城市被实行ECN象征。当队伍长度处于两个门限值之间时,数据包会以与队伍长度线性延长的概率被实行ECN象征。

  带有ECN象征的数据包被宣扬到授与方的网卡上。授与方网卡创修一个CNP并把它发送给ECN所象征的数据包的发送方。CNP数据包席卷被象征的QP的音信。当CNP被发送方网卡收到时,它会基于下面形容的算法来下降指定QP的传输速度。

  DC-QCN降速算法通过下面的图外来形容。简而言之,假设QP基于内部依时器和发送字节计数器,算法会赓续的减少发送速度,一朝收到CNP包,就会对指定QP实行降速。除此以外,它还保卫一个叫做α的参数,它反响了收集中的堵塞度,用于降速谋略。

  时分被切分为可摆设的时分间隙。每个时分间隙指示是否有CNP正在该时分间隙内达到。α参数是一个一贯变更的均匀值,它是CNP达到的时分间隙的比例(假设统一个时分间隙内不止一个CNP达到,与只要一个CNP达到效益雷同)。每个时分间隙告终时,α通事后面的式子更新:new_α = g * old_α + (1 - g) * CNP_arrived, 这里g是一个介于0和1的常量参数,CNP_arrived是一个比特位的域,用来指示正在上个时分间隙内是否有CNP达到。

  时分被切分为可摆设的时分间隙(分歧于α更新的间隙)。假设CNP正在上个时分间隙达到(正在统一个时分间隙内不止一个CNP达到时,后面的CNP不会出现指示),QP的速度通事后面的式子来省略:new_rate = old_rate * (1 - α / 2),同时将用于提速的几个参数重置。

  提速逻辑和QCN界说的很是相通。该逻辑划分为三个次第的阶段:疾捷光复,主动减少(保留探测),超主动减少(保留探测)。

  从一个阶段移向下一个阶段是通过正在该阶段中统计到的提速事故数目参数界说的。正在一个阶段中提速事故的数目凌驾预订义的门限值后,逻辑移向下一个阶段。降速事故会重置全面和提速闭联的计数器,而且返回到疾捷光复阶段。除此以外,一朝提速后,正在降速之前,眼前的速率会被保管正在一个叫target_rate的参数中。

  自当年次提速后,正在历程预订义的时分间隙或者预订义的发送字节数流程后,假设没有显露降速事故,就会显露提速事故。

  处于疾捷光复阶段时,面临每个提速事故,速率服从到target_rate的隔断的一半来减少(也便是对数挨近,current_rate = (current_rate + target_rate) / 2)。这许可正在疾捷光复阶段的先导能疾捷光复到堵塞显露的速率,然后正在速率挨近堵塞产生的速率时,更庄重的减少速率。

  正在后面两个阶段中,一朝显露提速事故,速率都是服从一个常量值来减少。这可能正在带宽开释的期间取得含糊量。

  此次记实了RoCEv2收集中对付堵塞掌握的检测,防止和应对本领。ECN检测和象征是摩登数据核心商用换取机一般具有的性能,它保管正在IP头部的查分办事代码点中的两个比特位中。启用ECN性能后,正在收集上显露堵塞后,换取机遇对ECN域打上CE值,由授与方出现CNP来告诉发送方收集堵塞事故。发送方收到CNP指示的事故告诉后,依照DC-QCN算法中对眼前速率处于疾捷光复,主动减少和超主动减少三个阶段中对应的行为来对注入速度实行掌握,从而办理收集中的堵塞状况。

转载请注明出处:MT4平台下载
本文标题网址:e平台主机通道支配器应该增加该QP的网络注入速率