其实数据中心深度测试:超大规模网络链路挑战的问题并不复杂,但是又很多的朋友都不太了解,因此呢,今天小编就来为大家分享数据中心深度测试:超大规模网络链路挑战的一些知识,希望可以帮助到大家,下面我们一起来看看这个问题的分析吧!
审稿人|孙淑娟
如今,数据创建、存储和处理的指数级增长正在推动全球对超大规模数据中心的需求。这些数据中心的基础设施大多由亚马逊、微软和谷歌等云计算服务提供商(CSP)设计和管理,依靠强大的物理连接来确保部署的存储和计算资源的充分利用。
用户可以使用自动化解决方案对这些关键物理连接的数据链路层进行测试和故障排除。但首先您应该了解并检查链接和链接类型。
超大规模数据中心内最常见的三种物理组件是:直连铜缆(DAC)、有源光缆(AOC) 以及连接到收发器的光缆组件。这三个连接元素中的每一个都可以被视为数据传输的高速公路。
不仅这些组件的基本电气和光学连接功能正常运行很重要,数据链路层在既定的网络/制造商规范内运行也很重要。
这些连接元素的变化主要取决于数据速率和物理链路长度(最大覆盖范围)。直连铜缆(DAC) 用于连接距离很近的设备,最常用于连接同一机架内的两个元件。
有源光缆(AOC)具有扩展的范围,可以连接同一排机架内的两个设备,甚至可以连接到相邻排的两个设备。光纤电缆组件,包括连接到数据中心入口面板的长距离电缆,可以连接相距较远的两个设备(通常长达100 公里,具体取决于它们所连接的收发器)。
无论数据速率或跨越的距离如何,所有这些链路都必须进行监控和测试,以确保物理层和数据链路层都在标准范围内运行。
1.直连铜缆(DAC)
直连铜缆(DAC) 是电缆本身由铜线制成的替代方案。当信号处理电路集成到DAC 内置连接器中时,DAC 可以是无源或有源以提供直接连接。
与有源光缆(AOC) 一样,直连铜缆(DAC) 将由小型可插拔(SFP) 模块或四路小型可插拔(QSFP) 模块端接,具体取决于线路速率。有源光缆(AOC) 支持更长的传输距离,并且比直连铜缆(DAC) 更轻。然而,有源光缆(AOC) 成本更高,而且光纤比铜缆更容易损坏。有源光缆(AOC) 和直连铜缆(DAC) 也可用作分支线。
2.有源光缆(AOC)
有源光缆(AOC) 用于数据中心中的点对点互连应用,通常在一排机架内。
将有源光缆(AOC) 与带有收发器的光缆组件(也称为可插拔光学器件,如SFP 和QSFP)进行比较时,有源光缆(AOC) 提供了一种简单的安装方法,无需考虑互连损耗,连接前无需清洁和检查光纤端面。
但是,有源光缆(AOC) 不能用于使用配线架的行尾(EOR) 或行中(MOR) 配置。对于40GE、100GE 和400GE 的高速链路,这通常意味着在带状电缆上使用多个数据通道。对于10GE、25GE 或50GE,每个方向上的单个通道或光纤就足够了。
一个关键属性是有源光缆(AOC) 使用与可插拔光学器件相同的笼子,并在每个电缆末端执行光电转换。实际上,这意味着40GE 和100GE 的QSFP 端接(400GE 的QSFP-DD)以及10GE 和25GE 的SFP 端接。
因此,有源光缆(AOC)是有源的,其组件除了光缆之外,还包括收发器、控制芯片和模块。有源光缆(AOC) 电缆具有固定长度,通常从几米开始,一直延伸到100 米或更长。
从技术上讲,有源光缆(AOC) 不必符合多种以太网接口类型中的任何一种,尽管许多AOC 在其产品信息中宣称符合某种以太网接口类型。
由于直连铜缆(DAC) 和有源光缆(AOC) 不提供对实际光纤或铜缆的测试访问,因此无法使用传统介质测试和认证工具对电缆进行认证或故障排除。相反,必须使用可接受双SFP/QSFP 收发器并生成和分析流量的测试工具。
测试DAC 和AOC 是确保任何网络性能问题不是由DAC/AOC 或其安装引起的关键步骤。考虑到如果安装失败,电缆没有事先进行测试,成本会更高。
因此,有必要对远端进行跟踪定位。直连铜缆(DAC)/有源光缆(AOC) 故障的原因包括简单的制造缺陷、极性不正确或颠倒以及运输过程中贴错标签或损坏。
对于有源光缆(AOC),它们可能会过度弯曲,从而导致高损耗,或者光纤可能会被压碎。对于直连铜缆(DAC),可能会出现电磁干扰(EMI),从而导致过多的误码。添加更多电缆以在超大规模数据中心进行测试,很容易理解自动化测试流程的需求。
边缘部署和分解:在安装时平衡测试的时间/成本效率
在光纤网络时代,建设和调试超大规模数据中心意味着承包商还负责测试和认证这些多组件白盒网络中每个光纤链路的性能、可操作性、压力和可靠性。
将此与超大规模数据中心的指数增长以及更接近最终用户的需求相结合,结果是更多的边缘部署(网络虚拟化)。这迫使超大规模数据中心提高速度、安全性和效率,同时最大限度地减少网络延迟。
同时需要快速启动边缘部署可能会增加在安装前不测试所有电缆的决定,而是选择等待并在故障排除期间解决任何连接问题。
同样,在故障排除期间,为了最大限度地减少停机时间,通常会导致决定切断或断开电缆并运行新电缆,而不是排除故障或拆除现有电缆。
通常,从机柜拉出的未经测试的电缆会返回给制造商,但制造商声称电缆没有任何问题,或者由于多次电缆故障而无法诊断。
这种情况不仅成本高昂(电缆成本从数十美元到数千美元不等,具体取决于线路速度),导致机柜中未使用的电缆拥堵,而且还可能导致标签错误或混乱,并增加拔出正在运行的电缆的可能性。
由于传统电缆是特定于速率的,并且无法在升级中使用,因此在机柜中留下断线和死线会增加体积和重量,从而影响机架结构的主要功能。
3.误码率测试的价值
由于电缆成本和其他因素的变化,很难准确说明安装时测试和验证每根电缆的时间和成本效益。
然而,从理论上不难推断,如果安装时没有测试足够的电缆,未来的故障排除工作和网络升级将更加耗时和昂贵。
测试电缆最简单且最具成本效益的方法是运行测试模式并将结果与误码率(BER) 阈值进行比较。直连铜缆(DAC) 和有源光缆(AOC)(包括分支)通常在其数据表上标记有误码率(BER) 等级,特别是当它们打算与实现RS-FEC 的设备一起使用时使用时的算法。
误码率(BER) 等级取决于电缆类型、线路速度和以太网接口类型。对于用于RS-FEC 编码流量的电缆(通常为400GE、100GE、50GE 和25GE),甚至可能同时存在FEC 前等级(纠错之前)和FEC 后等级(纠错之后)。
在这种情况下,建议使用接近电缆误码率(BER) 额定值的预FECBER 阈值来执行电缆测试,并确保测得的误码率(BER) 小于成功测试的阈值。
对于不使用RS-FEC 的40GE 和10GE 电缆,预期误码率(BER) 阈值要求要小得多,因为这些线路上没有纠错。在这种情况下,如果没有直连铜线(DAC) 或有源光缆(AOC) 的误码率(BER) 额定值,建议的误码率阈值(BER) 为10^-12。
每条电缆一分钟的测试足以在10Gbps 或更高的线路速率下获得有意义的误码率(BER) 结果。电缆测试的最佳实践程序将生成测试报告,其中包括电缆标识符(例如序列号)等信息,这些信息可以从直连铜缆(DAC) 或有源光缆(AOC) 电缆中读取。
因此,根据目标误码率(BER) 阈值测试直连铜缆(DAC) 或有源光缆(AOC) 是确保更多电缆在连接时正常运行的一种有意义的方法。
原文链接:https://www.datacenterdynamics.com/en/opinions/a-case-for-automated-testing-of-the-data-link-layer/
如果你还想了解更多这方面的信息,记得收藏关注本站。
本文采摘于网络,不代表本站立场,转载联系作者并注明出处:https://www.iotsj.com//kuaixun/6816.html
用户评论
这篇文章应该介绍如何用自动化手段测试超大规模数据中心的网络基础设施吧?
有18位网友表示赞同!
感觉数据链路层的测试非常重要,影响着整个数据中心的稳定性。
有12位网友表示赞同!
我很想看看文中提到的这些特殊测试题的具体内容。
有6位网友表示赞同!
自动化测试能提高效率,我觉得超大规模的数据中心应该大力推广啊。
有14位网友表示赞同!
超大规模数据中心真是一个非常复杂的概念,数据链路层的测试一定很难搞定。
有19位网友表示赞同!
文章会不会涉及到不同类型的网络设备的测试?
有17位网友表示赞同!
我想知道文中提到的测试工具是如何实现自动化的?
有11位网友表示赞同!
测试案例能够帮助我们更好地了解如何去搭建和维护超大规模数据中心吗?
有18位网友表示赞同!
这篇文章正好是我现在研究方向的,很有参考价值!
有14位网友表示赞同!
超级期待文中提到的测试题能帮我学习到一些新的知识!
有15位网友表示赞同!
自动化测试可以减少人工操作,提高了测试效率。
有18位网友表示赞同!
我相信数据链路层的测试对确保数据安全非常重要。
有11位网友表示赞同!
超大规模的数据中心需要高效稳定的网络性能,数据链路层的测试至关重要!
有18位网友表示赞同!
文章能给我更深入的了解超大规模数据中心的建设和维护吗?
有8位网友表示赞同!
这个案例的研究成果希望能应用到实践中,提高实际运营效率。
有10位网友表示赞同!
这篇文章或许会分享一些行业内的最佳实践.
有12位网友表示赞同!
我很想了解文中提到的测试题是如何被设计的,是否考虑到了实际的使用场景?
有15位网友表示赞同!
数据链路层的自动化测试可以大大减少人工成本,提高效率!
有15位网友表示赞同!
希望文中能提供一些具体的案例分析
有12位网友表示赞同!