[[440857]]
NVIDIA网络事业部宋青春
借助云原生将超算带入数据中心大数据分析、人工智能等技术的应用需要超算的支持。然而,由于超级计算机的使用成本较高,大多数企业需要云计算的弹性和灵活性。那么,如何将超级计算的性能与云的灵活性结合起来,以全新的架构满足不同业务的需求呢?宋青春认为,借助云原生超算技术,可以将超算技术带入千家万户、数以万计的数据中心,因此云原生将是未来提供算力平台的发展趋势。
如何高效连接各种云原生设备是NVIDIA致力于解决的技术问题,而InfiniBand网络是目前最合适、最合适的网络。
“InfiniBand是一个计算网络,可以轻松扩展到数万、数十万或数百万个节点。使用软件来定义它也使其更易于管理。”宋青春表示,InfiniBand网络非常适合云原生架构,NVIDIA推出了Quantum-2平台,为企业更好地应用InfiniBand网络提供良好的支持。
据介绍,NVIDIA Quantum-2平台有三款非常重要的产品,分别是Quantum-2交换机、CONNECTX-7 InfiniBand网卡和基于BlueField-3的InfiniBand DPU。这三款产品具有多租户、性能隔离、拥塞控制、超高精度定时器等关键特性。
宋青春告诉记者,Quantum-2是一个真正实现数据在哪里就计算的计算网络,满足超级计算和云原生的网络需求。 Quantum-2不仅实现了对AI业务至关重要的GPU Direct RDMA技术,还添加了PDA(可编程数据路径加速器)来对特定流量进行编程和加速。它还专门优化了各种通信模型,以提高All 通信过程中的All 通信效率。
在微软AZURE公有云上的测试结果表明,采用InfiniBand动态路由和拥塞控制技术保证了云性能,并成功隔离不同业务,使业务互不影响,达到裸机性能。
3U一体云原生架构赋予无限算力资源DPU等特殊芯片的加持,赋予网络新的生命。
谈及NVIDIA 3U一体化云原生架构,宋青春首先介绍了NVIDIA DPU产品。他表示,DPU的出现弥补了数据中心基础设施加速能力的不足,实现了DPU、GPU、CPU 3U一体化的新型数据中心架构,使数据中心成为新的计算单元,为优化计算提供了新的途径。数据中心的力量。资源。因此,3U一体化架构成为数据中心的必然架构,通过DPU、CPU和GPU的分工实现数据中心的最优性能。
DPU的出现为用户提供了另一种优化业务性能的思路。 DPU运行通信框架,CPU和GPU执行浮点计算。 DPU加速HPC业务中的通信,实现计算与通信的重叠。
宋青春通过一组数据详细介绍了3U一体化云原生架构的重要性。 iAlltoall 是一种常用于HPC 应用程序和AI 建议的通信模型。通过利用DPU和CPU实现计算通信重叠,iAlltoall性能提升44%。 iAllgather是一种用于大规模模型训练的通信模型。通过DPU和CPU计算通信的重叠,iAllgather性能可提升36%。
“DPU的出现弥补了数据中心Infarstucture加速能力的不足,实现了DPU、GPU、CPU 3U一体化的全新数据中心架构,使数据中心成为一个新的计算单元,为用户提供了想象空间优化计算资源。”宋青春说。
云原生软件定义为零信任提供安全保障在远程工作成为新常态的今天,用户需要随时随地访问企业数据中心和云端的应用程序和数据。无处不在的连接使网络安全面临越来越大的挑战。零信任网络已成为保障网络安全的必须。
“采用传统的网络架构,如果需要200天才能发现问题,70天才能修复问题,那么数据中心就会非常不安全。”宋青春表示,借助NVIDIA DOCA 1.2的零信任(Zero-trust)安全框架,可以轻松很好地保证连接的安全性。
据介绍,DOCA 1.2提供了负载均衡器、DPI、IPS、IDS和下一代防火墙。设计安全软件的安全软件用户或者供应商可以通过DOCA API直接调用GPU中的硬件加速引擎,让数据中心更加安全。
事实上,在今年的GTC上,黄仁勋专门讲解了Morpheus安全框架。 Morpheus为未来数据中心提供了更新的思路,即Morpheus利用AI进行安全防御,而不必基于传统安全顾问对恶意攻击的识别或其他安全特定模型进行有限的安全防御。利用AI深度学习方法可以全面保护数据中心,让数据中心自动检测恶意行为并采取措施防止网络受到攻击。
据报道,NVIDIA以太网和InfiniBand网络均已实现与Morpheus的集成。特别是InfiniBand网络的UFM Cyber-AI与Morpheus相结合,不仅实现了网络中异常行为的识别和处理,还实现了对未来网络可能出现的异常情况进行假设,并进行自诊断。预防和保护。
宋青春表示,借助NVIDIA Morpheus的零监督自学习框架,可以实现比原来快600倍的遥测数据处理速度,生成超过百万甚至超过千万的模型,并与数据中心进行匹配实现数据中心异常监控和处理。
关于让云原生超级计算挺进千万数据中心-51CTO.COM,的介绍到此结束,希望对大家有所帮助。
本文采摘于网络,不代表本站立场,转载联系作者并注明出处:https://www.iotsj.com//kuaixun/7849.html
用户评论
这篇文章讲的是将云原生的超级计算技术应用进数以万计的数据中心?
有14位网友表示赞同!
真希望能加速数据的处理速度,提高效率!
有8位网友表示赞同!
这种技术对于大型数据库和高性能计算来说很有意义啊。
有14位网友表示赞同!
感觉未来越来越多的数据中心都会采用云原生技术了。
有12位网友表示赞同!
超级计算和数据中心的结合,想想都觉得很厉害
有11位网友表示赞同!
想知道具体有哪些企业已经开始应用这种技术?
有17位网友表示赞同!
这篇文章肯定很有深度,要好好研究一下
有10位网友表示赞同!
能让我们更好地理解云原生技术的未来发展方向吗?
有20位网友表示赞同!
对数据安全和稳定性方面有哪些新的要求呢?
有10位网友表示赞同!
听起来很有潜力啊,期待更多相关报道
有10位网友表示赞同!
这种技术是不是会对现有硬件设施产生影响?
有19位网友表示赞同!
希望这些技术的应用能够降低成本,提高效率
有8位网友表示赞同!
数据中心的规模越来越大,云原生超级计算能有效应对吗?
有19位网友表示赞同!
文章提到“千万数据中心”,那指的是全球范围还是某个特定领域?
有12位网友表示赞同!
"51CTO.COM" 这家网站很专业啊,相信文章内容可靠
有16位网友表示赞同!
我想了解一下这种技术的安全性保障措施有哪些?
有11位网友表示赞同!
这个技术能够应用到哪些具体的行业和场景里呢?
有16位网友表示赞同!
云原生超级计算未来会有什么样的发展趋势呢?
有6位网友表示赞同!
这篇文章是否提供具体的案例分析?
有19位网友表示赞同!
对于普通人来说,这种技术的影响是什么?
有18位网友表示赞同!
希望以后也能更方便地学习和掌握这些新技术
有8位网友表示赞同!