运营商

面对通信运营商行业云计算、智能计算、绿色计算、边缘计算等IT及ICT领域的需求增长及变化。曙光提供云平台建设、大数据平台建设、云存储平台建设、深度学习集群平台建设、态势感知平台建设以及绿色机房建设等一系列具有通信特性的解决方案。助力通信行业IT发展及ICT融合


首页 > 行业解决方案 > 运营商 > 通信行业深度学习集群解决方案

通信行业深度学习集群解决方案

GPU等强大计算设备的发展为深度学习提供了基础设施支撑。GPU的众核体系结构包含了大量的流处理器,矢量运算可以并行进行,对于矩阵运算的加速效果非常明显,而深度网络在训练过程中需要进行大量的矩阵运算,GPU无疑成了深度模型训练方面的首选方案之一,利用GPU训练深度网络可以充分的发挥计算核心的并行计算能力,在海量训练数据的情况下,耗费时间短,使用服务器数量也变得更少。

设备性能高

GPU服务器的硬件系统满足高可靠性、高可用性、高可扩展性

管理高效

集群管理软件和运维管理软件,提供全方位的服务、高效的计算、简化的集群管理

优化深度学习服务

深度学习框架、任务调度系统、容器技术提供计算服务,实现服务功能和管理模式的多样化

方案架构

深度学习解决方案.jpg

计算层:针对不同深度学习场景,可以搭载多颗GPU的不同类型GPU服务器,在整个计算层中成为了核心计算单元。同时,在计算层中针对集群管理和桌面服务等非核心计算部分采用通用机架服务器支撑。

网络层:网络层主要包括物理网络传输、集群管理调度、人工智能平台三个部分。网络传输部分,对于深度学习网络模型训练时,除了满足可以提供强大计算能力的GPU之外还需要保证PCI-E的传输带宽,对于多机情况,需要能提供更好网络带宽的网络设备来保证整个系统的数据传输效率,减少网络数据传输带来的影响;集群管理调度需要对计算集群整体状态和计算节点的实时状态进行监控和分析,并形成实时的可视化数据报表;人工智能平台需要提供对深度学习开发环境的快速部署,并要针对深度学习开发,对运算资源按照训练任务进行分割和分发。

存储层:存储层主要用于存放计算数据,在高性能计算中,数十个或者上百个计算节点需要有一个统一映像的共享存储,使用并行文件系统把所有的存储阵列统一为一个大的存储,而并行文件系统能够满足用户这个需求。

深度学习集群方案适用于通信行业客户对于智慧运营、智慧连接、智慧服务、智能营销、智能决策、智慧网络、智能物联、智能客服、互动娱乐等不同领域的业务需求及探索。

方案价值

产品推荐

X580-G30
天阔X580-G30 GPU服务器是曙光公司精心打造的一款性能卓越、稳定可靠、配置灵活的全新一代双路Intel Scalable系列至强处理器服务器产品,适合深度学习、高性能计算等应用。
查看详情 >
X795-G30
天阔X795-G30服务器是曙光基于Intel最新的Purley平台开发的一款高性能双路服务器,主要面向深度学习用户。X795-G30最大可以支持2TB LRDIMM内存,集成高性能SATA控制器,支持最多达24颗热插拔2.5吋硬盘,同时支持8颗英伟达NVLink2.0通信协议的加速器产品,如此强大的扩展性足以支撑HPC任务的运行,特别适合深度学习用户进行离线网络训练环境。
查看详情 >
X785-G30
天阔X785-G30服务器是曙光基于Intel最新的Purley平台开发的一款高性能双路服务器,主要面向深度学习用户。X785-G30最大可以支持3TB LRDIMM内存,集成高性能SATA控制器,支持最多达24颗热插拔2.5吋硬盘,同时支持8块双宽或16块单宽NVIDIA GPUs加速卡,如此强大的扩展性足以支撑HPC任务的运行,特别适合深度学习用户进行离线网络训练环境。
查看详情 >
X745-G30
天阔X745-G30服务器是曙光基于Intel最新的Purley平台开发的一款高性能双路服务器,主要面向深度学习用户。X745-G30最大可以支持2TB LRDIMM内存,集成高性能SATA控制器,支持最多达24颗热插拔2.5吋硬盘,同时支持4块双宽或8块单宽NVIDIA GPUs加速卡,如此强大的扩展性足以支撑HPC任务的运行,特别适合深度学习用户进行离线网络训练环境。
查看详情 >
购买咨询 售后咨询 电话咨询