中国移动人工智能基础平台前瞻性布局和实践

项目背景

随着智能化网络新时代的到来,通信网一方面将充分吸收和利用人工智能技术,提高网络运营、服务和管理等全链条的智能化水平,成为人工智能的使用者和受益者;另一方面,也将极大地促进和带动人工智能应用和产业的发展,成为人工智能的推动者和赋能者。人工智能将是5G时代或者智慧网络时代的一项重要技术,无线网、核心网、传输网等各个层面都离不开人工智能。

为了迎接网络新时代的到来,中国移动正在积极探索,打造下一代智慧网络,目前中国移动已经逐步形成比较清晰完整的发展思路,也全面启动了人工智能布局和研发实践。


需求简介

中国移动研究院本项目主要满足中国移动为面向智慧运营和智慧服务而加快构建人工智能关键技术平台和能力,开展人工智能领域核心算法的应用研究和创新,构建其基础的人工智能某平台,主要面向智慧连接、智慧决策、智慧服务等各种场景,提供深度学习平台等基础服务,以及智能语言、人脸图像识别等核心能力,并在网络智能化、市场营销、客户服务等领域开展人工智能应用。

GPU服务器的硬件系统满足高可靠性、高可用性、高可扩展性,符合应用要求下的高性能设备。支持集群和冗余技术,支持主备用或N+1冗余、负载分担和磁盘阵列等技术,保证系统高可靠的数据和不间断工作的能力。

总体技术要求:

1)  满足特定业务的具体配置要求;GPU卡方面主要需求为≥8块;支持NVIDIA P40或P100 等GPU;

2)  基于通用X86架构的机架式服务器,支持标准19英寸机架式安装;

3)  最优的性能功耗比;

4)  能够在18℃-30℃环境温度下长时间稳定运行;

5)  支持良好的远程监控、管理能力;

6)  支持当前主流的服务器操作系统和虚拟化软件,包括Ubuntu Linux、CentOS、Windows 2008 Server,以及VMWare、Hyper-V、Xen、KVM等。

7)  配置CUDA7.5及以上版本,安装深度学习开源工具如TensorFlow、CNTK、Caffe、Torch等。


解决方案

曙光AI产品系列中的GPU服务器主要面向中高功率密度数据中心和标准19’机架,并能够实现灵活采购和部署的一类GPU服务器。其中本次采用的4U8卡GPU服务器主要面向有高可用性、高可靠性、高可扩展性需求的高密度计算环境,特别适合人工智能中的深度学习应用场景。

W780-G20采用Intel极具成熟度的E5-2600 V4系列处理器,为用户的各项应用提供更好的适配性和更高的性能。本次实配两颗处理器,每处理器搭配12根内存插槽,共24根内存插槽,最大可以支持3TB ECC LRDIMM内存,集成高性能SATA控制器,支持最多达24颗热插拔2.5吋硬盘,同时支持8颗业内主流加速器产品。

对满足需求的GPU卡与本项目选用的GPU服务器进行系统稳定性测试和GPU卡性能测试,并提供相关测试方法和测试报告,有力的验证了产品的稳定性和高性能。   

购买咨询 售后咨询 电话咨询