深度学习训练案例
项目背景
某医院用户主要研究利用深度学习方法对医疗影像大数据进行医学影像处理,开发基于磁共振、超声、CT的人工智能辅助诊断系统。
现代医学是建立在实验基础上的循证医学,医生的诊疗结论必须建立在相应的诊断数据上,影像是重要的诊断依据,医疗行业80%~90%的数据都来源于医学影像。所以临床医生有极强的影像需求,他们需要对医学影像进行各种各样的定量分析、历史图像的比较,从而能够完成一次诊断。
“人工智能+医学影像”便是计算机在医学影像的基础上,通过深度学习,完成对影像的分类、目标检测、图像分割和检索工作,协助医生完成诊断、治疗工作的一种辅助工具。
人工智能在图像处理上的能力分为四类:影像分类、目标检测、图像分割和图像检索。

核心需求
用户打算建设一套深度学习训练平台,开发人工智能辅助诊断算法,用于磁共振、超声、CT等医疗影像大数据的快速处理,以及其他科研分析任务。要求平台预装Windows和Ubuntu双操作系统,支持同时运行Caffe,TensorFlow,Pytorch等深度学习框架软件。要求多台GPU服务器分散布置,又可以统一管理。由于单位暂时没有服务器专用机房,希望GPU服务器静音设计,适合办公室使用环境。最重要的是,GPU服务器需要支持多块GPU卡,计算能力强大。
解决方案
根据我们对用户深度学习训练平台需求的分析,结合用户医学影像处理的特点、当前计算规模大小、硬盘读写速度和存储需求量等一系列的因素,从满足应用需求的角度出发,建立一套性能强劲、低噪音、易管理维护的GPU集群系统。方案核心是采用了支持4块宽主动散热GPU卡、整机静音设计的GPU塔式服务器风虎云龙T40。

机器软件方面,风虎云龙深度学习训练服务器出厂预装TensforFlow,Pytorch等常用或者客户指定的深度学习框架,集成CUDA开发环境,cuBlas,cuFFT,cuSparse,cuDNN等多种函数库,安装Ubuntu,Windows等多种操作系统,部署机器管理系统和作业调度系统软件。
方案价值
高性能
风虎云龙T40是一款性能强大的塔式GPU服务器,支持4块双宽主动散热GPU卡,每块GPU卡支持高达5,120 CUDA核心,显存高达32GB,最大功耗:250W。支持2颗Intel Xeon Scalable系列处理器,每个处理器支持高达28核心,最大功耗:205W。16根DDR4内存插槽,支持DDR4 2933/2666MHz ECC REG内存,最大支持2TB内存。1个M.2 2280、22110 SSD硬盘位,最大支持2TB M.2 SSD。12个3.5"固定SATA3硬盘位,最大支持240TB存储。
低噪音
风虎云龙T40塔式GPU服务器,采用大口径、低转速的散热风扇,风量大散热能力强,而噪音较低。整机静音设计,适合办公室使用。
易管理维护
所有深度学习训练的GPU服务器都通过千兆以太网连接起来,构成统一的IP网络环境,部署集群管理软件和作业调度系统。集群管理软件提供节点管理、用户管理、任务管理、状态监控等多种功能,任务管理不仅支持CPU调度,还支持GPU调度。网络方面不仅支持普通以太网的通信管理,还支持高带宽、低延迟的Infiniband网络。在集群状态监控上,系统提供一整套基于WEB的组件用于监控自身的活动及配置状况,如处理器、内存及交换分区使用情况、网络负载、节点状态和当前计算任务的进展等。系统为每个用户提供一个接口,用户通过这个接口提交自己的计算任务,计算完成后会反馈结果给用户,用户只用指定需要的资源,如CPU核心数、GPU数,而不用关心程序是在哪个节点,使用哪个CPU、GPU完成的。用户还可以对自己的队列进行管理,如:提交任务后可以查看自己任务的工作状态,改变多个任务的执行顺序,暂停或删除已提交任务。
相关产品推荐