【天极网服务器频道】近日2015英特尔信息技术峰会(IDF15)在深圳举行。IDF是由英特尔公司主办的技术盛会,峰会内容具有相当的前瞻性,是未来IT行业发展的风向标。IDF15上英特尔展示了其在实感计算、物联网、可穿戴设备解决方案Curie等最新计算体验内容。重点分享了对企业级数据中心应用技术和市场方面的最新洞察,以及基于凌动处理器X3、X5、X7架构内容。
浪潮作为英特尔全球重要的合作伙伴,出席IDF15,并重点展示面向深度学习、人工智能应用的协处理加速整机柜服务器SmartRack。从而推动这一全球热点技术能够采用更高密度、智能化和高效率的创新IT基础设施。
深度学习需要HPC提速
深度学习是当下最热门IT技术之一,包括谷歌、百度等众多的顶级互联网公司,都将该技术视作大数据时代最具价值的一项技术。这一概念源于人工神经网络的研究,其动机在于建立、模拟人脑进行分析学习的神经网络,让机器能够像人一样思考。
深度学习的表现方式是通过构建深层神经网络,来模拟人类大脑的工作原理,进而实现类似人脑思维方式的计算形式。我们知道,大脑的复杂程度不言而喻的,因此深度学习所构建的神经网络也相当庞大,运行过程中需要海量的计算能力,这为高性能计算提供了全新用武之地。作为高性能领域的领先企业,浪潮已经着手面向深度学习、人工智能应用的IT基础架构方案的开发工作。
IDF15浪潮展出的SmartRack配置了领先的协处理加速方案,可支持GPU、MIC以及定制的FPGA芯片,是专为机器学习开发的高性能计算设备。针对机器学习的SmartRack相比一般性的计算产品性能提升百倍,密度提升4倍,尤其适合于百度大脑、Google大脑等前沿机器学习和大数据处理领域。
从本质上来说,深度学习是一项大数据工程,需要通过建立有效的学习模型,让机器从数以百万计的图像、声音和文本数据中,自行总结出某种特定事物的特征,从而实现自主学习。因此,实现机器像人一样思考的一个关键前提是,需要有计算速度可以媲美人脑的高性能计算集群,来快速完成海量数据的处理并得出运算结果。如谷歌为了让机器识别猫脸,使用了运算能力达到千万亿次的超级计算机,相当于4年前全球最快的超级计算机。
不难看出,深度学习是一个烧钱的游戏,需要耗资数千万乃至数亿元来构建非常庞大的高性能计算集群。百度首席科学家吴恩达曾表示,几年前我开始了一个云项目,用1000台电脑建立十亿个连接点的神经元网络,但后来我意识到这是一项非常昂贵的技术,所以希望能用其他技术来代替这么多台电脑。最终,吴恩达团队借助协处理加速技术,只用了三台电脑就建立了十倍于过去的庞大神经网络。
正是由于协处理加速技术在一些高度并行和计算密集型等应用中,有着非常优秀的加速表现,目前越来越多的高性能计算集群正在采用异构加速技术。据统计,采用MIC协处理器的TOP500超级计算机数量正逐渐增长,从2012年8月的1套增长到2014年6月的19套;在排名前十的超级计算机中,有2套使用了MIC协处理器,分别是排名第一的天河二号和排名第六的惊跑(Stampede)。
浪潮前瞻布局协处理加速技术
作为当前主流的协处理加速技术之一,MIC在兼容性、易用性和扩展性等方面都具有优势,并且通过众核来实现粗粒度运算,通过指令级并行来实现细粒度运算,实现了二者的兼顾,受到越来越多用户的认可。
不过,虽然MIC延续了大多数程序都采用的英特尔架构,但加速效率的高低,依然很大程度上取决于对操作系统、工具软件等应用程序的上重新编写和优化效果,这也让用户在使用过程中面临着MIC优化的门槛。
作为国内最早与英特尔成立浪潮英特尔MIC并行计算联合实验室的厂商,浪潮在MIC应用优化领域取得了丰厚的成果。目前,该实验室已经完成石油勘探PSTM、气象预报Grapes、生命科学ET、计算金融BSDE、流体力学LBM_LES、计算物理GTC、天文计算Gridding、计算电磁MOM、工程仿真GRMES Solver等十几个领域的MIC并行优化应用,并正在从事面向深度学习领域的Caffe和石油勘探领域的PSDM两大应用的并行化开发。其中,Caffe深度学习计算框架是浪潮首款独立开发并进行开源的基于Caffe深度学习计算框架(这款计算框架实现了多机多卡的数据并行处理)。
目前,浪潮已经推出面向深度学习、人工智能的协处理加速整机柜服务器,面向新风数据中心(自然风冷数据中心)的高温耐腐蚀整机柜服务器,面向大数据存储、社交网站的冷存储整机柜服务器,面向现阶段云计算、虚拟化的高密度计算整机柜服务器,以及面向热数据处理、搭载SSD硬盘的高性能存储整机柜服务器,构建了全球最完整的整机柜服务器产品阵列。