人工智能新技术实验床


人工智能新技术实验床(泰)是全球首个大规模开放性AI实验床。该实验床为制定以人工智能为代表的新技术标准提供依据,为验证和展示新技术提供平台,具备大规模复杂场景构建能力,提供新技术实训教育平台和欣秀科教交流工具。


实验床建设目的



(1)实验床是建设产业生态的加速器。该实验床将为制定以人工智能为代表的新技术标准提供依据,其将客观评价新技术,并发布技术性能榜,具体包括IoT(端)、Edge(边缘)、数据中心和高性能计算机人工智能评测基准和性能榜。

(2)实验床“‘泰’具备大规模复杂场景构建能力,将为验证和展示新技术提供平台。实验床也可模拟未来智能设备的验证环境。

(3)实验床提供新技术实训教育平台和欣秀科教交流工具,将发挥推广和培训新技术、培养人才的作用。

(4)“国际人工智能系统大赛”将在该实验床上举办,赛程包括寒武纪、X86和RISC-V等芯片上的系统竞赛以及云天励飞算法竞赛,将凝聚全世界的智慧,为自主可控的智能计算生态添砖加瓦。特等奖为10万元人民币。

实验床节点分布



实验床由国际测试委员会(BenchCouncil)联合中科院计算所、国家超算中心深圳中心、俄亥俄州立大学、中科云达、寒武纪、工信部中国软件评测中心、之江实验室、中国开放指令生态(RISC-V)联盟和西安交通大学等国内外单位建设,将由北京尖峰新锐信息科技研究院和国家超算中心深圳中心进行管理维护。

其中,实验床节点分布中国北京、天津、深圳、南京、浙江、新加坡、美国等地,节点内硬件涵盖典型数据中心服务节点、GPU测试群、RISC-V云,以及寒武纪测试节点等。

实验床架构



实验床服务提供多种主流测试环境,测试环境秒级生成,可提供定制化测试环境,可根据需求提供测试节点或节点集群。在性能监控方面提供用户权限隔离、用户行为监控、性能监控和资源调度等。实验床集合了多种State-of-practice的硬件环境,包括不同型号的GPU、CPU、AI智能芯片(寒武纪)、RISC-V云平台等.


大数据AI实训平台


优势特色:
1.完善的教学体系: 知识体系+教材体系+实验资源;
2.高性价比: 一台100万的软硬件一体化平台可以满足100人同时教学的需求,计算能力不小于40TFLOPS & 400TOPS;
3.软硬件一体化:免除用户采购、组装、运维等烦恼,便于移动(采用定制可移动机柜);
4.全图形化操作:所有实训功能基于Web访问的GUI(图形用户界面);
5.一键式安装部署:通过GUI界面实现实训的安装部署。实训平台包括主流大数据和AI软件栈(TensorFlow、Caffe、Spark、Hadoop、Flink、Hive、Spark SQL、MPI);
6.全球竞赛 :作为国际测试委员会(BenchCouncil)测试床的节点接入Testbed。不仅可以获取全球领先的大数据AI技术平台的使用,还可以参与每年一度的国际测试委员会全球竞赛。



亮点系统和应用


人工智能新技术实验床部署了典型的人工智能测试系统和应用,包括基于图系统的高效分布式图计算框架Cymbalo,基于联邦学习的边缘计算测试床、EB级高能物理平台、阿里巴巴的商业验证环境和基于AI的天气预报系统等。

基于联邦学习的边缘计算人工智能实验床


边缘计算有着许多人工智能的场景,而在这些场景中数据保密性往往是很重要的,于是我们推出了一个结合联邦学习框架的边缘计算人工智能实验床。 以ICU数据进行心脏骤停预测为例,各个医院可以在本地训练自己的ICU病人数据模型,然后通过我们实验床的联邦学习框架,对各个医院的模型进行加密后上传云端,配合其他不同的模型得到一个更为精确的参数,然后解密返回的参数进行进一步的训练或是推理。


EB级高能物理平台


随着科学大装置、大仪器的发展,实验性科研探索将逐渐演化为高通量密集型数据筛选、索引与重构。针对高能物理实验中事例数据与现有存储介质高效结合策略改善存储结构紧耦合产生的效率问题,通过元数据、分布式实现大规模事例数据分布式存储、快速查询与管理,利用并行处理、多维度索引、I/O 缓存等技术 实现大规模事例数据环境下的低延迟抽取和高通量回写,结合事例数据服务接口与标准规范,最终在不影响现有科学实验软件运行的前提条件下,实现万亿级(EB级)事例数据的高效管理与分析。


阿里巴巴的商业验证环境


阿里巴巴搜索Benchmark是针对阿里巴巴搜索场景定制的应用级Benchmark。现代互联网服务的架构已由传统单体软件转向微服务架构,服务间的依赖关系复杂,单个服务超时会导致整个服务超时,QoS(延迟、吞吐率)难以保证,且机器学习等技术已广泛应用于互联网服务,机器学习尤其是深度神经网络对计算资源的需求徒增,更加剧了这一问题。搜索作为互联网服务的典型代表,能体现微服务部署的复杂性及机器学习在其中的应用。借助搜索benchmark,可以评估服务器选型,指导新硬件设计等。


基于AI的天气预报


极端天气分析是科学计算领域的最重要的问题之一,准确鉴别各类极端天气的特征是解决这一问题的基础。传统的鉴别方法都是基于领域专家定义的多元阈值,然而这种方法有人为的主观性,不同专家定义的标准各不相同,从而导致了不准确的鉴别。本应用将深度学习的方法应用于极端天气分析,采用FasterRCNN鉴别各类极端天气,验证准确率超过了90%,表明了深度学习在这领域应用的巨大潜力。