1、先进计算助力科研探索01020304无处不在的计算先进计算助力科研探索精准化HPC方案期许与展望目录进一步考虑E级超算在解决人类共同面临的能源危机、环境污染和气候变化等重大问题上的巨大作用,在E级机的研制中加强协同,与综合性国家科学中心、科创中心等创新资源形成合力;白春礼HPC助力科研探索HPC助力大科学装置高能物理每日5TB数据数据保留10+年海量天文数据整合分析天体分析和挖掘天文大数据可视化扩展应用:农业、遥感、能源等HPC助力大科学装置FAST部分应用研究防灾减灾1.区域天气和气候灾害及次生灾害预测与防治2.洪水淹没范围遥感数据同化研究3.汶川地震发生过程的动力学模拟4.台风登陆前后异常
2、变化机理研究清洁能源1.光伏电站功率预测与环境关系研究2.大型风电场风电量短期预报模式系统生态农业1.旱区多遥感平台农田信息精准获取技术集成与应用2.全球大宗作物遥感定量监测关键技术3.高分辨率全国农作物产量预测大气污染防治1.大气污染预报与调控模式2.京津冀地区城市化对大气边界层和区域环境气候的影响研究气象气候1.街区可分辨气象数值模拟技术研究2.高分辨率气候系统模式的研制与评估3.高分辨率区域气候模式开发与业务化HPC助力大科学装置地球模拟器1实验2理论3计算模拟4大数据研究疫苗研制高能物理气候研究新型材料生物医学生态环境地球模拟类人智能科学研究l 计算已经无处不在,但支撑科学进步的本质从
3、未改变。l 满足科学研究的需要是HPC系统的唯一目标。l 应用的支撑是衡量的重要指标无处不在的计算多元融合的计算模式、概念、技术和应用科学计算数据密集型计算类脑计算量子计算终端计算边缘计算人机物三元融合计算云计算网络计算人工智能深度学习智能计算并行计算高性能计算计算机大型机小型机个人电脑智能手机超级计算模拟仿真神经网络服务器智慧计算无边界计算认知计算低功耗计算雾计算光子计算2014年11月,“中科院先进计算技术创新与产业化联盟”正式成立中科院首个技术创新与产业化联盟,曙光作为理事长单位与研究所(特别是应用类)紧密结合,重点面向国家在高性能计算、云计算、大数据等应用领域的技术与装备的需求,开展协
4、同研发和产业化应用推广,建立成果孵化转化平台联盟的成立,符合新时期国家深化科技体制改革的政策精神,是中科院深入推进“率先行动”计划,服务国民经济主战场的重要举措,对中科院探索“两链嫁接”的有效途径和模式具有重要的示范意义中国科学院院长 白春礼中科院先进计算中心与产业联盟曙光与中科院大气所合资公司,布局生态环境大数据。曙光与中科院电子所合资企业,专注于地理空间大数据处理国内领先的指静脉生物识别技术厂商和身份认证解决方案提供商。曙光与VMware首家合资企业,依托曙光多年自主研发基础,保障云安全国标审查。中科曙光发展思路曙光科学大数据引擎EasyOP在线运维服务机房基础设施:机房、机柜、配电、空调
5、等通用计算节点胖节点协处理器节点计算网络存储系统监控管理网络网络安全集群功能节点HPC基础软件环境集群监控管理软件作业调度软件应用Web PortalHPC应用:物理、化学、材料、生命科学、CAE、气象、海洋、环境、遥感、天文、高能物理、石油物探、动漫渲染、金融基础设施层硬件资源层基础软件层应用软件层先进计算服务先进计算服务平台(计算力)科技创新服务平台(创新力)产业创新服务平台(生态环)中科曙光HPC布局图:某超算中心计算资源在各学科的分布HPC应用特征分析主频稳定在2.8GHz(Base)AVX指令调用数4000-8000波动(HPL的1/10)性能大部分依赖高主频,AVX有一定收益主频内
6、存读AVX指令集内存写内存读带宽36GB/s,写带宽55GB/s内存访问密集,内存带宽敏感HPC应用特征分析材料计算2 个刀片(4颗CPU)共享1 个 100Gb/s Multi-Host InfiniBand刀片型号CX20-G30CPU2 个 Intel Xeon E3-1200 v6 系列 CPU内存8 个 DDR4 DIMM 插槽硬盘2 个本地 2.5 寸 SATA/SSD 硬盘或 2 个内置 M.2 PCIe SSD网络100Gb/s InfiniBand(2个刀片共享)PCIe 3.0E3-1200 v5刀片应用测试结果l 高主频直接性能提升,对AVX加速提供进一步补偿l Mult
7、i-host提供高性价比组网方案l 节约软件license费用,充分发挥软件license效能配套资源高主频计算资源M-ProBlade1CPU0Blade1CPU1Blade2CPU0Blade2CPU2100Gb/s Multi-Host IBM-Pro加速效果1.以大批量串行(或小规模并行)任务为主要特性,任务量通常在数百以上2.通常开启超线程运行,相比关闭状态性能提升(内存足够情况下提升更明显)3.内存消耗较大,通常每线程4GB左右4.大批量任务、庞大的基因数据带来存储巨大压力(带宽和IOPS)高负荷生物信息应用的存储负载(分布式存储)BWA应用的4K小数据块读写操作HPC应用特征分析
8、生物信息1.以生物信息为代表的应用,任务量大,需要足够多的物理计算核心2.打开超线程可提升性能,不同于传统hpc应用(通常关闭)3.海量任务批次提交,瞬间提升存储压力4.生物信息、天文等海量数据存储,数据密集型业务l基于全新的 Zen 架构,性能大幅提升l单处理器最多 32核心l每颗处理器 8个 内存通道,双路实测性能 280GB/s需求驱动资源分区曙光A620-G30配套资源AMD计算资源数据、元数据分离保障元数据性能全冗余配置保障系统高可用;支持透明分级存储提升性价比;分布式锁机制改善小文件读写;RDMA协议提供超高读写性能;配套存储分布式并行存储Parastor曙光Xmachine系列异
9、构计算节点、SuperBox深度学习平台、图形工作站人工智能曙光视觉计算产品线双路Skylake CPU; 3 UPI支持8个3.5”热插拔盘位支持4个双宽GPU加速卡额外支持2个PCIe3 x16插槽(1+1)冗余2000W钛金电源X580-G30双路Skylake CPU; 3 UPI支持8个2.5”热插拔盘位支持6个双宽GPU加速卡额外支持1个PCIe3 x16插槽(1+1)冗余2000W铂金电源X740-G30双路Skylake CPU; 3 UPI支持24个2.5”热插拔盘位支持8个双宽GPU加速卡额外支持2个PCIe3 x16插槽(2+2)冗余1600W铂金电源X780-G30支持
10、20个PCIe 3.0 X16插槽,同时支持20个人工智能在线处理加速器最大支持1TB内存SupreBox双路机塔互换支持3个双宽图形显示卡冗余电源W560-G20人工智能SoThisAI平台l8Ul223 3D-Torusl6 32-ports 页板l前面板192 100Gbps QSFP 接口l后面板48 400Gbps Torus互联接口l管理模块l液冷制冷曙光硅元交换机曙光硅元交换机4/5/6D-Torus3D-Torus 硅元交硅元交换机换机高可扩展网络硅元交换机作业调度Portal可视化作业提交远程三维设计调度管理桌面管理可视化+计算曙光Gridview4.0管理调度系统p专业的7*24小时高性能计算机远程运维p高性能计算专家在线咨询服务p智能化,自动化运维服务p大数据在线分析在线运维平台EasyOP新型材料污染治理天文探索产业联盟E级机先进计算n曙光希望依托在HPC、先进计算、E级技术领域的技术积累,更好的为中国科研事业,做出更多贡献!期许与展望