高性能加速计算解决方案.ppt

上传人(卖家):三亚风情 文档编号:3385940 上传时间:2022-08-26 格式:PPT 页数:31 大小:4.91MB
下载 相关 举报
高性能加速计算解决方案.ppt_第1页
第1页 / 共31页
高性能加速计算解决方案.ppt_第2页
第2页 / 共31页
高性能加速计算解决方案.ppt_第3页
第3页 / 共31页
高性能加速计算解决方案.ppt_第4页
第4页 / 共31页
高性能加速计算解决方案.ppt_第5页
第5页 / 共31页
点击查看更多>>
资源描述

1、版权所有 2014 西安中唐测控技术有限责任公司高性能加速计算解决方案高性能加速计算解决方案版权所有 2014 西安中唐测控技术有限责任公司技术概括技术概括 FPGA浮点应用 FPGA在浮点运算中的优势高性能计算板介绍高性能计算板介绍案例介绍案例介绍 矩阵求逆实测指标 4K超采样实时浮点FFT介绍主要内容3第五代军事领域中FPGA浮点应用 Air,Land,Sea,Space,CyberEO/IRSARAutonomous NavigationTarget Recognition Mission Computer EOTS Cockpit Display AESA EW-RWR,Jammer

2、Remote Sensing On-board data analytics Waveform processing STAP,GMTILong range search radarClose range defenseSense&AvoidAutonomous NavigationData AnalyticsMassive matrixprocessingBLASSignal ProcessorData ProcessorCFARTarget DetectionRemote Controlled Gun TurretAnti-IED Jammer beam formingAnti-Snipe

3、r signal processingAnti-Air Defense Signal Processor Data Processor Beamforming Target Detection EW Jammer CFARMissile GuidanceKalman Filtering版权所有 2014 西安中唐测控技术有限责任公司4商业中FPGA浮点应用 Compute&StorageOil&Gas Seismic CalculationsData Centers Search AnalyticsSecurity Facial Recognition Artificial Intellige

4、nceFinance Market Risk Analysis Best price algorithms Real Time Heading valuationResearch Bioinformatics Quantum Chemistry Life SciencesManufacturing Mold and Flow Fluid Dynamics Structural Mechanics版权所有 2014 西安中唐测控技术有限责任公司5Single precision(32 bits,float in C)1823Sign0=positive1=negativeexponent:Inc

5、ludesbias of 127Mantissamagnitude with hiddenone bit:1.MActual exponent ise=E-127SEMMagnitude of numbers that can be represented is in the range:which in decimal is approximately:Reserved cases:E=0,E=255Mantissa range:1.0(M=all zeros)to 2 223 (M=all ones)X=(-1)S 2E-127(1.M)0 E 2551.2 x 10-38 to 3.4

6、x 10382-126(1.0)to 2127(2 2-23)IEEE-754 单精度浮点标准版权所有 2014 西安中唐测控技术有限责任公司版权所有 2014 西安中唐测控技术有限责任公司n现代阵列雷达系统采用了具有数字 信号处理功能的各种模式,包括,搜索、识别、跟踪、锁 定和监控等模式。大部分这 些雷达系统,无论是机械操作还是电动工作,现在都通过数字方式处理信号,支持使用软件驱动波形的多种模式,从而提高了系统灵活性。雷达系统技术雷达系统技术版权所有 2014 西安中唐测控技术有限责任公司关键技术关键技术n聚束滤波-实现技术:浮点多相FIR,浮点FFTn空时自适应处理-实现技术:浮点矩阵分解

7、求逆(QRD_INV)n其他:-恒定虚警率(CFAR)处理-脉冲压缩版权所有 2014 西安中唐测控技术有限责任公司实现技术技术nHPC(high performance compution)-密集型的矩阵运算在信号处理和图像处理中被广泛应用,FPGA的运 算速度快并且可以并行运算和其它矩阵运算(如DSP处理器)的实现方式 相比,FPGA有其独特的优势。n浮点运算浮点矩阵相对于定点矩阵有更宽的动态范围,更高的精度(没有截位误差)。目前的FPGA和设计工具已经可以较好的支持单,双精度的矩阵运算。同时,下一代altera FPGA会支持单精度硬浮点处理,将极大提升浮点矩阵处理的能力。版权所有 20

8、14 西安中唐测控技术有限责任公司实现技术技术数字波束形成(DBF)技术在现代雷达和通信系统中的应用越来越广泛。它利用数字信号处理的方法形成多个独 立的波束。每个波束的主瓣对准期望方向,零陷对准干扰源方向。浮点矩阵求逆是DBF的一个核心算法。目前国内客户通常采用dsp处理器(TS201或TI6678),但性能难以满足要求。版权所有 2014 西安中唐测控技术有限责任公司Device Altera Stratix V 5SGSD8Texas Instruments TMS320C6678Resources695 kLEs50 Mbits block mem 3926 multipliers48

9、TRX(14 GSPS)8 cores,fixed and SP floating point 1.25 GHzPeak GMACs(16x16 or 18x18)2350(3926 multipliers 600 Mhz)320(40 GMACs per core)Peak GFLOPs(single precision)1000(see 1 TeraFlop whitepaper)160(20 GLOPs per core)1024 length floating point FFT performance(single precision)3.41 us(1024 clock cycle

10、s 300 MHz)10.26 us(12800 clock cycles 1.25 GHz)Aggregate 1024 length FFT transform time0.17 us(20 FFTs per device)1.28 us(8 FFTs per device,1 per core)FPGA verses DSP Processors版权所有 2014 西安中唐测控技术有限责任公司FPGA verses DSP ProcessorsFPGA与DSP对比结果计算速度高,可以使雷达更快速的进行捕获和单位时间可以发现更多的目标;一片FPGA可以代替多片DSP芯片;系统成本和复杂度大

11、大降低;功耗极大的缩小,体积变小。版权所有 2014 西安中唐测控技术有限责任公司高性能计算板卡高性能计算板卡版权所有 2014 西安中唐测控技术有限责任公司高性能计算板卡高性能计算板卡版权所有 2014 西安中唐测控技术有限责任公司高性能计算板卡高性能计算板卡硬件主要特性:FPGA板卡级别:普通级,型号:ZT-D5-KIT 中间级,型号:ZT-D6-KIT豪华级,型号:ZT-D8-KIT内置多达1963个精度可调DSP模块资源内置多达1,049,600个寄存器内置多达262,400个ALM版权所有 2014 西安中唐测控技术有限责任公司高性能计算板卡高性能计算板卡硬件主要特性:存储 标准DD

12、R3 SO-DIMM SDRAM 1.用于大容量数据缓存 2.两条SO-DIMM,每条最大容量支持8GB;3.总容量最大支持16GB;4.最大工作频率支持1066MHz 5.位宽每条均为64bit QDRII+SRAM 1.用于快速、低延时数据缓存 2.总容量为36Mbit;3.最大工作频率支持533MHz 4.位宽18bit;版权所有 2014 西安中唐测控技术有限责任公司高性能计算板卡高性能计算板卡硬件主要特性:接口(一)SFP+光纤接口 1.4路标准SFP+光纤通道 2.支持10G标准万兆以太网 3.支持1.25G12.5G自定义通讯 PCI-Express 1.PCI-Express

13、X8 Edge 2.支持Gen1和Gen2标准协议 3.支持2.5G和5.0G自定义通讯版权所有 2014 西安中唐测控技术有限责任公司高性能计算板卡高性能计算板卡硬件主要特性:接口(二)FMC扩展接口 1.标准FMC扩展通道 2.可连接标准FMC子卡如:AD、DA等 SATA接口 1.SATA HOST接口 2.STAT DEVICE接口 3.支持STAT I、STAT II版权所有 2014 西安中唐测控技术有限责任公司高性能计算板卡高性能计算板卡硬件主要特性:接口(三)Rapid IO接口 1.高速串行收发接口 2.可支持1.25G10.625G速率 1Gbps 以太网RJ45接口 1.

14、标准1Gbps以太网 2.支持TCP/IP、UDP等标准协议 3.支持自定义通讯协议版权所有 2014 西安中唐测控技术有限责任公司实际测试介绍实际测试介绍测试方法总体框图版权所有 2014 西安中唐测控技术有限责任公司实际测试介绍实际测试介绍测试实物图示版权所有 2014 西安中唐测控技术有限责任公司实际测试介绍实际测试介绍12维复数浮点矩阵求逆矩阵算法版权所有 2014 西安中唐测控技术有限责任公司实际测试介绍实际测试介绍12维复数浮点矩阵求逆矩阵算法版权所有 2014 西安中唐测控技术有限责任公司实际测试介绍实际测试介绍12维复数浮点矩阵求逆矩阵算法12 X 12 维复数矩阵;全流水线结

15、构处理;单精度浮点数运算;运行频率矩阵设备时延 矩阵数据间隔156MHz20.36us9.59us200MHz15.91us7.49us版权所有 2014 西安中唐测控技术有限责任公司实际测试介绍24维复数浮点矩阵求逆矩阵算法版权所有 2014 西安中唐测控技术有限责任公司实际测试介绍24维复数浮点矩阵求逆矩阵算法版权所有 2014 西安中唐测控技术有限责任公司实际测试介绍24维复数浮点矩阵求逆矩阵算法24 X 24 维复数矩阵;全流水线结构处理;单精度浮点数运算;运行频率矩阵设备时延 矩阵数据间隔156MHz53.46us23.18us200MHz41.77us18.11us版权所有 201

16、4 西安中唐测控技术有限责任公司实际测试介绍72维复数浮点矩阵求逆矩阵算法版权所有 2014 西安中唐测控技术有限责任公司实际测试介绍72维复数浮点矩阵求逆矩阵算法72 X 72 维复数矩阵;全流水线结构处理;单精度浮点数运算;运行频率矩阵设备时延 矩阵数据间隔156MHz319.88us119.65us200MHz249.91us93.48us版权所有 2014 西安中唐测控技术有限责任公司实际测试介绍对比对比DSP-TS201BW100本板卡本板卡12维矩阵150us-16us24维矩阵-165us42us72维矩阵-249usDSP与FPGA各维数矩阵求逆对比结果:版权所有 2014 西安中唐测控技术有限责任公司实际测试介绍从实际结果对比来看:FPGA优势明显优势明显计算速度高,可以快速完成多维矩阵求逆计算;在12维单精度浮点复数矩阵求逆中,FPGA比DSP计算速度快近近1010倍;倍;实现DSP无法完成的高维如72维矩阵求逆计算;单片FPGA完成高维矩阵计算,节约成本;版权所有 2014 西安中唐测控技术有限责任公司实际测试介绍超采样浮点FFT算法超采样可达10Gbps符号率 4x4K单精度浮点数定点支持单精度和双精精度

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(高性能加速计算解决方案.ppt)为本站会员(三亚风情)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|