您当前的位置:首页>论文资料>并行计算方法研究与应用

并行计算方法研究与应用

资料类别:论文资料

文档格式:PDF电子版

文件大小:5.24 MB

资料语言:中文

更新时间:2024-11-19 18:00:52



推荐标签:

内容简介

并行计算方法研究与应用 数学热本与表用
并行计算方法研究与应用
刘师范
(中国电子科技集团公司第54研究所河北石家庄050081)
应用研究
摘要:介绍并行计算的基本概念,分析了MPI、OpenMP、CUDA与OpenCL四种并行计算端程技术的基本特点及适用场合。以MPI和OpenCL 两种端编程技术为列,实境了特征匹配算法和快速傅里叶变换算法,对它们的实验结果进行了分析和对比。
关键词:并行计算MPIOpenCL快速傅里叶变换
中图分类号:TP3
文献标识码:A
文章编号:1007-9416(2014)01-0109-02
高性能计算(HighPerformanceComputing)是当今社会计算机科学的一个重要分支,目的在于解决拥有大规模数据处理需求应用的性能问题。为将一个需要大规模处理的应用部署至高性能计算机上,需要研究相关的并行算法,开展并行计算(Para11e1 Computing)。并行计算相对于串行计算而言,广义上的并行计算可分为时间上的并行和空间上的并行,时间上的并行泛指流水线技术,而空间上的并行是指多个处理器并发地进行计算。并行计算科学中主要研究空间上的并行问题,即先将计算任务分解为若干个计算子任务,然后同时使用多个计算资源以快速解决一个大型且复杂的计算问题。
1并行计算方法
目前计算机均采用多核设计,然而将一个计算任务在该计算机上执行时,任务并不会智能化地自动分解至每个CPU核;将一个应用部署至一个高性能计算机集群,需要相应的辅助工具将任务进行分解,使用GPU协助CPU完成一个密集型计算任务处理,也需要辅助工具使得编程人员对任务能够可控,基于此,若干并行辅助工具应运面生,典型的有MPI,OpenMP,CUDA与OpenCL。
而设计并行程序需将计算任务进行分解后分配至不同的处理器进行处理,导致当前处理器在处理其字任务的过程中不可避免地需要与其它处理器的子任务进行数据交互,数据交互方法包括消息传递与共享存储。其中,MPI即属于一种基于消息传递的并行编程模型,而OpenMPCUDA和OpenCL则采用基于共享存储的并行模式,
1.1 MPI(Message Passing Interface)
MPI采用基于消息传递的并行模式,提供了一种与语言和平台无关,可以被广泛使用的编写消息传递程序的标准,最终目的是服务于进程间通信,其具体执行过程中,将可执行程序复制多份以形成多个独立进程,并分配至多个节点上独立执行,在需要数据交互时通过节点间网络进行通信。MPI适合于高性能计算机集群内各计算节点间的任务并行
1.2 OpenMP(Open MultiProcessor)
OpenMP为基于共享内存设计的并行模式,是一种支持多平台共享存储多处理API.用于共享内存并行系统的多线程程序设计的套指导性注释,即#pragma制导语句。
OpenMP采用线程的forkjoin模式,通过指定线程数,并加在可并行区域前,在进人区域时自动衍生出多线程以执行区域内计算任务,执行完成后连结成一个线程以继续完成后续非并行区域内任务处理。
1.3 CUDA(Compute Unified Device Architecture)
NVIDIA将其GPU大规模投人科学计算领域时,提出CUDA编程模型以辅助编程人员控制任务在CPU-GPU异构并行系统的分解与计算。
CUDA将CPU-GPU异构并行系统分为主机端(CPU)与设备端(GPU),主机端负责逻辑事务处理,设备端负责密集型数据计算。其执行过程分为三步:DCPU将原始数据经PCI-E总线拷贝至 GPU:2数据在GPU上进行加速处理:3处理结果再由PCI-E总线拷贝回CPU。
1.4 OpenCL(Open Computing Language)
OpenCL架构与CUDA类似,不同在于OpenCL作为一种标准,
目的是实现跨平台程序设计,如AMDGPU、NVIDIAGPU、CelI 处理器和DSP等。
使用OpenCL编程,可以实现可在不同平台上移植的并行加速代码,如设计同一OpenCLGPU程序可适用于AMDGPU,NVIDIA GPU
2MPI技术应用
传输系统识别是卫星通信侦察中的重要环节,以VSAT通信目标系统识别为例,通过采用已知传输系统特征字(曾如有LinkWay LinkWayS2,LinkStar和SkyWan等四种传输系统特征字)匹配信号解调后的码流文件,以进行传输系统误别。识别方法如图1所示,如至码流文件末仍未判别成功,则视其为未知传输系统。
特征字匹配过程并非大规模数据计算模块,而不同传输系统的特征字匹配可赋予不同的进程实现,此,该过程可在任务级进行分解,使用MPI进行并发式设计:创建四个MPI进程,每个进程负责
g11 10000 季书
LinkWayt UnkWays2
Skywi
第2益10000 kwayn LinkWavs27
Skywa
记录结果,轻库温出
图1VSAT通信目标系统识别示意图

10000字节
Pe ↓ aigWar:LinkWay 行 Pe ↓ /nig Hord]1]iLinkWayS2 Pe /elg Wond]2]:LiskStar urmyslclranbwa tod R
文 MPI
0000
+$ d I ed
10000字节
00节

祝录站里,设出理序亲进理训别点站
京喆果,品掉所有店
图2传输系统串行与并行识别对比
109
上一章:超宽范围输出可调开关电源 下一章:POTN技术与IP协同组网研究

相关文章

并行计算有限元法与工程应用 浅谈遥感图像并行处理的研究与应用 并行计算的内存访问方法 电力系统并行计算与数字仿真 蒙特卡罗固定源计算的并行设计与实现 面向4G通信的高性能计算技术:基带处理算法并行分解与实现 基于FPGA的并行蒙特卡洛计算加速器的设计与实现 高等时域有限差分方法:并行、优化、加速、标准和工程应用