首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 377 毫秒
1.
如何协调地在同一个多线程中完成定时任务和随机任务以及数据交换是多线程程序设计的一个重要任务。文中总结分析了2种多线程的实现方法,即用户接口线程方式和工作者线程方式。为了在同一多线程中执行定时任务和随机任务,将多种任务封装成一个对象,在多线程中根据指令进行调度。文中将多线程看作一个虚拟的下位机,主线程等采用串行通信协议的原理实现与多线程之间的多种任务复杂数据交换和通信。  相似文献   

2.
基于MPI(Message Passing Interface)并行计算平台,开发了高效的并行多层快速多极子算法程序,可用于飞行器等目标RCS计算分析。为提高通信效率、增加程序的鲁棒性,提出了优化的通信措施,分析了点对点通信、阻塞通信、非阻塞通信的使用优缺点,针对RCS计算,组建了完整的通信方法,从而有效防止死锁的发生。算例证明,程序能胜任于电大尺寸的RCS散射计算,具有较高的精确度。  相似文献   

3.
传统有限元串行计算技术耗时长、效率低,已远远不能满足工程实践需要。通过分析串行计算的耗时分布、程序可并行性及数据相关性,在保持串行程序不变的基础上,采用基于多线程的OpenMP技术实现单元刚度矩阵形成总体刚度矩阵的程序并行化。针对有限元计算机翼实例进行了不同线程数目下并行加速比的研究,结果表明,OpenMP技术可有效提高有限元计算效率,且存在一个最佳的线程数,使得并行加速比达到最大,此外加速比还与问题的计算量等因素有关。  相似文献   

4.
李铮  李峭  熊颖  熊华钢 《航空学报》2014,35(11):3082-3091
为了在航空电子全双工交换式以太网(AFDX)中更加灵活地对虚拟链路(VL)实行接纳控制,将OpenFlow引入AFDX网络中,建立了相应的网络模型、消息模型和流量模型。利用网络演算方法分析了优先级VL在基于OpenFlow的AFDX网络中的端到端延迟上界,结合粒子群优化算法,提出了动态优先级接纳控制算法。理论分析结果表明:与动态非优先级接纳控制方法和传统静态优先级分配方法相比,本算法的消息延迟分别降低了49.2%和26.4%,并且本算法能够更加灵活地对VL实行接纳控制,提高网络资源的利用率。最后通过仿真对理论分析的结果进行了验证。本算法为提高接纳控制方法的性能提供了参考,增强了AFDX网络的通信效率与实时性能。  相似文献   

5.
针对大数据排序算法的需求,提出了基于任务驱动的并行排序算法。该算法采用任务驱动、AIO(Asynchronous Input/Output,异步输入/输出)和双缓冲区机制等技术充分利用系统资源;通过构造等价排序键,优化快速排序算法;并在算法实现上,采用多线程处理任务,通过控制线程个数控制并行度。综合利用这些技术,该算法使得大数据的排序性能接近理论极限值,在CPU(Central Processing Unit,中央处理器)资源充裕的情况下,利用异步压缩技术,还可以突破这一极限,最终实现的系统2 000s就可以对超过500Gbyte的磁盘数据做一次完整的排序。在数据库设计中充分利用此思想,将会实现连接和线程的分离,数据库将可以支持更大的连接数,从而提高数据库支持的并发度。  相似文献   

6.
在综合航电系统的设计中,利用计算机等先进手段模型多路数据总线(MIL-STD-1553B总线)的通信过程,完成多路数据总线通信系统消息的优化设计,对提高整个系统的效率有着重要的意义,本文讨论了多路数据总线通信系统消息传输的优化设计方法。  相似文献   

7.
多核处理器平台上使用OpenMP编译指令优化n皇后算法   总被引:2,自引:0,他引:2  
简要介绍了OpenMP多线程编程模型,对n皇后算法进行了改进并在多核处理器平台上使用OpenMP编译指令进行优化。优化后的算法运行速度有了显著提高。  相似文献   

8.
介绍扑翼式微型飞行器的虚拟仪器测控系统结构,以及为避免多线程中死锁的关键问题,建立基于安全队列的多线程技术动态实验测量系统。以微型飞行器风洞动态实验为对象,解释了基于安全队列的多线程技术应用于动态测控实验的优势。通过某扑翼式MAV进行吹风试验和频率谱计算,进一步验证了动态测量的正确性。  相似文献   

9.
基于Windows系统环境下的精确定时过程实现   总被引:8,自引:0,他引:8  
首先阐述Windows系统环境下的消息处理机制;然后对Windows下几种常用精确定时器进行比较;最后设计一种基于多线程技术的高精度定时器。通过实际测试,验证了该定时器的高精度性能,很好地实现了以毫秒级定时的通信任务。  相似文献   

10.
AFDX虚拟链路路径实时寻优算法   总被引:2,自引:0,他引:2  
航空电子全双工交换式以太网(AFDX)使用虚拟链路(VL)进行消息数据流通信,为提高AFDX的网络实时传输性能,以VL路径配置寻优为基础,提出了一种基于遗传算法的AFDX VL路径优化算法(POGA)。POGA以提高网络实时性为优化目标,并综合考虑网络负载均衡,以VL的路径信息作为染色体,通过遗传算子进行遗传寻优操作,选择促使AFDX网络实时性能最优的VL路径作为优化结果。利用仿真优化方法对POGA进行了实现,在典型AFDX网络1 000条VL的配置下,与负载均衡算法和最短路径算法进行了分析对比,结果显示分别有76.4%和77.4%的VL的传输实时性得到了增强,网络的实时传输性能分别提高了13.2%和12.9%。  相似文献   

11.
王年华  常兴华  赵钟  张来平 《航空学报》2020,41(10):123859-123859
常规工程应用中,非定常数值模拟(如多体分离)的计算量十分巨大,如果为了达到更高的计算精度,加密网格或者采用高精度方法将会使得计算量进一步增大,导致非定常数值模拟在CFD工程应用中成为十分耗时和昂贵的工作,因此,提高非定常数值模拟的可扩展性和计算效率十分必要。为充分发挥既有分布内存又有共享内存的多核处理器的性能和效率优势,对作者团队开发的非结构网格二阶精度有限体积CFD软件(HyperFLOW)进行了混合并行改造,在计算节点间采用MPI消息传递机制,在节点内采用OpenMP共享内存的MPI+OpenMP混合并行策略。首先分别实现了两种粒度(粗粒度和细粒度)的混合并行,并基于国产in-house集群采用CRM标模(约4 000万网格单元)定常湍流算例对两种混合并行模式进行了测试和比较。结果表明,粗粒度在进程数和分区数较少的小规模并行时具有效率优势,16线程时效率较高;而细粒度混合并行在大规模并行计算时具有优势,8线程时效率较高。其次,验证了混合并行在非定常计算情况下的可扩展性,采用机翼外挂物投放标模算例,分别生成3.6亿和28.8亿非结构重叠网格,采用对等的(P2P)网格读入模式和优化的重叠网格隐式装配策略,网格读入和重叠网格装配耗时仅需数十秒;采用3.6亿网格,完成了非定常状态效率测试及非定常分离过程的湍流流场计算,在in-house集群上12 288核并行效率达到90%(以768核为基准),在天河2号上12 288核并行效率达到70%(以384核为基准),数值模拟结果与试验结果符合良好。最后,在in-house集群上采用28.8亿非结构重叠网格进行了4.9万核的并行效率测试,结果显示,4.9万核并行效率达到55.3%(以4 096核为基准)。  相似文献   

12.
多块并行计算中负载平衡策略及时间成本估算方法   总被引:2,自引:0,他引:2  
研究了三维Euler方程的全隐式无分裂方法的多块分布式并行算法.为提高并行效率,给出了一种负载平衡方法,负载平衡前后的墙上时间、并行效率的比较验证了该方法的有效性.针对研究所用的大型并行机特性,基于最小二乘原理,给出了一种估算计算时间成本和通讯时间成本的方法,并行算法的并行性能统计表明该估算方法的有效性及合理性.不同流场的数值模拟表明,多处理器并行计算得到的数值结果能够和单处理器上的串行结果保持一致.  相似文献   

13.
在发动机控制系统设计中,为了缩短设计周期、降低研发成本,需要建立面向控制的、较为精确的、实时性高的超燃冲压发动机性能计算模型,以保证模型精度、提高计算速度为研究目标,基于多核高性能计算仿真平台,开展了面向控制的超燃冲压发动机一维模型实时性优化工作。运用简化计算流程、改进C语言程序、开拓缓存区等方法有效提高了一维模型计算速度。创新性地尝试了计算流体力学并行化方法,对隔离段和燃烧室一维模型进行结构分解。计算网格平衡分配至多个中央处理器,并借助核间数据通讯实现多核并行计算。与串行模型计算结果对比,七核并行计算模型性能参数偏差不超过0.1%,全工况仿真时间小于30ms,计算耗时较优化前缩短了75%以上。实时性优化后的多核并行模型计算精度高、速度快、收敛性好,可以作为超燃冲压发动机控制系统设计和半实物仿真验证平台。  相似文献   

14.
应用自动优化方法进行大涵道比风扇叶片三维气动设计,数值最优化采用遗传算法,并利用网络通讯协议实现多CPU并行优化,大幅度缩短优化耗时.对风扇叶片型面、叶片积叠线、子午面流道、叶型安装角和叶型弦长采用基于修改量的参数化方法、结合遗传算法设计参数范围限制,以达到优化过程生成个体的可控制、合理性.采用Denton黏性体积力方法进行流场计算,较大程度减少流场计算耗时,进一步缩短优化时间.以提高设计点风扇效率、保持设计点总压比和流量不变为优化目标,并对非设计点性能进行全工况校核.通过两次不同设计参数设置的优化,最终优化风扇效率由09463提高到09560;稳定裕度由112%增加到219%.最终优化风扇叶尖处激波前马赫数略有下降,且激波向通道内倾斜,因此激波及激波造成的附面层损失下降,且稳定裕度增加.   相似文献   

15.
航空公司使用多年的某国产民用飞机性能软件,在障碍物限重计算准确性方面虽能获得较满意的结果,但计算时间较长。分析该软件所用计算模型计算效率较低的原因,通过对比采用最小改平高和采用最大改平高两种模型的计算结果和计算效率,建立优化模型,计算不同障碍物、不同风速条件下,优化模型与原模型的障碍物限重、改平高度和计算时间,并进行比较分析。结果表明:两种模型的障碍物限重和改平高度计算结果基本相同;无障碍物时,不论有风无风,采用最小改平高的优化模型相对采用最大改平高的原模型均可减少计算时间25%;有障碍物时,无风情况下,采用最小改平高的优化模型可减少计算时间78% 以上,有风时,则可减少计算时间75% 以上。采用最小改平高的模型可以兼顾准确性和高效性。  相似文献   

16.
系统阐述了PAR2 0 0 0并行计算机系统的通讯机制和消息管理策略 ,给出了节点机的运算处理模块和通讯处理模块的通讯处理设计思想 ,定义了消息传递协议。这种消息处理方式解决了消息堵塞问题 ,能够有效地实现节点机与HOST机、节点机与节点机之间的消息传递。  相似文献   

17.
A block-structured adaptive mesh refinement (AMR) method was applied to the computational problem of acoustic radiation from an aeroengine intake. The aim is to improve the computational and storage efficiency in aeroengine noise prediction through reduction of computational cells. A parallel implementation of the adaptive mesh refinement algorithm was achieved using message passing interface. It combined a range of 2nd- and 4th-order spatial stencils, a 4th-order low-dissipation and low-dispersion Runge–Kutta scheme for time integration and several different interpolation methods. Both the parallel AMR algorithms and numerical issues were introduced briefly in this work. To solve the problem of acoustic radiation from an aeroengine intake, the code was extended to support body-fitted grid structures. The problem of acoustic radiation was solved with linearised Euler equations. The AMR results were compared with the previous results computed on a uniformly fine mesh to demonstrate the accuracy and the efficiency of the current AMR strategy. As the computational load of the whole adaptively refined mesh has to be balanced between nodes on-line, the parallel performance of the existing code deteriorates along with the increase of processors due to the expensive inter-nodes memory communication costs. The potential solution was suggested in the end.  相似文献   

18.
适用于空间通信的LDPC码GPU高速译码架构   总被引:1,自引:0,他引:1  
鉴于目前空间通信对高速、可重配置信道译码器的需求,利用图形处理器(GPU)的并行化运算特点,提出了一种低密度奇偶校验(LDPC)码软件高速译码架构。通过优化Turbo消息传递译码(TDMP)算法节点更新运算线程块内和块间并行度、减少非规则行重造成的线程分支、降低线程对节点更新信息存储资源的访问延时以及合理量化译码器存储信息来提升译码内核函数的执行效率。并在此基础上引入异步统一计算设备构架(CUDA)流处理机制,设计优化的译码器输入输出数据传输和内核函数之间的执行调度方式以及CUDA流上的译码线程资源配置方式,最大化译码吞吐率的同时降低译码延时。在Nvidia最新的Tesla K20和GTX980平台上对国际空间数据系统咨询委员会(CCSDS)遥测标准LDPC码进行的TDMP译码实验结果表明,本架构进行10次迭代译码的吞吐率最高可达约500 Mbps,平均译码延时约为2ms左右。与现有结果相比,本架构在保持软件架构配置灵活性的同时更加有效的兼顾了译码吞吐率和延时性能。  相似文献   

19.
一种DSMC方法的并行策略   总被引:1,自引:1,他引:0  
黄飞  苗文博  程晓丽  沈清 《航空学报》2014,35(4):968-974
为提高直接模拟蒙特卡罗(DSMC)仿真模拟的并行计算效率,基于消息传递接口(MPI)的并行环境,通过对比分析主从模式及对等模式两种程序设计模式下的并行效率,探讨了对等模式下非结构网格DSMC并行程序实现的关键技术及实施途径。提出了一种非结构网格下动态负载平衡DSMC仿真模拟的并行策略,设计了基于对等模式动态负载平衡的DSMC并行算法。最后以钝锥外形的高超声速绕流问题进行仿真模拟,验证本文并行算法的有效性,结果表明,本文设计的基于对等模式动态负载平衡的DSMC并行算法能够以高效的并行效率给出合理的结果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号