共查询到20条相似文献,搜索用时 835 毫秒
规约是并行应用最常用的集合通信操作之一,现存规约算法存在2方面主要问题。第一,不适应复杂环境,当计算环境出现干扰时,规约效率显著降低。第二,不支持容错,当节点发生故障时,规约被迫中断。针对上述问题,提出一种基于任务并行的高性能分布式规约框架。首先,该框架将规约拆分为一系列独立的计算任务,使用任务调度器以保证就绪任务被优先调度到具有较高性能的节点上执行,从而有效避免了慢节点对整体性能的影响。其次,该框架基于规约数据的可靠性存储和故障侦听机制,以任务为粒度,可在应用不退出的前提下实现故障恢复。在复杂环境中的实验结果表明,分布式规约框架具有高可靠性,与现有规约算法相比,规约性能最高提升了2.2倍,并发规约性能最高提升了4倍。 相似文献
2.
一个面向数据密集型网格的通信模型 总被引:4,自引:0,他引:4
在由多计算机集群构成的数据密集型网格环境下,为了解决通信峰值阶段的通 信冲突问题,提出了一个多级分组通信模型MGCM(Multi-level Grouping Communica tion Model)).给出了由多机群组成的数据密集型网格数据节点DGDN(Data-intensive Grid Data Node)和完全图通信等形式化定义.利用主动队列、被动队列机制,研究了单个机群内的分组通信算法GCA(Grouping Communication Algorithm)以及双机群内的计算机之间的完全图通信问题GCAD(Grouping Communication Algorithm in Double computer clusters). 基于网络距离机制、GCA和GCAD,设计了DGDN上的多级分组通信模型.理论分析和实践表明 ,该模型有效地解决了数据密集型网格环境下通信峰值所造成的并行计算效率低下的问题. 该模型适合于基于网格的数据密集型并行计算. 相似文献
3.
基于分布式并行遗传算法的电力系统无功优化 总被引:1,自引:0,他引:1
针对传统遗传算法寻优质量差、计算时间长的问题,提出了基于计算机集群的一种新的分布式并行遗传算法解决电力系统无功优化问题.采用遗传模拟退火算法和分布式并行计算MPI(Message Passing Interface)技术,实现多进程的分布式集群计算.该算法通过个体迁移策略来协调优化各个子种群,使用计算效率来判断计算负载状态,采用动态种群来进行负载平衡.通过运用标准测试算例IEEE14节点和一个实际电力系统的无功优化计算,结果表明这种算法具有很高的稳定性,有较好的并行效率,适合求解大规模电力系统的无功优化问题. 相似文献
4.
基于分布式平台开展一种新的时域有限差分(FDTD)并行算法研究,该算法基于VC++、CUDA5.0平台开发,调用Intel MPI 4.1.0库进行测试,在上海交通大学高性能计算中心图形处理单元(GPU)集群、上海超级计算机中心的“魔方”商用超级计算机以及国家超级计算济南中心的“神威蓝光”国产超级计算机等平台开展软件调试。通过对纯CPU、GPU以及CPU和GPU的混合测试,线程调度水平、核心函数处理速度得到明显提升,同时减少了通信执行时间比例,提高了加速比和并行效率,最后以2×2微带阵列为验证模型进行拓扑优化测试,结果证明该算法准确、有效。 相似文献
5.
针对嵌入式图像匹配计算特点,采用TMS320C6X系列处理器作为并行神经处理单元,设计了 一种基于TMS320C6X系列处理器HPI(Host-Port-Interface)互连的神经网络图像匹配多处理机系统,在这种并行计算系统中,包括一个主控计算单元和三个并行神经计算单元,主控计算单元通过HPI接口与各个神经匹配处理单元直接连接,通过HPI接口,主控计算单元可以直接访问各个神经元的片上和片外存储器,实现实时图像数据的直接转发和神经元中间运算结果的读取.理论分析表明,该设计可有效优化神经计算结构,提高图像匹配的实时性. 相似文献
6.
网络计算环境下任务调度问题研究 总被引:5,自引:0,他引:5
利用网上空闲处理机组成机群并行计算环境是快速增长的研究领域,任务调度是其中最关键性的问题之一.在基于消息传递机制的网络并行计算环境下,针对一类大粒度计算任务并行时协同同步工作问题,发展了一种新的静态调度模型,提出了调度算法,它映射一类特殊的并行程序任务到由网络上若干空闲处理机组成的机群中.研究表明该算法能减少此类并行程序的完成时间. 相似文献
7.
随着图形处理器(GPU)的快速发展,基于计算设备统一构架(CUDA)可以方便地将并行计算技术应用于超声声场数值仿真计算,极大地提升计算效率。阐述了弹性动力学有限积分算法(EFIT)的原理,在采用CPU实现带吸收边界的钢材料二维点源激励声场仿真的基础上,基于GPU实现了仿真模型的并行计算,介绍了GPU程序的设计流程和参数优化方法,包括纹理内存使用、吸收边界优化和数据传输优化。对比了相同条件下CPU和GPU仿真计算的耗时和平均计算效率,定量分析了GPU对于EFIT模型效率的提升。比对结果表明,EFIT具有良好的并行计算条件,采用并行计算方法能够有效提升模型计算速度,对于复杂声场仿真应用具有广阔的应用前景。 相似文献
8.
Enrico Mai Robin Geyer 《Advances in Space Research (includes Cospar's Information Bulletin, Space Research Today)》2014
This article outlines necessary steps to perform numerical orbit integrations based on a Lie series approach. Its implementation requires an efficient evaluation of resulting series coefficients. As an example we treat the classical main problem in satellite orbit calculation (J2 only) and the case of a 4×4-gravity field. All calculations were performed in very high precision with up to 100 significant digits. In comparison to independent third party computations this approach led to superior results referring to the verifiable constancy of various integrals of motion. To achieve a performance similar to classical numerical integrations in terms of acceptable computing time, at least for non-Keplerian motion problems, we exploited parallel computing capabilities. For our examples, run times were improved by several orders of magnitude, depending on the actual chosen precision level (up to a factor of 50,000 in case of double precision). Here we present the mathematical framework of the proposed orbital integration scheme as well as the work flow for its application in a multi-core, parallel computing environment. 相似文献
9.
提出一种将OpenGL应用在目标红外辐射特性计算中,从而实现目标红外辐射特性可视化计算的方法.由于OpenGL可用于构造三维模型,进行三维图形交互软件的开发;因而将其引入红外辐射特性计算中可解决复杂目标计算问题,而且图形硬件的消隐能力避免了遮挡计算并使计算以所见即所得的方式实现可视化.针对目标红外辐射特性中的自身辐射和目标对太阳光的反射部分,分别运用光照模型中发射光和漫反射的特性,以像素的颜色获取温度参数和法矢从而实现可视化计算.用一个简单标准体模型进行验证,计算结果表明了该方法的有效性和可行性. 相似文献
10.
卫星上计算资源有限,星载嵌入式处理器处理遥感影像的配准时通常需要很长的时间。可编程逻辑门阵列(FPGA)利用其内部可编程器件可用于加速图像处理。提出了一种基于Xilinx公司的ZYNQ芯片加速ORB算法的遥感影像配准方法,可用于3000×3000像素尺寸的卫星图像配准,缩短了计算耗时,提升了ORB算法的计算能效比。利用FPGA能够实现真正的并行计算电路,实现ORB算法多支路单层流水线的并行计算结构。采用软硬件结合的方法实现架构,能够处理不同分辨率的图像,可灵活配置特征点的数量。基于设计的加速ORB配准方法,获得了较高准确率。与软件实现相比,OVS-1A遥感影像偏移精度损失低于0.05个像元;GF.4遥感影像偏移精度损失小于0.9个像元。将ORB配准算法流程应用在ZYNQ7020上,耗时减少了57.50%。 相似文献
11.
为解决大尺寸构件快速ICT(Industrial Computed Tomography)成像问题,提出了一种通过检台2次偏置扩大扫描视场的ICT成像方法,并基于三代ICT投影数据存在的冗余特征,推导了它的投影数据重排预处理方法和滤波反投影(FBP,Filter Back-Projection)重建算法.该重排预处理方法建立了扇束投影数据与平行束投影数据间的函数映射关系,可将探测器在2个扫描位置采集的2组不完整扇形射束投影数据重排成一组完整的平行射束投影,从而使后续重建得以进行.计算机仿真结果表明,该方法在重构大尺寸构件图像时,获得了满意的质量.分析表明,在增加一次360°回转扫描情况下,其有效扫描视野达到标准三代ICT方法的2.8倍左右.该方法仅需CT扫描台具备平移和旋转自由度,易于与现有三代ICT兼容,工程实现方便. 相似文献
12.
基于云计算的航天器控制系统自组织体系结构 《空间控制技术与应用》2015,41(4):1-6
针对目前航天器控制系统中计算单元冗余备份过多但系统动态效能不足的问题,提出一种航天器控制系统自组织体系结构,通过高速对等网络将系统建立在云计算的基础上,取消单节点的冗余备份,以系统整体能力为单个节点做备份,当出现节点故障时动态迁移其程序和数据到其他正常节点以继续其功能,从而实现系统在故障时计算体系的动态聚合重构. 相似文献
13.
K.D. Moloto N.E. Engelbrecht R.D. Strauss D.M. Moeketsi J.P. van den Berg 《Advances in Space Research (includes Cospar's Information Bulletin, Space Research Today)》2019,63(1):626-639
Three-dimensional studies of the transport and modulation of cosmic ray particles in turbulent astrospheres require large-scale simulations using specialized scientific codes. Essentially, a multi-dimensional Fokker-Planck type equation (a parabolic diffusion equation) must be integrated numerically. One such approach is to convert the relevant transport equation into a set of stochastic differential equations (SDEs), with the latter much easier to handle numerically. Due to the growing demand for high performance computing resources, research into the application of effective and suitable numerical algorithms to solve such equations is needed. We present a case study of the performance of a custom-written FORTRAN SDE numerical solver on the CHPC (Centre for High Performance Computing) Lengau cluster in South Africa for a realistic test problem with different set-ups. It is shown that SDE codes can scale very well on large parallel computing platforms. Finally, we consider an extremely computationally expensive application of the SDE approach to cosmic ray modulation, studying the behaviour of galactic cosmic ray proton latitude gradients and relative amplitudes in a physics-first manner. This is done using a modulation code that employs diffusion coefficients derived from first principles, which in turn are functions of turbulence quantities in reasonable agreement with spacecraft observations and modelled using a two-component turbulence transport model (TTM). We show that this approach leads to reduced latitude gradients qualitatively in line with spacecraft observations of the same, without making ad hoc assumptions as to anisotropic perpendicular diffusion coefficients as are often made in many cosmic ray modulation studies. 相似文献