首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 835 毫秒
1.
    
规约是并行应用最常用的集合通信操作之一,现存规约算法存在2方面主要问题。第一,不适应复杂环境,当计算环境出现干扰时,规约效率显著降低。第二,不支持容错,当节点发生故障时,规约被迫中断。针对上述问题,提出一种基于任务并行的高性能分布式规约框架。首先,该框架将规约拆分为一系列独立的计算任务,使用任务调度器以保证就绪任务被优先调度到具有较高性能的节点上执行,从而有效避免了慢节点对整体性能的影响。其次,该框架基于规约数据的可靠性存储和故障侦听机制,以任务为粒度,可在应用不退出的前提下实现故障恢复。在复杂环境中的实验结果表明,分布式规约框架具有高可靠性,与现有规约算法相比,规约性能最高提升了2.2倍,并发规约性能最高提升了4倍。  相似文献   

2.
一个面向数据密集型网格的通信模型   总被引:4,自引:0,他引:4  
在由多计算机集群构成的数据密集型网格环境下,为了解决通信峰值阶段的通 信冲突问题,提出了一个多级分组通信模型MGCM(Multi-level Grouping Communica tion Model)).给出了由多机群组成的数据密集型网格数据节点DGDN(Data-intensive Grid Data Node)和完全图通信等形式化定义.利用主动队列、被动队列机制,研究了单个机群内的分组通信算法GCA(Grouping Communication Algorithm)以及双机群内的计算机之间的完全图通信问题GCAD(Grouping Communication Algorithm in Double computer clusters). 基于网络距离机制、GCA和GCAD,设计了DGDN上的多级分组通信模型.理论分析和实践表明 ,该模型有效地解决了数据密集型网格环境下通信峰值所造成的并行计算效率低下的问题. 该模型适合于基于网格的数据密集型并行计算.   相似文献   

3.
基于分布式并行遗传算法的电力系统无功优化   总被引:1,自引:0,他引:1  
针对传统遗传算法寻优质量差、计算时间长的问题,提出了基于计算机集群的一种新的分布式并行遗传算法解决电力系统无功优化问题.采用遗传模拟退火算法和分布式并行计算MPI(Message Passing Interface)技术,实现多进程的分布式集群计算.该算法通过个体迁移策略来协调优化各个子种群,使用计算效率来判断计算负载状态,采用动态种群来进行负载平衡.通过运用标准测试算例IEEE14节点和一个实际电力系统的无功优化计算,结果表明这种算法具有很高的稳定性,有较好的并行效率,适合求解大规模电力系统的无功优化问题.   相似文献   

4.
基于分布式平台开展一种新的时域有限差分(FDTD)并行算法研究,该算法基于VC++、CUDA5.0平台开发,调用Intel MPI 4.1.0库进行测试,在上海交通大学高性能计算中心图形处理单元(GPU)集群、上海超级计算机中心的“魔方”商用超级计算机以及国家超级计算济南中心的“神威蓝光”国产超级计算机等平台开展软件调试。通过对纯CPU、GPU以及CPU和GPU的混合测试,线程调度水平、核心函数处理速度得到明显提升,同时减少了通信执行时间比例,提高了加速比和并行效率,最后以2×2微带阵列为验证模型进行拓扑优化测试,结果证明该算法准确、有效。   相似文献   

5.
针对嵌入式图像匹配计算特点,采用TMS320C6X系列处理器作为并行神经处理单元,设计了 一种基于TMS320C6X系列处理器HPI(Host-Port-Interface)互连的神经网络图像匹配多处理机系统,在这种并行计算系统中,包括一个主控计算单元和三个并行神经计算单元,主控计算单元通过HPI接口与各个神经匹配处理单元直接连接,通过HPI接口,主控计算单元可以直接访问各个神经元的片上和片外存储器,实现实时图像数据的直接转发和神经元中间运算结果的读取.理论分析表明,该设计可有效优化神经计算结构,提高图像匹配的实时性.   相似文献   

6.
网络计算环境下任务调度问题研究   总被引:5,自引:0,他引:5  
利用网上空闲处理机组成机群并行计算环境是快速增长的研究领域,任务调度是其中最关键性的问题之一.在基于消息传递机制的网络并行计算环境下,针对一类大粒度计算任务并行时协同同步工作问题,发展了一种新的静态调度模型,提出了调度算法,它映射一类特殊的并行程序任务到由网络上若干空闲处理机组成的机群中.研究表明该算法能减少此类并行程序的完成时间.   相似文献   

7.
随着图形处理器(GPU)的快速发展,基于计算设备统一构架(CUDA)可以方便地将并行计算技术应用于超声声场数值仿真计算,极大地提升计算效率。阐述了弹性动力学有限积分算法(EFIT)的原理,在采用CPU实现带吸收边界的钢材料二维点源激励声场仿真的基础上,基于GPU实现了仿真模型的并行计算,介绍了GPU程序的设计流程和参数优化方法,包括纹理内存使用、吸收边界优化和数据传输优化。对比了相同条件下CPU和GPU仿真计算的耗时和平均计算效率,定量分析了GPU对于EFIT模型效率的提升。比对结果表明,EFIT具有良好的并行计算条件,采用并行计算方法能够有效提升模型计算速度,对于复杂声场仿真应用具有广阔的应用前景。   相似文献   

8.
This article outlines necessary steps to perform numerical orbit integrations based on a Lie series approach. Its implementation requires an efficient evaluation of resulting series coefficients. As an example we treat the classical main problem in satellite orbit calculation (J2J2 only) and the case of a 4×44×4-gravity field. All calculations were performed in very high precision with up to 100 significant digits. In comparison to independent third party computations this approach led to superior results referring to the verifiable constancy of various integrals of motion. To achieve a performance similar to classical numerical integrations in terms of acceptable computing time, at least for non-Keplerian motion problems, we exploited parallel computing capabilities. For our examples, run times were improved by several orders of magnitude, depending on the actual chosen precision level (up to a factor of 50,000 in case of double precision). Here we present the mathematical framework of the proposed orbital integration scheme as well as the work flow for its application in a multi-core, parallel computing environment.  相似文献   

9.
提出一种将OpenGL应用在目标红外辐射特性计算中,从而实现目标红外辐射特性可视化计算的方法.由于OpenGL可用于构造三维模型,进行三维图形交互软件的开发;因而将其引入红外辐射特性计算中可解决复杂目标计算问题,而且图形硬件的消隐能力避免了遮挡计算并使计算以所见即所得的方式实现可视化.针对目标红外辐射特性中的自身辐射和目标对太阳光的反射部分,分别运用光照模型中发射光和漫反射的特性,以像素的颜色获取温度参数和法矢从而实现可视化计算.用一个简单标准体模型进行验证,计算结果表明了该方法的有效性和可行性.  相似文献   

10.
卫星上计算资源有限,星载嵌入式处理器处理遥感影像的配准时通常需要很长的时间。可编程逻辑门阵列(FPGA)利用其内部可编程器件可用于加速图像处理。提出了一种基于Xilinx公司的ZYNQ芯片加速ORB算法的遥感影像配准方法,可用于3000×3000像素尺寸的卫星图像配准,缩短了计算耗时,提升了ORB算法的计算能效比。利用FPGA能够实现真正的并行计算电路,实现ORB算法多支路单层流水线的并行计算结构。采用软硬件结合的方法实现架构,能够处理不同分辨率的图像,可灵活配置特征点的数量。基于设计的加速ORB配准方法,获得了较高准确率。与软件实现相比,OVS-1A遥感影像偏移精度损失低于0.05个像元;GF.4遥感影像偏移精度损失小于0.9个像元。将ORB配准算法流程应用在ZYNQ7020上,耗时减少了57.50%。  相似文献   

11.
为解决大尺寸构件快速ICT(Industrial Computed Tomography)成像问题,提出了一种通过检台2次偏置扩大扫描视场的ICT成像方法,并基于三代ICT投影数据存在的冗余特征,推导了它的投影数据重排预处理方法和滤波反投影(FBP,Filter Back-Projection)重建算法.该重排预处理方法建立了扇束投影数据与平行束投影数据间的函数映射关系,可将探测器在2个扫描位置采集的2组不完整扇形射束投影数据重排成一组完整的平行射束投影,从而使后续重建得以进行.计算机仿真结果表明,该方法在重构大尺寸构件图像时,获得了满意的质量.分析表明,在增加一次360°回转扫描情况下,其有效扫描视野达到标准三代ICT方法的2.8倍左右.该方法仅需CT扫描台具备平移和旋转自由度,易于与现有三代ICT兼容,工程实现方便.   相似文献   

12.
针对目前航天器控制系统中计算单元冗余备份过多但系统动态效能不足的问题,提出一种航天器控制系统自组织体系结构,通过高速对等网络将系统建立在云计算的基础上,取消单节点的冗余备份,以系统整体能力为单个节点做备份,当出现节点故障时动态迁移其程序和数据到其他正常节点以继续其功能,从而实现系统在故障时计算体系的动态聚合重构.  相似文献   

13.
Three-dimensional studies of the transport and modulation of cosmic ray particles in turbulent astrospheres require large-scale simulations using specialized scientific codes. Essentially, a multi-dimensional Fokker-Planck type equation (a parabolic diffusion equation) must be integrated numerically. One such approach is to convert the relevant transport equation into a set of stochastic differential equations (SDEs), with the latter much easier to handle numerically. Due to the growing demand for high performance computing resources, research into the application of effective and suitable numerical algorithms to solve such equations is needed. We present a case study of the performance of a custom-written FORTRAN SDE numerical solver on the CHPC (Centre for High Performance Computing) Lengau cluster in South Africa for a realistic test problem with different set-ups. It is shown that SDE codes can scale very well on large parallel computing platforms. Finally, we consider an extremely computationally expensive application of the SDE approach to cosmic ray modulation, studying the behaviour of galactic cosmic ray proton latitude gradients and relative amplitudes in a physics-first manner. This is done using a modulation code that employs diffusion coefficients derived from first principles, which in turn are functions of turbulence quantities in reasonable agreement with spacecraft observations and modelled using a two-component turbulence transport model (TTM). We show that this approach leads to reduced latitude gradients qualitatively in line with spacecraft observations of the same, without making ad hoc assumptions as to anisotropic perpendicular diffusion coefficients as are often made in many cosmic ray modulation studies.  相似文献   

14.
    
智能卫星技术对卫星时间序列数据挖掘提出了越来越多的需求。通常卫星数据计算量都非常大,若串行执行则需要较长时间。以卫星异变过程多类型特征分析过程为典型代表,针对窗口划分与向量相似度计算、特征提取、傅里叶变换、聚类等常见数据挖掘操作,探讨了在多核CPU和GPU的典型异构计算节点中对时序数据挖掘过程进行并行优化的多种策略,包括向量化方法、多进程方法、GPU计算等方法。对这几种优化策略的适用情况进行了实验分析对比。结果表明,针对不同任务情况综合使用多种优化策略具有显著提升效果。  相似文献   

15.
网络分布式并行计算的负载平衡   总被引:2,自引:0,他引:2  
利用分布式系统动态负载平衡的原理,设计了一种适应网络分布式并行计算环境的负载平衡实现机制,采用集中式负载信息收集策略,集中和分布式相结合的传输控制策略.定义了一种新的复合型负载指标来衡量各处理机的负载程度.讨论了相应的理论和实现中的关键问题,给出了主要的实现策略和算法.仿真比较研究表明这种体系结构和相应策略能对网络环境下分布式并行计算提供有力支持.   相似文献   

16.
月球着陆器着陆安全分析方法   总被引:1,自引:1,他引:0  
月球着陆器软着陆地点选择及安全着陆实现是探月二期的关键问题.采用不考虑着陆器着陆过程中发动机控制、着陆姿态控制和动力学性能,在计算机上依据低精度月面数据和已有月面典型地形特征分布/形状模型仿真生成高精度着陆区域;根据着陆器的结构尺寸和着陆安全要求对每个安全参数进行计算、比较、判断得到单次着陆安全性,利用蒙特卡洛方法计算多次在仿真地形上的着陆安全概率.试验结果表明:采用这种方法时,着陆器的结构尺寸相同分析结果才有意义.在计算机上仿真生成着陆区域、设置着陆器结构尺寸和安全参数,使其可以用于地面系统的仿真实验,也可在月面软着陆过程中实时分析选定区域的着陆安全概率.  相似文献   

17.
在服务计算领域中,为了能够在大量具有相同功能的Web服务以及API等数据资源中选择适合用户的服务和接口,提出了服务推荐系统。当前常用的基于服务质量(QoS)的服务推荐系统所采用的模型假定服务的QoS值恒定不变,是一种由服务和用户的二元关系构成的二维静态模型。针对实际应用中,QoS是受到多种因素影响的变量这一问题,提出了一种可以描述多个影响QoS因素的张量模型,并利用张量分解算法来对服务推荐算法进行了改进。实验结果表明:提出的基于张量分解的服务推荐算法与6种现有算法相比较,预测服务的QoS值的绝对平均误差(MAE)不同程度地降低了20%~50%,并且所建模型能够描述更多的影响因素,从而可对服务进行动态推荐。   相似文献   

18.
卫星光学敏感器视场遮挡分析工具设计   总被引:3,自引:0,他引:3  
在卫星构型设计中,要进行视场遮挡分析来判断光学敏感器是否会因为受到卫星其它部件的遮挡而失效.为了取代以往低效的手工分析方法,设计了卫星光学敏感器视场遮挡分析工具.介绍了该工具的设计方法及功能.工具基于三维CAD软件SolidWorks,并以动态链接库(DLL,Dynamic Link Library)的形式与SolidWorks紧密集成.在设计中运用了计算机图形学原理,利用SolidWorks API函数和Visual Basic编程语言进行二次开发.工具能够在SolidWorks中对卫星装配体执行以下敏感器视场遮挡分析功能:定义敏感器视锥特性参数,绘制视场遮挡图和计算视场遮挡率.  相似文献   

19.
用板块法逼近目标表面外形,对物理光学积分离散化,求出每个板块上的散射场,得到目标外形对散射场贡献的三维分布特性,将可视化电磁学与计算机图形学结合,得到了一种确定目标强散射区暨雷达吸波材料涂敷区域的方法,并给出了一些计算结果.  相似文献   

20.
当工程结构参数包含不确定因素时,结构的固有频率也将是不确定的.这就需要讨论不确定性振动问题中广义区间特征值的求解方法.在Deif标准区间特征值求解定理的基础上,通过区间分析,将特征值的上下界分解成2个广义特征值问题进行求解.基于此求解方法的并行性分析,给出并行求解算法,克服了求解区间问题计算量大的缺点,使传统串行机或者串行算法难以解决的区间特征值问题得以较好的解决.   相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号