首页 | 本学科首页   官方微博 | 高级检索  
     

基于Pentium Pro的高性能BLAS的设计与实现
作者姓名:李忠泽
作者单位:北京航空航天大学 计算机科学与工程系
基金项目:国家"八六三"高技术计划(863-306-ZD-03)资助项目
摘    要:支持科学和工程计算的BLAS(基本线性代数子程序)在高性能计算中有着重要作用.本文针对Pentium Pro的体系结构特点,提出了一些优化方法使得BLAS在Pentium Pro上计算性能达到最佳.测试表明,在200MHz的Pentium Pro上BLAS3的速度可达112Mflops.

关 键 词:线性代数  最佳化  寄存器  [BF]基本线性代数子程序(BLAS)[BFQ]  高速缓存    循环展开
收稿时间:1998-04-21
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《北京航空航天大学学报》浏览原始摘要信息
点击此处可从《北京航空航天大学学报》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号