1. 网站首页
  2. 社区
  3. 论坛
  4. 博客

基于OpenBLAS实现四精度三角矩阵

资料大小: 0.54 MB 所需积分: 2 下载次数: 用户评论: 0条评论,查看 上传日期: 2017-11-22 上 传 者: 程林他上传的所有资料

资料介绍

标签:OpenBLAS(1)
  在ARMv8 64位多核处理器上基于OpenBLAS实现了四精度三角矩阵求解(QTRSM)。基于两种数据格式分别实现了QTRSM,第一种实现利用GCC编译器对long double数据类型的支持来实现QTRSM,第二种实现采用doubledouble数据格式及其相应的四精度加减法、乘法和除法。以long double数据类型QTRSM为测试基准,就不同矩阵规模下测试结果精度和时间与doubledouble数据格式QTRSM进行比较。实验结果表明:两者得到近似相同精度的数值结果,但doubledouble数据格式QTRSM的性能是long double数据类型QTRSM的1.6倍。随着线程数的增加,两种QTRSM实现的加速比接近2.O,具有较好的可扩展性。
 

下载地址

基于OpenBLAS实现四精度三角矩阵下载

用户评论

查看全部 条评论
发表评论请先 , 还没有账号?免费注册

发表评论

用户评论
技术交流、我要发言! 发表评论可获取积分! 请遵守相关规定。
上传电子资料

88lifa利发国际娱乐

百度360搜索搜狗搜索