专利名称 ---【 一种适应于“神威·太湖之光”上HPCG优化的数据结构及其高效实现方法 】

基本信息
申请号
CN201710353362.2
申请日
20170518
公开(公告)号
CN107273094B
公开(公告)日
20171020
申请(专利权)人
中国科学院软件研究所;无锡江南计算技术研究所
申请人地址
100190 北京市海淀区中关村南四街4号
发明人
敖玉龙;杨超;刘芳芳;尹万旺;魏迪;袁欣辉;蒋丽娟; 专利类型 发明专利
摘要
本发明公开了一种适应于“神威·太湖之光”上HPCG优化的数据结构及其高效实现方法,基于“神威·太湖之光”上的申威众核处理器体系结构特征和HPCG算法优化的需要,使用了改进ELL格式的数据结构对原始数据结构进行替换,除了包含矩阵数据本身的数据结构,还支持分块着色,索引转换,进程通信,以及向量位置映射等相关的数据结构,并且中间处理过程采用了申威众核平台提供的Athread多线程库进行并行,最终应用于HPCG算法的核心函数SpMV和SymGS优化过程中,相应的性能和带宽百分比取得了一致性的加速比,最高分别为18.2和17.6。
主权项
1.一种适应于“神威·太湖之光”上HPCG优化的数据结构,其特征在于:所述数据结构为自定义数据结构,所述自定义数据结构包括:经典ELL格式中的矩阵值vals数组和对应索引idx数组,利用额外的对角线元素diags数组来存放矩阵的对角线元素,还提供了分块着色相关和进程通信相关的数据结构,其中color_reordering存放分块着色之后新的块行顺序,color_info记录每种颜色的块行数量和位置;element_send标识当前进程向其他邻居进程所发送数据的位置信息,element_recv标识当前进程接受来自于其他邻居进程所数据所存放的位置信息;最后,为了减少直接访问主存的次数和支持计算过程中使用寄存器通信机制,分别增加了进程内索引到块内索引转换的数据结构loc2blk和外区索引向量的位置映射数据结构pos,通过使用该自定义数据结构,能够在国产申威众核平台上实现HPCG的高效并行计算。

 

IPC信息
IPC主分类号
G06F9/30

 

法律状态信息
法律状态公告日
20171020
法律状态
公开 法律状态信息
CN201710353362 20171020 公开 公开
法律状态公告日
20171117
法律状态
实质审查的生效 法律状态信息
CN201710353362 20171117 实质审查的生效 实质审查的生效IPC(主分类):G06F 9/30申请日:20170518
法律状态公告日
20200616
法律状态
授权 法律状态信息
CN201710353362 20200616 授权 授权

 

代理信息
代理机构名称
北京科迪生专利代理有限责任公司 11251
代理人姓名
杨学明;顾炜


| 联系我们 | 网站地图 | 版权声明 |

版权:中国科学院 主办:中国科学院科技促进发展局 承办:中国科学院成都文献情报中心 蜀ICP备05003827号-12

建议使用1024×768 分辨率 IE6.0以上版本浏览器