稀疏矩阵向量乘法在申威众核架构上的性能优化 - 中国知网 (cnki.net)
输入:tiles,nnz_tile,ROWS输出:setnnz_set<-0for i = 0 to tiles - 1 do Select id if nnz_set[id] is minimal //注意:这里是选从核行,不是矩阵带 nnz_set[id] += nnz_tiles[i] set[id] = set[id]U{i} //任务分配end for
这里注意,我们在固定划分那里解决了数据局部性差等问题,之后的一二维划分,都是在做任务分配,核心计算子矩阵小块一直未改变
此内容由惯性聚合(RSS阅读器)自动聚合整理,仅供阅读参考。 原文来自 — 版权归原作者所有。