xiangtingsl
发表于 2023-4-18 09:02
最简单的方法当然是调现有的库
Ilingis
发表于 2023-4-18 09:05
那是必须的
不过你可以考虑一下性价比,这个在不改变代码行数的情况下速度极大提升
闲鱼技术01
发表于 2023-4-18 09:10
机智
Ylisar
发表于 2023-4-18 09:11
所以我选择avx2,1024*1024矩阵乘法只要97ms(3950x单线程)
fwalker
发表于 2023-4-18 09:18
其实还要看哪种矩阵的乘法。
比如 是布尔方阵 求可达矩阵那种
那还有效率更好的方法。
redhat9i
发表于 2023-4-18 09:23
有相关的文章吗
KaaPexei
发表于 2023-4-18 09:33
http://www.huaxuejia.cn/ism/cal_compare_get_r_mat.php
上面是一个对比
http://www.huaxuejia.cn/ism/这个可以看看
不过一定是布尔方阵的
IT圈老男孩1
发表于 2023-4-18 09:36
请问最后的时间是在什么CPU上测的呢?
IT圈老男孩1
发表于 2023-4-18 09:45
intel i7
DungDaj
发表于 2023-4-18 09:46
一没blocking,二没SIMD,那还优化啥,不如调MKL(已知你在Intel CPU上测试的)