假定你是稠密矩阵(如果是稀疏的,直接spqr或者eigen3.2的qr都很好用)
根据这个(OpenCV vs. Armadillo vs. Eigen on Linux revisited)各种常用矩阵包的比较来看, Armadillo+OpenBLAS是最快的,不过看评论他测的test不是很合理貌似。
再加速的话是不是可以试试并行的算法?Google了一下比如CULA(Dense « CULA)及其免费的单精度版(CULA Programmer’s Guide),和PLASMA(PLASMA)。其实如果不是求逆的话opencv的ocl模块就还可以凑合。
根据这个(OpenCV vs. Armadillo vs. Eigen on Linux revisited)各种常用矩阵包的比较来看, Armadillo+OpenBLAS是最快的,不过看评论他测的test不是很合理貌似。
再加速的话是不是可以试试并行的算法?Google了一下比如CULA(Dense « CULA)及其免费的单精度版(CULA Programmer’s Guide),和PLASMA(PLASMA)。其实如果不是求逆的话opencv的ocl模块就还可以凑合。
cuda 可以使用 cuBLAS