zoukankan      html  css  js  c++  java
  • 当编译cubin文件时, 指明“arch sm_35“的区别

    接着上面一篇blog

    nvcc -cubin -m64 -arch sm_35   *.cu --use_fast_math  --maxrregcount=32  --ptxas-options=-v -O3 -o *.cubin

    当用上面的命令编译后,影响有两个:

    1. 显示会使用local memory。

    2. 在Tesla K40上运行,没有问题。

    nvcc -cubin -m64 *.cu --use_fast_math  --maxrregcount=32  --ptxas-options=-v -O3 -o *.cubin
    

    如果去掉 -arch sm_35, 默认是给sm_20编译“compiling entry funciton '*' for 'sm_20'。影响有两个:

    1. 使用--maxrregcount=32,不适用local memory。

    2. 不能在 Tesla K40 上运行。

  • 相关阅读:
    JS-07 (js的面向对象编程)
    AI SiameseFC
    phpstorm调试
    Php 编译扩展
    canvas
    AI FCN
    AI WebGL
    Python flask
    JIT 即时编译
    小程序
  • 原文地址:https://www.cnblogs.com/xingzifei/p/7482612.html
Copyright © 2011-2022 走看看