1、打开python paddle的c++堆栈信息:
打开paddle的c++堆栈信息:export FLAGS_call_stack_level=2
2、内部使用glog的VLOG来打印调试信息,因此可以使用
export GLOG_v=5来打开
export GLOG_vmodule=operator=4,可以指定operator.cc中的VLOG等级为4
3、paddle运行中查看显存分配
paddle.fluid.core.get_int_stats()['STAT_gpu0_mem_size'] # 获取0号卡的显存分配信息
paddle显存分配会进行256对齐
4、查看Tensor (VarBase, VariableWrapper)的构造和析构信息
FLAGS_dygraph_debug=1 GLOG_vmodule=layer=10,variable_wrapper=10 python test_gpu.py
5、打开NCCL的错误信息:
export NCCL_DEBUG=WARN
6、编译选项
https://www.paddlepaddle.org.cn/documentation/docs/zh/develop/install/compile/linux-compile.html