使用官方的tfdbg进行调试,使用的方式很简单三句话完成:
第一句声明:
from tensorflow.python import debug as tf_debug
第二句:对会话封装
sess = tf_debug.LocalCLIDebugWrapperSession(sess)
第三句:过滤(可选)
sess.add_tensor_filter(“has_inf_or_nan”, tf_debug.has_inf_or_nan)
如此以来,每次只要调用该会话的run()属性,就会进入debug.
你最好把这个代码存成.py,然后在终端执行。
具体的做法是:
1 def train(self, dataset): 2 log_out('****EPOCH {}****'.format(self.training_epoch), self.Log_file) 3 self.sess.run(dataset.train_init_op) 4 while self.training_epoch < self.config.max_epoch: 5 t_start = time.time() 6 try: 7 ops = [self.train_op, 8 self.extra_update_ops, 9 self.merged, 10 self.loss, 11 self.logits, 12 self.labels, 13 self.accuracy] 14 15 debug_sess = tf_debug.LocalCLIDebugWrapperSession(self.sess) 16 debug_sess.run(ops) 17 18 _, _, summary, l_out, probs, labels, acc = self.sess.run(ops, {self.is_training: True}) 19
在第18句之前加上15、16两句。然后在终端运行训练文件。会出现如下的画面:
然后输入s进行单步调试。
单步执行的话就用鼠标点击上面的“invoke stepper”,单步执行。如果不知道怎么进行单步执行,那么就输入命令“help”自己去看文档就是啦!单步就是按”s”,估计就是step的意思。
核心的几个命令是:
- run :执行一次 debug_session.run() , 这次执行产生中间 tensor 的值都可以通过 debug 界面查看
- exit : 退出 debug
当执行单步调试的时候,每执行一步单步调试,箭头都会下移一行,此时箭头所指向的变量的值会在下面显示。
参考1:https://blog.csdn.net/lucky7213/article/details/78975861
参考2:https://blog.codescv.com/debug-tf-using-tfdbg.html
参考3:https://tensorflow.juejin.im/programmers_guide/debugger.html