tensorflow四维tensor的形状以及函数tf.argmax( )的笔记 - 走看看

zoukankan html css js c++ java

tensorflow四维tensor的形状以及函数tf.argmax( )的笔记
关于tensorflow里多维数组（主要是四维）的组织形式之前一直没弄懂，最近遇到相关问题，算是搞清楚了一些东西，特别记下来，免得自己又遗忘了。

三维形式能很简单的脑补出来三维的形状，不再赘述。

之前一直纠结四维的时候数据是怎样填充的。特别是遇到深度学习的时候输入都是[batch，height，width，channel]，这种四维的张量的时候，是怎样个数据的形状。

先看代码：
prediction2 = tf.constant([1,2,3,4,5,6,7,8,9,13,14,14,15,1,6,34,23,7],shape=[2,1,3,3])
生成一个shape为 [2,1,3,3]的tensor，具体生成的时候按照一个维度一个维度填充的，先填充最“里面”的维度，这里指维度3，然后往外依次填充。因此可以将[1,1,3,3]看成是这样形状：

而[2,1,3,3]则是两个这样的立方体组合而成。生成这样的一个tensor的时候依次填充[0][0][0][0], [0][0][0][1], [0][0][0][2]......

依次当求这个tensor在相应维度下的最大值坐标就很好理解了，如这句代码：
result = tf.argmax(prediction2,3)
将返回在Z轴上最大值的坐标，因此立方体第一列即[0][0][0][0], [0][0][0][1], [0][0][0][2]，依次为1,2,3, 最大为2，返回维度为2；同理可推出，函数返回值为：

[[2,2,2],

[1,0,0]]

实际运行结果也相同：
查看全文

相关阅读:
Java通过 Scanner 类来获取用户的输入
 Java中的Calendar 类和SimpleDateFormat 类
 JAVA中字符串常见操作
 JAVA中数组Arrays类的常见用法
 Java中的compareTo()方法，compareToIgnoreCase()方法
 python常见字符串操作
 linux常见配置文件路径
 python的匿名函数
 python列表解析式，字典解析式，集合解析式和生成器
 Django admin

原文地址：https://www.cnblogs.com/hear-nothing/p/8968571.html

Copyright © 2011-2022 走看看