int、int16、int32、int64、float、float16、float32、float64 - 走看看

zoukankan html css js c++ java

int、int16、int32、int64、float、float16、float32、float64

在做模型量化的时候，经常遇到这几个类精度表示，做下记录：

类型位

float16 半精读 2个字节

float32 float 4个字节

float64 双精度 8个字节

注：

bits：位数

bytes：字节 1bytes = 8 bits

单精度用小数用23位存储，加上默认的小数点前的1为1，2^(23+1) = 16777216.

因为10^7<16777216<10^8,所以说单精度浮点数的有效位数是7位。

双精度的小数位数是52位存储，2^(52+1) = 9007199254740992.

因为10^16<9007199254740992<10^17，所以双精度的有效位数是16位。

查看全文

相关阅读:
Java 得到指定时间加半个小时之后得时间
 MySQL查询point类型类型的坐标，返回经度纬度
 MySQL通过实体经纬度字段插入数据库point类型的经纬度字段
 MySQL通过POIN数据类型查询指定范围内数据
 Java 根据两个经纬度，得到两点距离
 mysql通过经纬度查询400公里范围内的小区
 位运算
 Hibernate多对多删除问题的解决
 mysql 中时间和日期函数
 Struts2数据传输的背后机制：ValueStack（值栈）

原文地址：https://www.cnblogs.com/zhibei/p/13255701.html

Copyright © 2011-2022 走看看