zoukankan      html  css  js  c++  java
  • 非数值数据的编码表示

    2.5非数值数据的编码表示

    2.5.1西文字符

    ASCLL码(美国标准信息交换码)

    2.5.2汉字字符

    汉字的输入码(外码)
    每个汉字都用一个或者几个键来表示,这种对每个汉字用相应的按键进行的编码表示就称为汉字的输入码,又称外码。
    字符集与汉字内码
    汉字被输入到计算机内部后,就按照一种称为内码的编码形式在系统中进行存储、查找、传送等处理。
    对于汉字内码的选择:
    1.不能有二义性,即不能和ascll码有相同的编码。
    2.要与汉字在字库中的位置有关系,以便于汉字的处理、查找。
    3.编码应尽量短。
    国标码(国际交换码)共6763个常用汉字。

    2.6数据的宽度和存储

    1.二进制数据的每一位是组成二进制信息的最小单位,称为一个比特(bit),也称为位元,简称位。比特是计算机中处理、存储、传输信息的最小单位。
    每个西文字符需要8个比特表示,每个汉字需要用16个比特表示。
    2.二进制信息的计量单位是字节(byte),也成位组。一个字节==8个比特。
    3.字长通常是指CPU内部用于整数运算的数据通路的宽度。

    2.7数据校检码

    1.方法大都采用冗余校验的思想,即除原数据信息外,还增加若干位编码,这些新增的代码称为校验位。
    2.由若干位代码组成的一个字叫码字,将两个码字逐位比较,具有不同代码的位的个数叫做这两个码字间的距离,也称为海明距离。一种码制可能有若干个码字,各码字间的最小距离称为码距。

    校验码的方式

    1.奇偶校验码
    2.海明校验码
    3.循环冗余码

  • 相关阅读:
    Spark Streaming 的容错
    Master 接受其它组件的注册
    Spark Context 概述
    Python 使用random模块生成随机数
    Python 中print 和return 的区别
    Python 访问字典(dictionary)中元素
    PIL:处理图像的好模块
    2.线性回归
    3.梯度下降法
    4.pca与梯度上升法
  • 原文地址:https://www.cnblogs.com/coolyingying/p/13707325.html
Copyright © 2011-2022 走看看