面对大数云计算的到来,随着字节编码位数不断的增加,处理器运算的速度也是起来越高,但英文的26个字母远远不能满足对数据区分的要求,原因如下:
一,字母位数的增加意为着字节数的增加,
中国汉字有上万个,而字母只有26个,
如果表达一层含意在小位数的情况下:
china 中国
5字节 4字节
如果要表达较多的数据,比如3亿个单词
字母 26*26*26 *26 *26 *26 汉字 10000*10000*3可
字母需要6字节,汉字只需要5字节
数据越大,汉字越占优势
再举例 26^26=676 < 10000^10000=100000000/2
在大数据处理中,汉字处理数据的速度将是英文字母的约 147928.99408284023668639053254438/2=73964.497041420118343195266272189倍
在人工智能方面,无疑是最强的语言。
只想说句,中文作为世界上最强的语言,正等待我们去开发。