在生活中们有时会遇到一些有关字符串匹配的问题。
这时打暴力往往显得很愚蠢,效率低下。
所以就需要一些算法和数据结构来提高效率。
Hash
Hash,一般翻译做“散列”,也有直接音译为“哈希”的,就是把任意长度的输入(又叫做预映射, pre-image),通过散列算法,变换成固定长度的输出,该输出就是散列值。这种转换是一种压缩映射,也就是,散列值的空间通常远小于输入的空间,不同的输入可能会散列成相同的输出,所以不可能从散列值来唯一的确定输入值。简单的说就是一种将任意长度的消息压缩到某一固定长度的消息摘要的函数。
Hash是一种很好的算法(对于初学者),它是一种好写而且效率高的算法。
Hash主要是要将你已知的字符串转化为一个数字,有些读者会觉得奇怪,怎样转化?
看下面这个代码:
int hash(string s) { int ans=1; for(int i=0;i<s.size();i++) ans=(ans+s[i]-'0')*17%133; return ans; }
这是一个简单的哈希,ans即为这个string的哈希值,即数组下标。
但是又有问题了,哈希值不是会有可能重复吗?
这里只讲一种比较暴力易懂的方法。
对于每一个哈希值挂一个链,相同哈希值的string暴力判断是否匹配。
用邻接表实现。
但是我要讲一种C++朋友很开心的方法,想必大家也猜到了。
那就是Map。
这是C++的一种类型,代表映射。
它可以将string映射为int类型。
其实C++还有一个特别苟的STL,叫pb_ds。
可以开Hash表,也可以开平衡树、trie、可并堆。//虽然NOIP普及不让用