在语音识别方面,同样的话都是同一个人,每次说的情况是不同的,难以识别。本章是定义如何适应不同的情况有不同的特性指标。
1,基于最优路径搜索的度量:①贝尔曼最优性原则和动态编程②编辑距离(The Edit Distance)③在语音识别动态时间扭曲(DTW), speaker-dependentrecognition. speaker-independentrecognition.
2,基于相关性的度量:这一部分解决的问题是“给定一组记录数据。查找数据是否包括已知模式。并找出其详细位置”。很多应用都涉及这一问题:目标检測、机器人视觉和视频编码。
3,可变形模板模型:这部分的目标就是寻求模板匹配来解释图像中參考模板和測试模板之间的差异。
4,基于内容的信息检索:相关性反馈。传统的信息检索是基于文本的。本部分讨论基于内容的,比方。图像检索中,通过图像质地,颜色,检索外形描述叙事。