zoukankan      html  css  js  c++  java
  • 模式识别原理(Pattern Recognition)、概念、系统、特征选择和特征

    §1.1 模式识别的基本概念
    一、广义定义
    1、模式:一个客观事物的描述,一个可用来仿效的完善的例子。
    2、模式识别:按哲学的定义是一个“外部信息到达感觉器官,并被转换成有意义的感觉经验”的过程。
    例:识别热水、字迹等
    二、狭义的定义
    1、模式:对某些感兴趣的客体的定量的或结构的描述。模式类是具有某些共同特性的模式的集合。
    2、模式识别:研究一种自动技术,依靠这种技术,计算机将自动地(或人尽量少地干涉)把待别识模式分配到各自的模式类中去。注意: 狭义的“模式”概念——是对客体的描述,不论是待识别客体,还是已知的客体。 广义的“模式”概念——是指“用于效仿的完善例子
    三、相关的计算机技术
    1、目前的计算机建立在诺依曼体系基础之上。
    1946年:美籍匈牙利数学家冯·诺依曼提出了关 于计算机组成和工作方式的基本设想:数字计算机 的数制采用二进制;计算机按照程序顺序执行,即 “程序存储”的概念。
    1949年:研制出第一台冯·诺依曼式计算机 。
    1956年:第一次人工智能(artificial intelligence) 研讨会在美国召开。
    2、第五代人工智能型计算机
    本质区别:主要功能将从信息处理上升为知识处理(学习、联想、推理、解释问题),使计算机具有人类的某些智能。研制工作从80年代开始,目前尚未形成一致结论 。
    几种可能的发展方向: 神经网络计算机--模拟人的大脑思维。 生物计算机--运用生物工程技术、蛋白分子作芯片。 光计算机--用光作为信息载体,通过对光的处理来完成对信息的处理。
    四、研究和发展模式识别的目的
    提高计算机的感知能力,从而大大开拓计算机的应用。
    §1.2 模式识别系统一、
    简例:建立感性认识
    以癌细胞识别为例,了解机器识别的全过程。
    1、信息输入与数据获取
    将显微细胞图像转换成数字化细胞图像,像素的 值反映光密度的 大小,又称灰度 数字图像。数字 化细胞图像是计 算机分析的原始 数据基础。
    2、数字化细胞图像的预处理与区域划分
    预处理的目的:
    (1)去除在数据获取时引入的噪声与干扰。
    (2)去除所有夹杂在背景上的次要图像,突出主要的待识别的细胞图像。
    例:平滑、图像增强等数字图像处理技术。
    区域划分的目的:找出边界,划分出三个区域,为特征抽取做准备。
     
    3、细胞特征的抽取、选择和提取
    目的:为了建立各种特征的数学模型,以用于分类。① 抽取特征 :原始采集数据,第一手资料,特征数据 量大。是特征选择和提取的依据。
    例:对一个细胞抽取33个特征 ,建立一个33维的空间X,每个细胞可通过一个33维随机向量表示,即把一个物理实体“细胞”变成了一个数学模型“33 维随机向量”,也即33维空间中的一点。
    ② 特征选择:在原始特征基础上选择一些主要特征作为判别用的特征。 ③ 特征提取:采用某种变换技术,得出数目上比原来少的综合性特征作为分类用,称为特征维数压缩,习惯上亦称特征提取。
    §1.3 模式识别概况
     
    一、模试识别发展简介
    二十世纪五十年代开始、六十年代兴起并迅速发 展,七十年代初奠定理论基础 。
    二、模式识别分类
    1、从理论上分类 ① 统计模式识别 以模式集在特征空间中分布的类概率密度函数为基础,对总体特征进行研究。包括判决函数法和聚类分析法。
    ② 结构模式识别(句法模式识别)
    把复杂模式分化为较简单的子模式乃至基元,各 层次之间的关系 通过“结构法”来描述,相当于语言 中的语法。用小而简单的基元与语法规则来描述大而 复杂的模式。
    ③ 模糊模式识别
    以隶属度为基础,运用模糊数学中的“关系”概念和运算进行分类。隶属度反映的是某一元素属于某集合的程度。
    ④ 智能模式识别
    人工智能与模式识别相结合的产物,有二个分支: a) 与人工神经网络相结合:接近于生理性模拟,从而 达到对形象思维的模拟。 b) 基于知识的逻辑性推理:源于对人类逻辑思维的模 拟,是抽象思维的范畴。
    2、从实现方法来分: ① 有监督(有导师)识别:利用判别函数进行分类判 别。需要有足够的先验知识。 ② 无监督(无导师)识别:用于没有先验知识的情况 下,采用聚类分析的方法。
    §1.4 特征选择和特征提取
    一、概述:两种数据测量情况
    ① 由于测量上可实现性的限制或经济上的考虑,所获得的测量值为数不多。 ② 能获得的性质测量值很多。如果全部直接作为分类特征,耗费机时,且分类效果不一定好。有人称之为“特征维数灾难”。
    特征选择和提取的目的:经过选择或变换,组成识别特征,尽可能保留分类信息,在保证一定分类精度的前提下,减少特征维数,使分类器的工作即快又准确。
    §1.5 模式识别的应用
    一、高速公路上的汽车收费系统:按车型收费方式
    1、提取车辆外形几何参数进行处理分析,实现分类。如视频检测方法、红外检测方法。
    2、测量车辆的其他物理参数(噪声、振动、压重等)来实现分类。如动态称重、电磁感应等。
    3、直接识别车辆身份的方法实现分类。如电子标签、视频牌照识别等。
    二、生物识别
    根据每个人独有的可以采样和测量的生物学特征(生理特征)和行为学特征进行身份识别的技术。
    1 指纹识别:最早、最成熟的识别技术。
    2 掌纹识别:研究纹线上某几个点的幅值(灰度值)、线长与线所对应的角之比等特征。
    3 脸谱识别:
    4 视网膜识别:
    5 根据动力学特征进行识别:
     
  • 相关阅读:
    HDU 6464 /// 权值线段树
    HDU 6468 /// DFS
    HDU 6469 /// 二分
    HDU 6470 /// 矩阵快速幂
    USACO 2014 US Open Odometer /// 数位DP
    hdu5988(费用流,对数相乘做加法)
    对AC自动机+DP题的一些汇总与一丝总结 (2)
    对AC自动机+DP题的一些汇总与一丝总结 (1)
    POJ 1625 Censored ( Trie图 && DP && 高精度 )
    HDU 2243 ( Trie图 矩阵构造幂和 )
  • 原文地址:https://www.cnblogs.com/blogpro/p/11426762.html
Copyright © 2011-2022 走看看