zoukankan      html  css  js  c++  java
  • 粒子滤波

    基本思想

    所谓粒子滤波就是指:通过寻找一组在状态空间中传播的随机样本来近似的表示概率密度函数,用样本均值代替积分运算,进而获得系统状态的最小方差估计的过程,这些样本被形象的称为“粒子”,故而叫粒子滤波。采用数学语言描述如下: 对于平稳的随机过程, 假定k - 1 时刻系统的后验概率密度为p ( xk-1 zk-1 ) , 依据一定原则选取n 个随机样本点, k 时刻获得测量信息后, 经过状态和时间更新过程, n 个粒子的后验概率密度可近似为p ( xk zk ) 。随着粒子数目的增加, 粒子的概率密度函数逐渐逼近状态的概率密度函数, 粒子滤波估计即达到了最优贝叶斯估计的效果。

    粒子滤波算法摆脱了解决非线性滤波问题时随机量必须满足高斯分布的制约条件, 并在一定程度上解决了粒子数样本匮乏问题, 因此近年来该算法在许多领域得到成功应用。


    贝叶斯滤波

    动态系统的状态空间模型可描述为

    其中f(),h()分别为状态转移方程与观测方程,xk为系统状态,yk为观测值,uk为过程噪声,vk为观测噪声。为了描述方便,用Xk=x0:k={x0,x1,…,xk}与Yk=y0:k={y0,y1,…,yk}分别表示0到k时刻所有的状态与观测值。在处理目标跟踪问题时,通常假设目标的状态转移过程服从一阶马尔可夫模型,即当前时刻的状态xk只与上一时刻的状态xk-1有关。另外一个假设为观测值相互独立,即观测值yk只与k时刻的状态xk有关。

    贝叶斯滤波为非线性系统的状态估计问题提供了一种基于概率分布形式的解决方案。贝叶斯滤波将状态估计视为一个概率推理过程,即将目标状态的估计问题转换为利用贝叶斯公式求解后验概率密度p(Xk|Yk)滤波概率密度p(xk|Yk)进而获得目标状态的最优估计贝叶斯滤波包含预测和更新两个阶段,预测过程利用系统模型预测状态的先验概率密度,更新过程则利用最新的测量值对先验概率密度进行修正,得到后验概率密度。

    假设已知k-1时刻的概率密度函数为p(xk-1|Yk-1),贝叶斯滤波的具体过程如下:

    (1) 预测过程,由p(xk-1|Yk-1)得到p(xk|Yk-1)

    p(xk,xk-1|Yk-1)=p(xk|xk-1,Yk-1)p(xk-1|Yk-1)       

    当给定xk-1时,状态xk与Yk-1相互独立,因此

    p(xk,xk-1|Yk-1)=p(xk|xk-1)p(xk-1|Yk-1)              

    上式两端对xk-1积分,可得Chapman-Komolgorov方程


    (2) 更新过程,由p(xk|Yk-1)得到p(xk|Yk):

    获取k时刻的测量yk后,利用贝叶斯公式对先验概率密度进行更新,得到后验概率


    假设yk只由xk决定,即

    p(yk|xk,Yk-1)=p(yk|xk)                      

    因此

                         

    其中,p(yk|Yk-1)为归一化常数

                   

    贝叶斯滤波以递推的形式给出后验(或滤波)概率密度函数的最优解。目标状态的最优估计值可由后验(或滤波)概率密度函数进行计算。通常根据极大后验(MAP)准则或最小均方误差(MMSE)准则,将具有极大后验概率密度的状态或条件均值作为系统状态的估计值,即

                                                                

    贝叶斯滤波需要进行积分运算,除了一些特殊的系统模型(如线性高斯系统,有限状态的离散系统)之外,对于一般的非线性、非高斯系统,贝叶斯滤波很难得到后验概率的封闭解析式。因此,现有的非线性滤波器多采用近似的计算方法解决积分问题,以此来获取估计的次优解。在系统的非线性模型可由在当前状态展开的线性模型有限近似的前提下,基于一阶或二阶Taylor级数展开的扩展Kalman滤波得到广泛应用。在一般情况下,逼近概率密度函数比逼近非线性函数容易实现。据此,Julier与Uhlmann提出一种Unscented Kalman滤波器,通过选定的sigma点来精确估计随机变量经非线性变换后的均值和方差,从而更好的近似状态的概率密度函数,其理论估计精度优于扩展Kalman滤波。获取次优解的另外一中方案便是基于蒙特卡洛模拟的粒子滤波器。


    蒙特卡洛近似思想

    蒙特卡洛积分是一项用随机釆样来估算积分值的技术,简单说就是以某事件出现的频率来指代该事件的概率。因此在滤波过程中,需要用到概率如P(x)的地方,一概对变量x采样,以大量采样及其相应的权值来近似表示P(x)。

    然而,在计算机问世以前,随机试验却受到一定限制,这是因为要使计算结果的准确度足够高,需要进行的试验次数相当大。因此人们都认为随机试验要用人工进行冗长的计算,这实际上是不可能的。

    随着电子计算机的出现,利用电子计算机可以实现大量的随机抽样试验,使得用随机试验方法解决实际问题才有了能。

    它的基本思想是:为了求解数学、物理、工程技术以及生产管理等方面的问题,首先建立一个概率模型或随机过程,使它的参数等于问题的解,然后通过对模型或过程的观察或抽样试验来计算所求参数的统计特征,最后给出所求解的近似

    值,而解的精确度可用估计值的标准误差来表示。 

    粒子滤波算法的核心思想便是利用一系列随机样本的加权和表示后验概率密度,通过求和来近似积分操作。


    重要性采样 (Importance Sampling)

    这是一种蒙特卡洛方法(Monte Carlo)。在有限的采样次数内,尽量让采样点覆盖对积分贡献很大的点。该方法目的并不是用来产生一个样本的,而是求一个函数的定积分的,只是因为该定积分的求法是通过对另一个叫容易采集分布的随机采用得到的。


    序贯重要性采样(Sequential Importance Sainpling,SIS)

    在粒子滤波算法中重采样的基本思想是抛弃那些对估计系统后验概率密度权值较小的粒子,通过复制权值较大的粒子来代替它们,进行重釆样有多种方法,常见的有多项式重釆样、系统重采样、分层抽样、残差抽样等,目前最为常用的重采样方法就是序贯重要性釆样。
    在基于重要性重采样的蒙特卡洛模拟方法中,估计后验滤波概率需要利用所有的观测数据,每次新的观测数据来到都需要重新计算整个状态序列的重要性权值。序贯重要性釆样作为粒子滤波的基础,它将统计学的序贯分析方法应用到蒙特卡洛方法中,其主要思想就是递归的计算重采样粒子,通过保留以前所有采样时刻的粒子状态以保持采样粒子的继承性,从而实现后验滤波概率密度的递归估计。

    基于序贯蒙特卡洛模拟方法的粒子滤波算法存在采样粒子权值退化问题以及计算量过大的问题,在实际计算中,经过数次迭代,只有少数粒子的权值较大,其余粒子的权值较小甚至可以忽略不计,粒子权值的方差随着时间的推移而增大,状态空间中的有效粒子数减少,随着无效粒子数量的增加,使得大量的计算消耗在对估计后验滤波概率分布几乎不起作用的粒子上,使得计算量增大且估计性能下降。

    SIS算法的具体步骤如下:

    1.系统初始化

    k = 0,随机提取N个样本点


    并给采样粒子赋予相应的初始权值为



    2.抽取N个样本

    在时刻k=1,2,…,L通过随机釆样的方法从以下分布抽取N个样本

    3.逐点计算对应的p(xk|xk-1)和p(zk|xk)


    4.更新权值

    该时刻的采样粒子点的权值按下式计算



    3.粒子权值归一化




    权值退化

    粒子滤波的核心思想是系统随机釆样与重要性重釆样的相加,粒子滤波首先根据系统在t时刻的系统状态x(t)和系统的概率分布生成大量的采样,这些采样就称之为粒子,那么这些采样在状态空间中的分布实际上就是x(t)的概率分布了,其后根据系统状态转移方程就可以对每一个粒子得到一个预测粒子,所有的预测粒子就代表系统所涉及的参数化东西。在滤波的预估计阶段,随机进行粒子采样,采样完成后根据特征相似度计算每个粒子的重要性,并根据重要性赋予粒子相应的权值,因此粒子滤波方法较之蒙特卡洛方法计算量较小,但是这种方法严重依赖于对初始状态的估计,随着迭代算法的进行,在经过数次迭代后其粒子采样的分配权重的方差会随着时间的推移而不断增大,除少数粒子以外的其他所有粒子只具有微小的权值并最终趋向于0,而少数粒子的权值会变的越来越大,随着采样过程的继续,最终所产生的粒子只是最初一小部分粒子权值的衍生,采样粒子代表的系统就会失去多样性,而当前系统的后验概率密度分布情况不能够有效的表示,我们将其称之为权值退化问题。

    由于采样粒子权值退化问题在基于序贯重要性采样的粒子滤波算法中广泛存在,在经过数次迭代之后,许多粒子的权值变得很小,大量的计算浪费在小权值的粒子上,从而影响系统效率。目前降低该问题影响的最有效方法是选择重要性函数和采用重采样方法


    重要性函数的选择

    在重要性概率密度函数选择中融入系统最新的观测信息,通过选取好的重要性概率密度函数来有效抑制退化问题。

    重采样

    通过对粒子及其相应权值表示的概率密度函数进行重新采样,形成一个新的粒子集,该粒子集构成后验密度离散近似的一个经验分布,在釆样总数保持不变的情况下,权值较大的样本被多次复制,从而实现重釆样过程,通过引入重釆样技术,增加了权值较大的粒子数,在一定程度上能够有效解决粒子权值退化问题。重采样过程是以牺牲系统鲁棒性和计算效率来解决粒子权值退化问题的,并不是所有状态下的粒子都需要进行重采样,因此,我们需要进一步研究粒子权值的退化程度如何进行准确度量,并对粒子是否需要重采样进行有效判断。

    重新采样获得的样本可以认为是一系列独立同分布的样本,其权重是一样的,均设为1/N。


    采样贫乏

    由于包含了大量重复的粒子(这些粒子具有高权值被多次选中),重采样导致了粒子多样性的丧失,此类问题在小噪声的环境下更加突出。事实上如果系统噪声非常小的话,所有粒子会在几次迭代之后崩塌为一个单独的粒子。

    经典粒子滤波算法步骤

    1.初始化:

    取k=0,按p(x0)抽取N个样本点,i=1,…,N。

    2.重要性采样:

    ,其中i=1,…,N。

    3.计算权值:


    若采用一步转移后验状态分布,该式可简化为

    4.归一化权值:

    t=   

    =/t

    5.重采样:根据各自归一化权值的大小复制/舍弃样本,得到N个近似服从分布的样本。令=1/N,i=1,…,N。

    6.输出结果:算法的输出是粒子集,用它可以近似表示后验概率和函数的期望



    7.K=K+1,重复2步至6步。


    粒子滤波其实质是利用一系列随机抽取的样本,也就是粒子,来替代状态的后验概率分布。当粒子的个数变得足够大时,通过这样的随机抽样方法就可以得到状态后验分布很好的近似。




    <span style="font-size:18px;">function ParticleEx1 
     
    % Particle filter example, adapted from Gordon, Salmond, and Smith paper. 
     
    x = 0.1; % initial state 
    Q = 1; % process noise covariance 
    R = 1; % measurement noise covariance 
    tf = 50; % simulation length 
     
    N = 100; % number of particles in the particle filter 
     
    xhat = x; 
    P = 2; 
    xhatPart = x; 
     
    % Initialize the particle filter. 
    for i = 1 : N 
        xpart(i) = x + sqrt(P) * randn; 
    end 
     
    xArr = [x]; 
    yArr = [x^2 / 20 + sqrt(R) * randn]; 
    xhatArr = [x]; 
    PArr = [P]; 
    xhatPartArr = [xhatPart]; 
     
    close all; 
     
    for k = 1 : tf 
        % System simulation 
        x = 0.5 * x + 25 * x / (1 + x^2) + 8 * cos(1.2*(k-1)) + sqrt(Q) * randn;%状态方程 
        y = x^2 / 20 + sqrt(R) * randn;%观测方程 
        % Extended Kalman filter 
        F = 0.5 + 25 * (1 - xhat^2) / (1 + xhat^2)^2; 
        P = F * P * F' + Q; 
        H = xhat / 10; 
        K = P * H' * (H * P * H' + R)^(-1); 
        xhat = 0.5 * xhat + 25 * xhat / (1 + xhat^2) + 8 * cos(1.2*(k-1));%预测 
        xhat = xhat + K * (y - xhat^2 / 20);%更新 
        P = (1 - K * H) * P; 
        % Particle filter 
        for i = 1 : N 
            xpartminus(i) = 0.5 * xpart(i) + 25 * xpart(i) / (1 + xpart(i)^2) + 8 * cos(1.2*(k-1)) + sqrt(Q) * randn; 
            ypart = xpartminus(i)^2 / 20; 
            vhat = y - ypart;%观测和预测的差 
            q(i) = (1 / sqrt(R) / sqrt(2*pi)) * exp(-vhat^2 / 2 / R); 
        end 
        % Normalize the likelihood of each a priori estimate. 
        qsum = sum(q); 
        for i = 1 : N 
            q(i) = q(i) / qsum;%归一化权重 
        end 
        % Resample. 
        for i = 1 : N 
            u = rand; % uniform random number between 0 and 1 
            qtempsum = 0; 
            for j = 1 : N 
                qtempsum = qtempsum + q(j); 
                if qtempsum >= u 
                    xpart(i) = xpartminus(j); 
                    break; 
                end 
            end 
        end 
        % The particle filter estimate is the mean of the particles. 
        xhatPart = mean(xpart); 
        % Plot the estimated pdf's at a specific time. 
        if k == 20 
            % Particle filter pdf 
            pdf = zeros(81,1); 
            for m = -40 : 40 
                for i = 1 : N 
                    if (m <= xpart(i)) && (xpart(i) < m+1) 
                        pdf(m+41) = pdf(m+41) + 1; 
                    end 
                end 
            end 
            figure; 
            m = -40 : 40; 
            plot(m, pdf / N, 'r'); 
            hold; 
            title('Estimated pdf at k=20'); 
            disp(['min, max xpart(i) at k = 20: ', num2str(min(xpart)), ', ', num2str(max(xpart))]); 
            % Kalman filter pdf 
            pdf = (1 / sqrt(P) / sqrt(2*pi)) .* exp(-(m - xhat).^2 / 2 / P); 
            plot(m, pdf, 'b'); 
            legend('Particle filter', 'Kalman filter'); 
        end 
        % Save data in arrays for later plotting 
        xArr = [xArr x]; 
        yArr = [yArr y]; 
        xhatArr = [xhatArr xhat]; 
        PArr = [PArr P]; 
        xhatPartArr = [xhatPartArr xhatPart]; 
    end 
     
    t = 0 : tf; 
     
    %figure; 
    %plot(t, xArr); 
    %ylabel('true state'); 
     
    figure; 
    plot(t, xArr, 'b.', t, xhatArr, 'k-', t, xhatArr-2*sqrt(PArr), 'r:', t, xhatArr+2*sqrt(PArr), 'r:'); 
    axis([0 tf -40 40]); 
    set(gca,'FontSize',12); set(gcf,'Color','White');  
    xlabel('time step'); ylabel('state'); 
    legend('True state', 'EKF estimate', '95% confidence region');  
     
    figure; 
    plot(t, xArr, 'b.', t, xhatPartArr, 'k-'); 
    set(gca,'FontSize',12); set(gcf,'Color','White');  
    xlabel('time step'); ylabel('state'); 
    legend('True state', 'Particle filter estimate');  
     
    xhatRMS = sqrt((norm(xArr - xhatArr))^2 / tf); 
    xhatPartRMS = sqrt((norm(xArr - xhatPartArr))^2 / tf); 
    disp(['Kalman filter RMS error = ', num2str(xhatRMS)]); 
    disp(['Particle filter RMS error = ', num2str(xhatPartRMS)]); </span>

    下面是我实现的跟踪结果,白色十字代表粒子,绿色大十字代表目标最可能的位置。



    版权声明:

  • 相关阅读:
    一个不错的学习Hadoop和MapReduce的个人博客
    开源数据库sharding
    《控制论》导读 及 译者序 第二版序 读书笔记
    异常处理反模式
    主数据处理链碰到空数据节点不在继续执行的问题解决方案
    SAP 学习笔记 FI000 公司代码
    SAP概念之Client(集团),业务范围(business area),公司(company),公司代码(company code)
    零售行业主数据增量上载
    R/3数据源抽数到BWPSA中字段信息丢失
    BI CONTENT激活出现DUMP
  • 原文地址:https://www.cnblogs.com/walccott/p/4956954.html
Copyright © 2011-2022 走看看