zoukankan      html  css  js  c++  java
  • 算法#03--具体解释最小二乘法原理和代码

    最小二乘法原理

    最小二乘法的目标:求误差的最小平方和,相应有两种:线性和非线性。线性最小二乘的解是closed-form(例如以下文),而非线性最小二乘没有closed-form,通经常使用迭代法求解(如高斯牛顿迭代法,本文不作介绍)。

    【首先得到线性方程组】

    1.概念

    最小二乘法(又称最小平方法)是一种数学优化技术。它通过最小化误差的平方和寻找数据的最佳函数匹配。

    利用最小二乘法能够简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平方和为最小。

    最小二乘法还可用于曲线拟合。

    2.原理

    函数原型:

    这里写图片描写叙述

    已知:

    (x0,y0)。(x1。y1)…(xi,yi)…(xn,yn)个点,n>=k。

    偏差平方和:

    这里写图片描写叙述

    偏差平方和最小值能够通过使偏导数等于零得到:

    这里写图片描写叙述

    简化左边等式有:

    这里写图片描写叙述

    写成矩阵形式:公式①

    这里写图片描写叙述

    将这个范德蒙得矩阵化简后可得到:公式②

    这里写图片描写叙述

    也就是说X*A=Y,那么A = (X’*X)-1*X’*Y,便得到了系数矩阵A,同一时候,我们也就得到了拟合曲线。

    高斯消元法

    【然后解线性方程组,即公式①】

    1.概念

    数学上,高斯消元法(或译:高斯消去法)(英语:Gaussian Elimination),是线性代数中的一个算法,可用来为线性方程组求解,求出矩阵的秩,以及求出可逆方阵的逆矩阵。当用于一个矩阵时。高斯消元法会产生出一个“行梯阵式”。

    2.原理

    这里写图片描写叙述

    这里写图片描写叙述

    这里写图片描写叙述

    这里写图片描写叙述

    这里写图片描写叙述

    这里写图片描写叙述

    这里写图片描写叙述

    3.伪代码

    这个算法和上面谈到的有点不同。它由绝对值最大的部分開始做起。这样能够改善算法的稳定性。

    本算法由左至右地计算。每作出下面三个步骤,才跳到下一列和下一行:

    • 定出i列的绝对值最大的一个非0的数,将第i行的值与该行交换,使得该行拥有该列的最大值;
    • 将i列的数字除以该数,使得i列i行的数成为1。
    • 第(i+1)行下面(包含第(j+1)行)全部元素都转化为0。

    全部步骤完毕后,这个矩阵会变成一个行梯矩阵,再用代入法就能够求解该方程组。

     i = 1
     j = 1
     while (i ≤ m and j ≤ n) do
       Find pivot in column j, starting in row i    // 从第i行開始。找出第j列中的最大值(i、j值应保持不变)  
       maxi = i
       for k = i+1 to m do
         if abs(A[k,j]) > abs(A[maxi,j]) then
           maxi = k   // 使用交换法找出最大值(绝对值最大)
         end if
       end for
       if A[maxi,j] ≠ 0 then  // 判定找到的绝对值最大值是否为零:若不为零就进行下面操作;若为零则说明该列第(i+1)行下面(包含第(i+1)行)均为零,不须要再处理,直接跳转至第(j+1)列第(i+1)行
         swap rows i and maxi, but do not change the value of i   // 将第i行与找到的最大值所在行做交换,保持i值不变(i值记录了本次操作的起始行)
         Now A[i,j] will contain the old value of A[maxi,j].
         divide each entry in row i by A[i,j]    // 将交换后的第i行归一化(第i行全部元素分别除以A[i,j])
         Now A[i,j] will have the value 1.
         for u = i+1 to m do    // 第j列中,第(i+1)行下面(包含第(i+1)行)全部元素都减去A[i,j],直到第j列的i+1行以後元素均為零
           subtract A[u,j] * row i from row u
           Now A[u,j] will be 0, since A[u,j] - A[i,j] * A[u,j] = A[u,j] - 1 * A[u,j] = 0.
         end for
         i = i + 1   
       end if
       j = j + 1  // 第j列中。第(i+1)行下面(包含第(i+1)行)全部元素均为零。

    移至第(j+1)列,从第(i+1)行開始反复上述步骤。

    end while

    代码

    public class CurveFitting {
         ///<summary>
        ///最小二乘法拟合二元多次曲线
        ///比如y=ax+b
        ///当中MultiLine将返回a。b两个參数。

    ///a相应MultiLine[1] ///b相应MultiLine[0] ///</summary> ///<param name="arrX">已知点的x坐标集合</param> ///<param name="arrY">已知点的y坐标集合</param> ///<param name="length">已知点的个数</param> ///<param name="dimension">方程的最高次数</param> public static double[] MultiLine(double[] arrX, double[] arrY, int length, int dimension) { int n = dimension + 1; //dimension次方程须要求 dimension+1个 系数 double[][] Guass = new double[n][n + 1]; for (int i = 0; i < n; i++){ //求矩阵公式① int j; for (j = 0; j < n; j++){ Guass[i][j] = SumArr(arrX, j + i, length);//公式①等号左边第一个矩阵,即Ax=b中的A } Guass[i][j] = SumArr(arrX, i, arrY, 1, length);//公式①等号右边的矩阵,即Ax=b中的b } return ComputGauss(Guass, n);//高斯消元法 } //求数组的元素的n次方的和,即矩阵A中的元素 private static double SumArr(double[] arr, int n, int length) { double s = 0; for (int i = 0; i < length; i++){ if (arr[i] != 0 || n != 0){ s = s + Math.pow(arr[i], n); } else{ s = s + 1; } } return s; } //求数组的元素的n次方的和,即矩阵b中的元素 private static double SumArr(double[] arr1, int n1, double[] arr2, int n2, int length) { double s = 0; for (int i = 0; i < length; i++) { if ((arr1[i] != 0 || n1 != 0) && (arr2[i] != 0 || n2 != 0)) s = s + Math.pow(arr1[i], n1) * Math.pow(arr2[i], n2); else s = s + 1; } return s; } //高斯消元法解线性方程组 private static double[] ComputGauss(double[][] Guass, int n) { int i, j; int k, m; double temp; double max; double s; double[] x = new double[n]; for (i = 0; i < n; i++) { x[i] = 0.0;//初始化 } for (j = 0; j < n; j++) { max = 0; k = j; // 从第i行開始,找出第j列中的最大值(i、j值应保持不变) for (i = j; i < n; i++) { if (Math.abs(Guass[i][j]) > max){ max = Guass[i][j];// 使用交换法找出最大值(绝对值最大) k = i; } } if (k != j) { //将第j行与找到的最大值所在行做交换。保持i值不变(j值记录了本次操作的起始行) for (m = j; m < n + 1; m++) { temp = Guass[j][m]; Guass[j][m] = Guass[k][m]; Guass[k][m] = temp; } } if (max == 0) { // "此线性方程为神秘线性方程" return x; } // 第m列中,第(j+1)行下面(包含第(j+1)行)全部元素都减去Guass[j][m] * s / (Guass[j][j]) //直到第m列的i+1行以後元素均为零 for (i = j + 1; i < n; i++) { s = Guass[i][j]; for (m = j; m < n + 1; m++) { Guass[i][m] = Guass[i][m] - Guass[j][m] * s / (Guass[j][j]); } } }//结束for (j=0;j<n;j++) //回代过程(见公式4.1.5) for (i = n - 1; i >= 0; i--) { s = 0; for (j = i + 1; j < n; j++) { s = s + Guass[i][j] * x[j]; } x[i] = (Guass[i][n] - s) / Guass[i][i]; } return x; }//返回值是函数的系数 public static void main(String[] args) { double[] x = {0, 1, 2, 3, 4, 5, 6, 7}; double[] y = {0, 1, 4, 9, 16, 25, 36, 49}; double[] a = MultiLine(x, y, 8, 2); for(int i =0; i <a.length;i++){ System.out.println(a[i]); } } }

    输出:

    0.708333333333342
    -0.37500000000000583
    1.0416666666666674

    取整就得到y=x^2。

  • 相关阅读:
    Spring中使用存储过程
    使用mysql-connector-java.jar连接MySql时出现:Error while retrieving metadata for procedure columns: java.sql.SQLException: Parameter/Column name pattern can not be NULL or empty.
    Spring的JDBC示例
    使用JDBC连接MySql时出现:The server time zone value '�й���׼ʱ��' is unrecognized or represents more than one time zone. You must configure either the server or JDBC driver (via the serverTimezone configuration
    Spring的JDBC框架概述
    数据库中的DDL/DML/DCL解释(转)
    沉默的螺旋--digest
    左边老师长征--性命、生命、使命
    柬埔寨旅游小结
    Spring Security 源码分析(四):Spring Social实现微信社交登录
  • 原文地址:https://www.cnblogs.com/mthoutai/p/7289688.html
Copyright © 2011-2022 走看看