zoukankan      html  css  js  c++  java
  • SAS学习 day9

    逻辑回归

     假设在自变量X1,X2,..Xn作用下,某事件发生的概率为p,则该事件不发生的概率为1-p ,p/(1-p) 为发生的概率和不发生的概率之比,记做优势odds 若对odds取自然对数,得到

    称为P的logit变换,

    则logistic回归模型为:

    则概率计算公式为

     

    没有连续的值的情况称作哑变量

     当自变量X是离散型变量时,SAS自动将其设为哑变量,根据X的水平数的不同,如X有水平数N,则相应的哑变量有N-1个

     

     
    德国 60 20
    巴西 90 10

    德国赢得概率:60/80=0.75

    德国输的概率:20/80 =0.25

    德国的odds :0.75/0.25=3 同理 巴西的odds = 0.9/0.1 =9

    巴西对德国的odds ratios = 3/1

    哑变量和odds

    proc logistic data = lg.b_sales_inc;
    class gender (param=ref ref = "Male")
          income(param =ref ref = "Low");
    model purchase(event='1')=gender/ selection=backward;
    run;

     

    总配对数 :1的个数有多少个乘以0的个数有多少个  

    percent Concordant(一致部分所占百分比):预测1的概率大于0的概率的配对数占总配对数的比

    percent Discordant(不一致部分所占百分比):预测1的概率小于0的概率的配对数占总配对数的比

    percent Tied(结值百分比):预测1的概率等于0的概率的配对数占总配对数的比

    pairs(对):所有1的个数乘以所有0的个数即总配对数

    c统计量 :percent Concordant + percent Tied/2

     一致性比率percent concordant越大 说明预测值与观测值在现有水平上有较强的关联性,回归模型有很强的预测能力。

  • 相关阅读:
    测量MySQL的表达式和函数的速度
    MySQL中的比较操作符<=>
    Python中的args和kwargs
    MySQL8新特性(2)--mysql的升级过程
    MySQL8新特性(1)--原子DDL
    PostgreSQL中的一些日志
    PostgreSQL的表空间
    [九]基础数据类型之Boolean详解
    [八]基础数据类型之Double详解
    [七]基础数据类型之Float详解
  • 原文地址:https://www.cnblogs.com/suizhixxie/p/10406530.html
Copyright © 2011-2022 走看看