zoukankan      html  css  js  c++  java
  • 关于Logistic Regression的疑问

    1. 应用场景:首先要明确的是,Logistic Regression是用来分类的;
        与stanford的公开课进行类比,在该课程中所举的例子是根据训练集中房屋的各种feature(area,location等)和价格来预测测试集中的房屋价格,
    那么利用Logistic Regression就是来预测一种值域为[0,1]的label,如房屋价格上涨的概率p。若p>=0.5,则将其归为上涨;若p<0.5则将其归为不上涨。
        如你要根据数据来预测房价是否会上涨来决定是否现在买房,那么Logistic Regression很适合你的选择,因为你care的是房价是否会上涨,而不是具体某个楼盘的房价会是多少。
     
    2. 几率(odds):一个事件的几率(odds)是指该事件发生的概率与该事情不发生的概率的比值。
    对数几率(log odds):log(odds)
        设该事件发生的概率为p,则其对数几率为:
        logit(p) = ln(p/1-p) = w*x 解得
        p = exp(w*x)/ (1 + exp(w*x))
     
        这样我们就可以根据历史数据来得到房屋价格上涨的概率了,很神奇。
     
    3. 我的问题:
    (1).  为什么能够想到几率和对数几率?
    (2).  直接用线性回归的方法去估计概率会产生什么样的后果?
    即令: p = w*x。 查看了网上其他的一些理解认为: 不同的feature值相差的会比较大,如一个以100,一个是1,数据没有归一化,这样会使预测效果不好;但是我认为这样可以用w来调整下就可以了,如对于值为100的feature,w=0.01, 值为1的feature,w=1;这样好像就可以实现数据归一化了啊。
     
    看了这个http://blog.csdn.net/abcjennifer/article/details/7716281 之后,对为什么用线性回归不能很好的实现分类有了一点模糊的概念,但还是对
    这个Logistic Function对事件概率的映射原理不是很理解,求大神指点!
        
    多学习,多总结。
  • 相关阅读:
    通讯录封装实现
    简单通讯录的实现 main..h .m文件全部
    iOS 开发 OC编程 字典和集合 排序方法
    iOS 开发 OC编程 数组冒泡排序.图书管理
    iOS 开发 OC编程 属性和字符串练习
    iOS 开发 OC编程 属性和字符串
    iOS 开发 OC编程 便利构造器以及初始化方法
    iOS 开发 OC编程 方法的书写
    IOS 开发 OC编程 类和对象
    iOS 开发 c语言阶段考试题
  • 原文地址:https://www.cnblogs.com/yanhaiming/p/2955841.html
Copyright © 2011-2022 走看看