zoukankan      html  css  js  c++  java
  • 查准率和召回率理解

    问题:

    • 数据倾斜:
      癌症预测为例,以为数据分布不均,导致准确率失真。
    • 精准率和召回率是两个度量值,用来评价推荐结果的质量。

    1. 精确率是指检索出的相关文档与检索出的文档总数的比率,衡量的是检索系统的查准率。简单来说就是指检索出来的条目有多少条是准确的。

    公式为:

    Precision = 提取出的准确信息数div提取出的信息总数

    举个例子,一座猴山里有100只猴子,50只公猴子,50只母猴子。现在需要抓出来公猴子,于是一共取出来30只猴子,其中公猴子有20只。那么抓出公猴子的精准率就是: 20div30=0.6667

    2. 召回率是指检索出的相关文档和文档中所有相关文档数的比率,衡量的是检索系统的查全率。在库里所有准确的条目有多少条被检索出来了。

    公式为:

    Recall=提取出的正确信息数div样本的信息条数

    还是在那座猴山里,同时还是要抓公猴子,取出来30只猴子,其中公猴子还是20只。那么抓出来公猴子的召回率就是: 20div50=0.4

    当你想要公猴子时,我给你推荐了30只猴子,精准率就是66.7%,召回率就是40%。

    思考:

    这个时候,精准率和召回率都有了,但是两个比率不一样啊,咋整。此时,我们就需要引入一个词,叫做 F 值。

    F值简单来说就是综合了精准率和召回率得出的结果。

    公式为:

    F=(2	imes Precision	imes Recall)div(Precision+Recall)

    所以推荐给你的猴子到底靠不靠谱呢,看看最终结果。

    F=(2	imes0.67	imes0.4)div(0.67+0.4)=0.5

    结果就表明,推荐给你的猴子里,有50%是你想要的公猴子。

  • 相关阅读:
    Count and Say leetcode
    Find Minimum in Rotated Sorted Array II leetcode
    Find Minimum in Rotated Sorted Array leetcode
    Search in Rotated Sorted Array II leetcode
    search in rotated sorted array leetcode
    Substring with Concatenation of All Words
    Subsets 子集系列问题 leetcode
    Sudoku Solver Backtracking
    Valid Sudoku leetcode
    《如何求解问题》-现代启发式方法
  • 原文地址:https://www.cnblogs.com/mlan/p/8361400.html
Copyright © 2011-2022 走看看