zoukankan      html  css  js  c++  java
  • 《BI那点儿事》三国数据分析系列——蜀汉五虎上将与魏五子良将武力分析,绝对的经典分析

    献给广大的三国爱好者们,希望喜欢三国的朋友一起讨论,加深对传奇三国时代的了解

    数据分析基础概念:
    集中趋势分析是指在大量测评数据分布中,测评数据向某点集中的情况。
    总体(population)是指客观存在的,并在同一性质的基础上结合起来的许多个别单位的整体,即具有某一特性的一类事物的全体,又叫母体或全域。简单地说,总体也就是我们所研究的性质相同个体的总和,用符号N表示。
    样本(sample),是指从总体中抽出的一部分个体。样本中所包含个体数目称样本容量或含量,用符号n表示。
    标准差与方差的区别:从公式上可以很明显看出,方差是标准差的平方,其余一模一样。
    那它们二者的区别就体现在,标准差是以最初的单位存在,而方差是以平方单位存在。

    建立准备分析环境:
    蜀汉五虎上将,是指罗贯中的长篇小说《三国演义》中,蜀汉昭烈帝刘备麾下的五员猛将,分别是:关羽、张飞、赵云、马超、黄忠。原文描写为“五虎大将”,后人惯称“五虎上将”。

    SELECT  *
    FROM    FactSanguo11
    WHERE   姓名 IN ( N'关羽', N'张飞', N'赵云', N'马超', N'黄忠' )


    关羽、张飞、赵云、马超、黄忠武力值为:97,98,96,97,93
    分析过程:

    验证分析结果:

    SELECT  AVG([武力]) AS 均值 ,
            VARP([武力]) AS 总体方差 ,
            VAR([武力]) AS 样本方差 ,
            STDEVP([武力]) AS 总体标准差 ,
            STDEV([武力]) AS 样本标准差
    FROM    FactSanguo11
    WHERE   姓名 IN ( N'关羽', N'张飞', N'赵云', N'马超', N'黄忠' )



    魏五子良将
    五子良将是指三国时期,曹魏势力的五位将军,即前将军张辽、右将军乐进、左将军于禁、征西车骑将军张郃以及右将军徐晃。
    陈寿撰写魏书卷十七时,将此五人合传,叙述诸将生平事迹后评曰:“太祖建兹武功,而时之良将,五子为先”,因此现代人将其称之为“五子良将”或“魏五子”。

    SELECT  *
    FROM    FactSanguo11
    WHERE   姓名 IN ( N'张辽', N'乐进', N'于禁', N'张郃', N'徐晃' )


    张辽、乐进、于禁、张郃、徐晃 武力值为:92,84,78,89,90
    分析过程:

    验证分析结果:

    SELECT  AVG([武力]) AS 均值 ,
            VARP([武力]) AS 总体方差 ,
            VAR([武力]) AS 样本方差 ,
            STDEVP([武力]) AS 总体标准差 ,
            STDEV([武力]) AS 样本标准差
    FROM    FactSanguo11
    WHERE   姓名 IN ( N'张辽', N'乐进', N'于禁', N'张郃', N'徐晃' )



    分析结论:

    蜀汉五虎上将

    魏五子良将

    1均值

    96.2

    86.6

    2中位数

    97

    89

    3众数

    97

    -

    4最大

    98

    92

    5最小

    93

    78

    6极差

    5

    14

    7总体方差

    2.96

    25.44

    8总体标准差

    1.72

    5.04

    9样本方差

    3.7

    31.80

    10样本标准差

    1.92

    5.64

    11 CV(sample)

    1.9958%

    CV(sample)= (1.92/96.2)*100%=1.9958%

    6.5127%

    CV(sample)= (5.64/86.6)*100%=6.5127%

    附录:蜀汉五虎上将、魏五子良将配图

  • 相关阅读:
    C# 模拟浏览器请求
    关于获取时间后,时间格式为几天前,几小时前格式转化
    关于通用的C#后台获取前台页面的标签的正则表达式
    关于getHTML()方法和getHtmlAjax()方法 GetHttpLength, 清除HTML标签
    性能测试术语
    聚合报告中90% Line涉及到百分位数的概念
    使用Windows的cmd运行(或通过批处理启动)Python项目(多目录项目)提示找不到模块的解决办法
    OSError: [WinError 6] 句柄无效的解决办法
    python中日志输出重复的解决办法
    截图方法get_screenshot_as_file()注意点
  • 原文地址:https://www.cnblogs.com/Bobby0322/p/4119752.html
Copyright © 2011-2022 走看看