
可汗学院统计学学习笔记(1)1-16集
第⼀集:均值 中位数 众数
均值:平均数,算数平均数
均值计算:所有数字相加之和除以数字的个数
均值的意义:衡量集中趋势的⽅法
中位数:中间的数
中位数计算:奇数个数据为中间值,偶数个则中间两个值的均值
中位数意义:衡量集中趋势的另⼀种⽅法,是⼀个数字描述中间的⼀种⽅式。
众数:数据集中出现频率最多的数字
第⼆集:极差 中程数
极差:指的是数据集中数字分开的有多远
极差计算:数据集中最⼤的数 - 数据集中最⼩的数
极差意义:极差数值越⼩,数字之间就越紧密
中程数:最⼤数和最⼩数的平均值(算术平均值)
中程数意义:衡量数据的集中趋势
第三集:象形统计图
象形统计图是⽤象形图像表⽰数据的⼀种⽅式
⽰例图⽚
第四集:条形图
⽰例图⽚
第五集:线形图
线形图可以⽤于随时间变化的事物
⽰例图⽚
第六集:饼图
⽰例图⽚
第七集:误导⼈的线形图
两张线形图对⽐时纵坐标或横坐标的刻度设置应该以统⼀标准进⾏,不然容易产⽣误导。
⽰例图⽚
第⼋集:茎叶图
叶表⽰最右边的位/各位,茎代表其它位,如⼗位,下图很好表现了球员得分在分布中的位置以及整体数据的分布状况
⽰例图⽚
第九集:箱线图
箱线图/盒须图是为了体现中位数和散布情况
核须图会展现数据⾮散布情况,按照四分位进⾏划分,它能显⽰出数据的中位数在哪
⾸先需要对数据集中数据进⾏排序,找出数据集的中位数M
其次需要找到⼩于中位数各数的中位数M1(下四分位数)以及⼤于中位数各数的中位数M2(上四分位数),此时相当于将数据集划分为四个⼦
集,盒须图是这个划分的图像表⽰
作盒须图⼤的第⼀件事就是显⽰所有数据的范围
⽰例图⽚
第⼗集:箱线图2
⽰例图⽚
第⼀四分区间/1Q…………
第⼗⼀集 统计:集中趋势
统计学分类 Statistics
描述统计学 descriptive statistics 假设有⼀个数据集,在不告诉别⼈所有数据的情况下介绍这些数据的情况,通过⼀些指⽰性数字来代表所有
的数据,⽽⽆需将所有的数据都说⼀次。
推论统计学 inferential statics 运⽤数据来对事物做结论,假设从总体中得到了⼀些样本,只需对样本进⾏⼀些数学计算,便有可能推断出整体
的总体情况
下⾯先从描述统计学⼊⼿:
如果提供⼀组数据需要我们对其进⾏描述,我们可能需要找到其中最能代表这组数据的个别数字,或者是⼀些能体现集中趋势的数字
⼴义的平均数:描述集中趋势的某特定数值 Average/最能代表⼀组数据的某个值 ,不是均值 / mean
这个⼴义的平均数可以是均值、中位数或众数
因为离群值的⼲扰,有时候众数或中位数⽐均值更能反应数据的集中趋势/描述这组数字
第⼗⼆集 统计:样本和总体
希腊字母μ代表总体均值 X上加⼀横表⽰样本均值
第⼗三集 统计:总体⽅差
⽅差记作 δ^2,即δ的平⽅
⽅差是为了更好的理解数据结构,在不放出全部数据的情况下描述数据总体
总体⽅差计算公式:(∑(x(i) - μ)^2) / N
直观来说,⽅差和标准差都可以⽤来衡量数据集中的数据点距离均值的远近程度
第⼗四集 统计:样本⽅差
Sn^2 为样本⽅差记号,下标n表⽰样本数为n个
Sn^2 = ∑(x(i) - 样本均值)^2/ n
上述的样本⽅差通常会低估总体⽅差,更好的总体估计⽅差(⽆偏⽅差)计算如下:
S(n-1)^2 = ∑(x(i) - 样本均值) ^2/ (n-1)
第⼗五集 统计:标准差
标准差在⽅差的基础上来看很简单,就是⽅差的平⽅根,总体标准差记作δ,样本的标准差记作S
为什么使⽤标准差
1.标准差的单位更好,⽐如数据单位为cm,则⽅差计算结果单位为cm^2,⽽标准差计算结果单位为cm
2.假设事物分布是钟型曲线,这可以帮助求得事物落在均值⼀两个标准差范围内的概率
第⼗六集 统计:诸⽅差公式
求总体⽅差公式可以化简为:总体所有数的平⽅求均值,然后减去总体均值的平⽅
�
⾸先需要对数据集中数据进⾏排序,找出数据集的中位数M
其次需要找到⼩于中位数各数的中位数M1(下四分位数)以及⼤于中位数各数的中位数M2(下四分位数)以及⼤于中位数各数的中位数M2(上四分位数),此时相当于将数据集划分为上四分位数),此时相当于将数据集划分为
四个⼦集,盒须图是这个划分的图像表⽰
作盒须图⼤的第⼀件事就是显⽰所有数据的范围
⽰例图⽚
第⼗集:箱线图2
⽰例图⽚
第⼀四分区间/1Q…………
第⼗⼀集 统计:集中趋势
统计学分类 Statistics
描述统计学 descriptive statistics 假设有⼀个数据集,在不告诉别⼈所有数据的情况下介绍这些数据的情况,通过⼀些指⽰性数字
来代表所有的数据,⽽⽆需将所有的数据都说⼀次。
推论统计学 inferential statics 运⽤数据来对事物做结论,假设从总体中得到了⼀些样本,只需对样本进⾏⼀些数学计算,便有可能
推断出整体的总体情况
下⾯先从描述统计学⼊⼿:
如果提供⼀组数据需要我们对其进⾏描述,我们可能需要找到其中最能代表这组数据的个别数字,或者是⼀些能体现集中趋势的数字
⼴义的平均数:描述集中趋势的某特定数值 Average/最能代表⼀组数据的某个值 ,不是均值 / mean
这个⼴义的平均数可以是均值、中位数或众数
因为离群值的⼲扰,有时候众数或中位数⽐均值更能反应数据的集中趋势/描述这组数字
第⼗⼆集 统计:样本和总体
希腊字母μ代表总体均值 X上加⼀横表⽰样本均值
第⼗三集 统计:总体⽅差
⽅差记作 δ^2,即δ的平⽅
⽅差是为了更好的理解数据结构,在不放出全部数据的情况下描述数据总体
总体⽅差计算公式:(∑(x(i) - μ)^2) / N
直观来说,⽅差和标准差都可以⽤来衡量数据集中的数据点距离均值的远近程度
第⼗四集 统计:样本⽅差
Sn^2 为样本⽅差记号,下标n表⽰样本数为n个
Sn^2 = ∑(x(i) - 样本均值)^2/ n
上述的样本⽅差通常会低估总体⽅差,更好的总体估计⽅差(⽆偏⽅差)计算如下:
S(n-1)^2 = ∑(x(i) - 样本均值) ^2/ (n-1)
第⼗五集 统计:标准差
标准差在⽅差的基础上来看很简单,就是⽅差的平⽅根,总体标准差记作δ,样本的标准差记作S
为什么使⽤标准差
1.标准差的单位更好,⽐如数据单位为cm,则⽅差计算结果单位为cm^2,⽽标准差计算结果单位为cm
2.假设事物分布是钟型曲线,这可以帮助求得事物落在均值⼀两个标准差范围内的概率
第⼗六集 统计:诸⽅差公式
求总体⽅差公式可以化简为:总体所有数的平⽅求均值,然后减去总体均值的平⽅

本文发布于:2023-05-22 21:12:31,感谢您对本站的认可!
本文链接:https://www.wtabcd.cn/zhishi/a/168476115149472.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文word下载地址:可汗学院统计学学习笔记(1)1-16集.doc
本文 PDF 下载地址:可汗学院统计学学习笔记(1)1-16集.pdf
| 留言与评论(共有 0 条评论) |