但当无法获得所有数据时,就可以对整体数据进行抽样(抽样方式这就不详细介绍) 。抽样的结果就被称作样本,样本的作用是对总体的数据进行统计推断的 。当使用样本数据时,样本标准差始终用作总体标准差的估计值 。在这个公式中使用 n 往往会给你一个有偏差的估计,它总会低估可变性 。
将样本 n 减少到 n - 1 会使标准偏差人为地变大 , 从而提供对变异性的保守估计 。虽然这不是无偏估计,但它是对标准差的偏少估计:高估而不是低估样本的可变性更好 。

文章插图
标准差低 - 数据点往往接近平均值 标准差高 - 数据点分布在大极差的值上
什么是变异性的最佳衡量标准?可变性的最佳衡量标准取决于不同衡量标准和分布水平 。
对于在序数水平上测量的数据,极差和四分位距是唯一合适的变异性度量 。
对于更复杂的区间和比率的数据,标准差和方差也适用 。
对于正态分布,可以使用所有度量 。但标准差和方差是首?。?因为它们考虑了整个数据集 , 但这也意味着它们很容易受到异常值的影响 。
对于偏态分布或具有异常值的数据集 , 四分位距是最好的度量 。它受极值影响最?。蛭嘀赜谑菁屑涞牟糠?。
作者;Ashish Kumar Singh

文章插图
关于极差、方差、标准差极差是指一组测量值内最大值与最小值之差,又称范围误差或全距,以R表示 。它是标志值变动的最大范围,它是测定标志变动的最简单的指标 。
极差没有充分利用数据的信息,但计算十分简单,仅适用样本容量较?。╪<10)情况 。
方差是各个数据与平均数之差的平方和的平均数 。在概率论和数理统计中,方差(英文Variance)用来度量随机变量和其数学期望(即均值)之间的偏离程度 。
方差,通俗点讲,就是和中心偏离的程度!用来衡量一批数据的波动大?。凑馀萜肫骄拇笮 。┎阉凶稣庾槭莸姆讲?。在样本容量相同的情况下,方差越大 , 说明数据的波动越大,越不稳定 。
标准差(Standard Deviation),中文环境中又常称均方差,但不同于均方误差(mean squared error , 是各数据偏离平均数的距离平方的平均数,也即误差平方和的平均数,计算公式形式上接近方差,它的开方叫均方根误差,均方根误差才和标准差形式上接近),标准差是离均差平方和平均后的方根,用σ表示 。标准差是方差的算术平方根 。标准差能反映一个数据集的离散程度 。平均数相同的,标准差未必相同 。
简单来说,标准差是一组数据平均值分散程度的一种度量 。一个较大的标准差,代表大部分数值和其平均值之间差异较大;一个较小的标准差,代表这些数值较接近平均值 。
例如 , 两组数的集合 {0,5,9,14} 和 {5,6,8,9} 其平均值都是 7 ,但第二个集合具有较小的标准差 。
标准差可以当作不确定性的一种测量 。例如在物理科学中,做重复性测量时,测量数值集合的标准差代表这些测量的精确度 。当要决定测量值是否符合预测值,测量值的标准差占有决定性重要角色:如果测量平均值与预测值相差太远(同时与标准差数值做比较),则认为测量值与预测值互相矛盾 。这很容易理解,因为如果测量值都落在一定数值范围之外,可以合理推论预测值是否正确 。
标准差应用于投资上,可作为量度回报稳定性的指标 。标准差数值越大,代表回报远离过去平均数值 , 回报较不稳定故风险越高 。相反,标准差数值越小,代表回报较为稳定 , 风险亦较小 。
- 日本的变化,日本变异巨型鱿鱼
- 二婚和复婚哪个会幸福过来人坦言 二婚和复婚,哪个会相对幸福一点?
- 一半雌一半雄这只罕见的变异双性怪鸟可能还会谈恋爱
- 齐桓公晚年时,为什么将太子拖付费实力相对较弱的宋襄公?
- 二婚离婚还能复婚吗 二婚和复婚,哪个会相对幸福一点?
- 安倍晴明的后代有哪些
- 各地口音是怎么形成的
- 小辣椒变异是钢铁侠几
- 上班创业两不误 上古天庭和玉帝天庭
- 痛苦的婚姻太压抑了 我的用心换来的是冷漠相对
