1、标准差
标准差是样本数据到平均数的一种平均距离,一般用s表示.
2、平均距离
所谓“平均距离”,其含义可以作如下理解:
假设样本数据是x1,x2,…,xn,
表示这组数据的平均数,xi到
的距离是|xi-
|(i=1,2,…,n).
于是样本数据x1,x2,…,xn到
的“平均距离”是

由于上式含有绝对值,运算不太方便,因此,通常改用如下公式来计算标准差

3、方差:
标准差的平方称为方差.
例1、某校甲、乙两个班级各有5名编号为1,2,3,4,5的学生进行投篮练习,每人投10次,投中的次数如下表:
学生 |
1号 |
2号 |
3号 |
4号 |
5号 |
甲班 |
6 |
7 |
7 |
8 |
7 |
乙班 |
6 |
7 |
6 |
7 |
9 |
则以上两组数据的方差中较小的一个为s2=____________.
解析:
甲班数据的平均值为7,故方差
.
乙班数据的平均值为7,故方差
.
故甲方差较小,为
.
例2、在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是( )
A.甲地:总体均值为3,中位数为4
B.乙地:总体均值为1,总体方差大于0
C.丙地:中位数为2,众数为3
D.丁地:总体均值为2,总体方差为3
解:
根据信息可知,连续10天内,每天的新增疑似病例不能有超过7的数,选项A中,中位数为4,可能存在大于7的数;同理,在选项C中也有可能;选项B中的总体方差大于0,叙述不明确,如果数目太大,也有可能存在大于7的数;选项D中,根据方差公式,如果有大于7的数存在,那么方差不会为3,故答案选D.
答案:D
例3、已知样本
的平均数是
,标准差是
,则xy=___________.
解:
,
又
展开得
.
答案:96
例4、数据
的方差为
,平均数为
,则
(1)数据
的标准差为___________,平均数为___________.
(2)数据
的标准差为__________,平均数为___________.
解:
(1)
.

(2)
.

答案:
(1)
,
;(2)
,
例5、已知总体的各个体的值由小到大依次为2,3,3,7,a,b,12,13.7,18.3,20,且总体的中位数为10.5,平均数为10.若要使该总体的方差最小,则a、b的取值分别是___________.
解析:
这10个数的中位数为=10.5,
这10个数的平均数为10.
要使总体方差最小,
即(a-10)2+(b-10)2最小.
又∵(a-10)2+(b-10)2=(21-b-10)2+(b-10)2
=(11-b)2+(b-10)2=2b2-42b+221,
∴当b=10.5时,(a-10)2+(b-10)2取得最小值.
又∵a+b=21,
∴a=10.5,b=10.5.
答案:a=10.5,b=10.5
例6、甲、乙两机床同时加工直径为100cm的零件,为检验质量,从中抽取6件测量数据为:
甲:99 100 98 100 100 103
乙:99 100 102 99 100 100
(1)分别计算两组数据的平均数及方差;
(2)根据计算说明哪台机床加工零件的质量更稳定.
解析:
(1)
[99+100+98+100+100+103]=100,
[99+100+102+99+100+100]=100,
[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]=
,
[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1.
(2)
,故乙机床加工零件的质量更稳定.