1、众数
众数是样本观测值中出现次数最多的数,在频率分布直方图中它是最高的矩形的中点.
样本众数通常用来表示分类变量的中心值,容易计算,但是它只能表达样本数据中的很少一部分信息,通常用于描述分类变量的中心位置.
2、中位数
将一组数据按大小依次排列,把处在最中间位置的一个数据(或两个数据的平均数)叫做这组数据的中位数.
在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此来估计中位数的值.
中位数不受几个极端数据(即排序靠前或靠后的数据)影响,容易计算.它仅利用了数据中排在中间数据的信息.当样本数据质量比较差,即存在“一些错误数据”(如数据的录入错误或测量错误等)时,应该用抗极端数据强的中位数表示数据的中心值.
3、平均数
平均数是频率分布直方图的“重心”.由于平均数与样本的每一个数据都有关,所以任何一个样本数据的改变都会引起平均数的改变.因此,平均数可以反映出更多的关于样本数据全体的信息.一般情况下,一组数据的平均值可以反映出这组数据的一般情况,比如某班一次考试成绩的平均分可以反映出该班学生该科的学习水平.但特殊情况下,平均值可能受某几个极端值的影响,而偏离一般情况.
体验:运动员参加体操比赛,当评委亮分后,其成绩往往是先去掉一个最高分,去掉一个最低分,再计算剩下分数的平均值,这是因为( )
A.减少计算量 B.避免故障
C.剔除异常值 D.活跃赛场气氛
答案:C
例1、10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12,设其平均数为a,中位数为b,众数为c,则有( )
A.
B.
C.
D.
解:
总和为147,a=14.7;样本数据17分布最广,即频率最大,为众数,
;从小到大排列,中间一位,或中间二位的平均数为中位数,即
.
答案:D
例2、设矩形的长为a,宽为b,其比满足
∶
=
,这种矩形给人以美感,称为黄金矩形.黄金矩形常应用于工艺品设计中.下面是某工艺品厂随机抽取两个批次的初加工矩形宽度与长度的比值样本:
甲批次:0.598 0.625 0.628 0.595 0.639
乙批次:0.618 0.613 0.592 0.622 0.620
根据上述两个样本来估计两个批次的总体平均数,与标准值0.618比较,正确结论是( )
A.甲批次的总体平均数与标准值更接近
B.乙批次的总体平均数与标准值更接近
C.两个批次总体平均数与标准值接近程度相同
D.两个批次总体平均数与标准值接近程度不能确定
解:
甲批次的平均数为0.617,乙批次的平均数为0.613.
答案:A
例3、甲、乙两人在10天中每天加工零件的个数用茎叶图表示如下,中间一列的数字表示零件个数的十位数,两边的数字表示零件个数的个位数.则这10天甲、乙两人日加工零件的平均数分别为_______和_______.

解:
甲加工零件的平均数为
=24;
乙加工零件的平均数为
.
答案:24,23
例4、某工厂人员及工资构成如下:
人员 |
经理 |
管理人员 |
高级技工 |
工人 |
学徒 |
合计 |
周工资 |
2200 |
250 |
220 |
200 |
100 |
2970 |
人数 |
1 |
6 |
5 |
10 |
1 |
23 |
合计 |
2200 |
1500 |
1100 |
2000 |
100 |
6900 |
(1)指出这个问题中的众数、中位数、平均数;
(2)这个问题中,平均数能客观地反映该工厂的工资水平吗?为什么?
解:
(1)由表格可知:众数为200,中位数为220.
平均数为(2200+1500+1100+2000+100)÷23=6900÷23=300.
(2)虽然平均数为300元/周,但由表格中所列出的数据可见,只有经理在平均数上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平.
例5、某校学生日睡眠时间的抽样频率分布见下表:
睡眠时间(小时) |
人数 |
频率 |
[6,6.5) |
5 |
0.05 |
[6.5,7) |
17 |
0.17 |
[7,7.5) |
33 |
0.33 |
[7.5,8) |
37 |
0.37 |
[8,8.5) |
6 |
0.06 |
[8.5,9] |
2 |
0.02 |
合计 |
100 |
1 |
试估计该校学生的平均日睡眠时间.
解:
总的日睡眠时间约为:
6.25×5+6.75×17+7.25×33+7.75×37+8.25×6+8.75×2=739小时.
故日平均睡眠时间约为739÷100=7.39小时.
例6、某工厂有工人1000名,其中250名工人参加过短期培训(称为A类工人),另外750名工人参加过长期培训(称为B类工人).现用分层抽样方法(按A类,B类分二层)从该工厂的工人中共抽查100名工人,调查他们的生产能力(生产能力指一天加工的零件数).
(1)A类工人中和B类工人各抽查多少工人?
(2)从A类工人中抽查结果和从B类工人中的抽查结果分别如下表1和表2
(i)先确定
,再完成下列频率分布直方图.就生产能力而言,A类工人中个体间的差异程度与B类工人中个体间的差异程度哪个更小?(不用计算,可通过观察直方图直接回答结论)

(ii)分别估计A类工人和B类工人生产能力的平均数,并估计该工厂工人和生产能力的平均数(同一组中的数据用该区间的中点值作代表).
解:
(1)A类工人中和B类工人中分别抽查25名和75名.
(2)(ⅰ)由
,得
,
,得
.
频率分布直方图如下: