用样本的频数分布估计总体分布(一)

主编:黄冈中学数学集体备课组

 

一、知识概述

1、频率分布表或频率分布条形图

  历史上有人通过作抛掷硬币的大量重复试验,得到了如下试验结果:

试验结果

频数

频率

正面向上(0)

36124

0.5011

反面向上(1)

35964

0.4989

  抛掷硬币试验的结果的全体构成一个总体,则上表就是从总体中抽取容量为72088的相当大的样本的频率分布表.尽管这里的样本容量很大,但由于不同取值仅有2个(用0和1表示),所以其频率分布可以用上表和下面的条形图表示.其中条形图是用高来表示取各值的频率.

  说明:(1)频率分布表在数量表示上比较确切,而频率分布条形图比较直观,两者相互补充,使我们对数据的频率分布情况了解得更加清楚.

  (2)①各长条的宽度要相同;②相邻长条之间的间隔要适当.

  当试验次数无限增大时,两种试验结果的频率值就成为相应的概率,得到下表,除了抽样造成的误差,精确地反映了总体取值的概率分布规律.这种整体取值的概率分布规律通常称为总体分布.

试验结果

概率

正面向上(记为0)

0.5

反面向上(记为1)

0.5

  说明:频率分布与总体分布的关系:

  (1)通过样本的频数分布、频率分布可以估计总体的概率分布.

  (2)研究总体概率分布往往可以研究其样本的频数分布、频率分布.

2、总体分布:总体取值的概率分布规律.

  在实践中,往往是从总体中抽取一个样本,用样本的频率分布去估计总体分布.一般地,样本容量越大,这种估计就越精确.

3、总体密度曲线:样本容量越大,所分组数越多,各组的频率就越接近于总体在相应各组取值的概率.设想样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线,这条曲线叫做总体密度曲线.

  它反映了总体在各个范围内取值的概率.根据这条曲线,可求出总体在区间(a,b)内取值的概率等于总体密度曲线,直线x=a,x=b及x轴所围图形的面积.

二、例题讲解

例1、对某班50人进行智力测验,其得分如下:48,65,52,86,71,48,64,41,86,79,71,68,82,84,68,64,62,68,81,57,90,52,74,73,56,78,47,66,55,64,56,88,69,40,73,97,68,56,67,59,70,52,79,44,55,69,62,58,32,58.

  (1)这次测试成绩的最大值和最小值是多少?

  (2)将[30,100]平分成7个小区间,试画出该班学生智力测验成绩的频率分布图;

  (3)分析这个频率分布图,你能得出什么结论?

解:

  (1)这次测验成绩中的最小值为32,最大值为97;

  (2)7个区间分别为.每一小区间内的长度是10,统计出各小区间内的数据频数,列表如下:

小区间

频数

1

6

12

14

9

6

2

频率

0.02

0.12

0.24

0.28

0.18

0.12

0.04

  频率分布图见视频.

  (3)可以看出,该班智力测验成绩大体上呈两头小、中间大、左右基本对称的钟形状态,说明该班学生智力特别好或特别差的是极少数,而智力一般的是多数,这是一种最常见的分布.

例2、(1)一个容量为32的样本,已知某组样本的频率为0.125,则该组样本的频数为( )

     A.2    B.4    C.6     D.8

  (2)容量为100的某个样本数据拆分为10组,并填写频率分布表,若前七组频率之和为0.79,而剩下的三组的频率依次相差0.05,则剩下的三组中频率最大的一组的频率为__________.

解:

  (1)已知样本容量为32,该组样本的频率为0.125,并且

  ∴该组样本的频数为0.125×32=4,故而选B.

  (2)设剩下的三组中频率最大的一组的频率为x,则另两组的频率分别为x-0.05,x-0.1.而由频率总和为1得0.79+(x-0.05)+(x-0.1)+x=1,解得x=0.12.故填0.12.

例3、某工厂对一批产品进行了抽样检测.下图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是( )

 

A.90    B.75    C.60    D.45

解析:

  产品净重小于100克的概率为(0.050+0.100)×2=0.300,已知样本中产品净重小于100克的个数是36,设样本容量为n,则,所以,净重大于或等于98克并且小于104克的产品的概率为(0.100+0.150+0.125)×2=0.75,所以样本中净重大于或等于98克并且小于104克的产品的个数是120×0.75=90,故选A.

答案:A

例4、为了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图,如图,由于不慎将部分数据丢失,但知道前4组的频数成等比数列,后6组的频数成等差数列,设最大频率为a,视力在4.6到5.0之间的学生数为b,则a,b的值分别为( )

A.0.27,78        B.0.27,83

C.2.7,78         D.2.7,83

解:

  由图象可知,前4组的公比为3,最大频率,设后六组公差为,则,解得:,后四组公差为-0.05,所以,视力在4.6到5.0之间的学生数为(0.27+0.22+0.17+0.12)×100=78(人).

答案:A

例5、在育民中学举行的电脑知识竞赛中,将九年级两个班参赛的学生成绩(得分均为整数)进行整理后分成五组,绘制如图所示的频率分布直方图.已知图中从左到右的第一、第三、第四、第五小组的频率分别是0.30,0.15,0.10,0.05,第二小组的频数是40.

  (1)求第二小组的频率,并补全这个频率分布直方图;

  (2)求这两个班参赛的学生人数是多少?

  (3)这两个班参赛学生的成绩的中位数应落在第几小组内?(不必说明理由)

解:

  (1)各小组的频率之和为1.00,第一、三、四、五小组的频率分别是0.30,0.15,0.10,0.05.

  ∴第二小组的频率为:1.00-(0.30+0.15+0.10+0.05)=0.40.

  ∵第二小组的频率为0.40,∴落在59.5~69.5的第二小组的小长方形的高=

  由此可补全直方图,补全的直方图如图所示.

  (2)设九年级两个班参赛的学生人数为x人.

  ∵第二小组的频数为40人,频率为0.40,∴=0.40,解得x=100(人).

  所以九年级两个班参赛的学生人数为100人.

  (3)九年级两个班参赛学生的成绩的中位数应落在第二小组内.

 
年级
         课程名称  
 免费听课
课程详情
高一全科点睛班课程
高一全科强化班课程
高二全科全年强化班
高三全科强化班课程
初一全科强化班课程
初一全科点睛班课程
初二全科强化班视频
初二全科点睛班课程
初三全科强化班
全科巨无霸同步提高课程
小学全年全科强化班

 

 

 

- 返回 -