主编:黄冈中学数学集体备课组
一、知识概述
1、频率分布表或频率分布条形图
历史上有人通过作抛掷硬币的大量重复试验,得到了如下试验结果:
试验结果 |
频数 |
频率 |
正面向上(0) |
36124 |
0.5011 |
反面向上(1) |
35964 |
0.4989 |
抛掷硬币试验的结果的全体构成一个总体,则上表就是从总体中抽取容量为72088的相当大的样本的频率分布表.尽管这里的样本容量很大,但由于不同取值仅有2个(用0和1表示),所以其频率分布可以用上表和下面的条形图表示.其中条形图是用高来表示取各值的频率.

说明:(1)频率分布表在数量表示上比较确切,而频率分布条形图比较直观,两者相互补充,使我们对数据的频率分布情况了解得更加清楚.
(2)①各长条的宽度要相同;②相邻长条之间的间隔要适当.
当试验次数无限增大时,两种试验结果的频率值就成为相应的概率,得到下表,除了抽样造成的误差,精确地反映了总体取值的概率分布规律.这种整体取值的概率分布规律通常称为总体分布.
试验结果 |
概率 |
正面向上(记为0) |
0.5 |
反面向上(记为1) |
0.5 |
说明:频率分布与总体分布的关系:
(1)通过样本的频数分布、频率分布可以估计总体的概率分布.
(2)研究总体概率分布往往可以研究其样本的频数分布、频率分布.
2、总体分布:总体取值的概率分布规律.
在实践中,往往是从总体中抽取一个样本,用样本的频率分布去估计总体分布.一般地,样本容量越大,这种估计就越精确.
3、总体密度曲线:样本容量越大,所分组数越多,各组的频率就越接近于总体在相应各组取值的概率.设想样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线,这条曲线叫做总体密度曲线.

它反映了总体在各个范围内取值的概率.根据这条曲线,可求出总体在区间(a,b)内取值的概率等于总体密度曲线,直线x=a,x=b及x轴所围图形的面积.
二、例题讲解
例1、对某班50人进行智力测验,其得分如下:48,65,52,86,71,48,64,41,86,79,71,68,82,84,68,64,62,68,81,57,90,52,74,73,56,78,47,66,55,64,56,88,69,40,73,97,68,56,67,59,70,52,79,44,55,69,62,58,32,58.
(1)这次测试成绩的最大值和最小值是多少?
(2)将[30,100]平分成7个小区间,试画出该班学生智力测验成绩的频率分布图;
(3)分析这个频率分布图,你能得出什么结论?
解:
(1)这次测验成绩中的最小值为32,最大值为97;
(2)7个区间分别为 .每一小区间内的长度是10,统计出各小区间内的数据频数,列表如下:
小区间 |

|

|

|

|

|

|

|
频数 |
1 |
6 |
12 |
14 |
9 |
6 |
2 |
频率 |
0.02 |
0.12 |
0.24 |
0.28 |
0.18 |
0.12 |
0.04 |
频率分布图见视频.
(3)可以看出,该班智力测验成绩大体上呈两头小、中间大、左右基本对称的钟形状态,说明该班学生智力特别好或特别差的是极少数,而智力一般的是多数,这是一种最常见的分布.
例2、(1)一个容量为32的样本,已知某组样本的频率为0.125,则该组样本的频数为( )
A.2 B.4 C.6 D.8
(2)容量为100的某个样本数据拆分为10组,并填写频率分布表,若前七组频率之和为0.79,而剩下的三组的频率依次相差0.05,则剩下的三组中频率最大的一组的频率为__________.
解:
(1)已知样本容量为32,该组样本的频率为0.125,并且 .
∴该组样本的频数为0.125×32=4,故而选B.
(2)设剩下的三组中频率最大的一组的频率为x,则另两组的频率分别为x-0.05,x-0.1.而由频率总和为1得0.79+(x-0.05)+(x-0.1)+x=1,解得x=0.12.故填0.12.
例3、某工厂对一批产品进行了抽样检测.下图是根据抽样检测后的 产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是( )
A.90 B.75 C.60 D.45
解析:
产品净重小于100克的概率为(0.050+0.100)×2=0.300,已知样本中产品净重小于100克的个数是36,设样本容量为n,则 ,所以 ,净重大于或等于98克并且小于104克的产品的概率为(0.100+0.150+0.125)×2=0.75,所以样本中净重大于或等于98克并且小于104克的产品的个数是120×0.75=90,故选A.
答案:A
例4、为了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图,如图,由于不慎将部分数据丢失,但知道前4组的频数成等比数列,后6组的频数成等差数列,设最大频率为a,视力在4.6到5.0之间的学生数为b,则a,b的值分别为( )

A.0.27,78 B.0.27,83
C.2.7,78 D.2.7,83
解:
由图象可知,前4组的公比为3,最大频率 ,设后六组公差为 ,则 ,解得: ,后四组公差为-0.05,所以,视力在4.6到5.0之间的学生数为(0.27+0.22+0.17+0.12)×100=78(人).
答案:A
例5、在育民中学举行的电脑知识竞赛中,将九年级两个班参赛的学生成绩(得分均为整数)进行整理后分成五组,绘制如图所示的频率分布直方图.已知图中从左到右的第一、第三、第四、第五小组的频率分别是0.30,0.15,0.10,0.05,第二小组的频数是40.

(1)求第二小组的频率,并补全这个频率分布直方图;
(2)求这两个班参赛的学生人数是多少?
(3)这两个班参赛学生的成绩的中位数应落在第几小组内?(不必说明理由)
解:
(1)各小组的频率之和为1.00,第一、三、四、五小组的频率分别是0.30,0.15,0.10,0.05.
∴第二小组的频率为:1.00-(0.30+0.15+0.10+0.05)=0.40.
∵第二小组的频率为0.40,∴落在59.5~69.5的第二小组的小长方形的高= .
由此可补全直方图,补全的直方图如图所示.

(2)设九年级两个班参赛的学生人数为x人.
∵第二小组的频数为40人,频率为0.40,∴ =0.40,解得x=100(人).
所以九年级两个班参赛的学生人数为100人.
(3)九年级两个班参赛学生的成绩的中位数应落在第二小组内.
- 返回 - |