日期:2022-02-14
这是样本估计,是优秀的数学教案文章,供老师家长们参考学习。
矩估计
最简单的矩估计法是用一阶样本原点矩估计总体期望,而用二阶样本中心矩估计总体方差。
最大似然估计
最合理的参数估计量应该是使得从模型中抽取该n组样本观测值的概率最大。
最小二乘法
最小二乘法是正态分布下最大似然估计的特例。
KL散度
相对熵,来源于信息论的方法。和最大似然也是殊途同归。
最小均方误差
看起来和二小乘一样
最大后验估计
来自于贝叶斯估计
1、数据的两个特征:集中趋势和波动性。集中趋势指的是数据的“一般水平”或曰“平均水平”,波动性指的是数据围绕“平均值”的变化情况。
2、反映数据“大多数水平”(集中趋势)的量——众数
众数:即样本数据中频数最大(或频率最高)的数据。
特点:①可以不存在或不止一个;
②不受极端数据的影响,求法简单;
③可靠性差,如0,0,2,3,5这组数据中,众数是0,它很难真实反映这组数据的“平均水平”(集中趋势);
④众数在难以定义“平均数”或“中位数”时常用,故一般可用于统计非数字型数据,如“牛,羊,马,鱼,牛”这组数据中,众数是“牛”;
⑤众数在销售统计中常用
3、反映数据“中间水平”(集中趋势)的量——中位数
中位数:把一组数据按从小到大的数序排列,在中间的一个数字(或两个数字的平均值)叫做这组数据的中位数。
特点:①中位数把样本数据分为两部分,一部分大于中位数,另一部分小于中位数;
②中位数不受少数几个极端值的影响;
③由于当样本数据为偶数个时,中位数等于中间两个数据的平均值,因此有时中位数未必在样本数据中
4、反映数据“平均水平”(集中趋势)的量——平均数
平均数:所有数据之和再除以数据的个数所得值,又称算术平均数。
公式:
特点:一般情况下能有效地反映数据的集中趋势;但易受极端值的影响,在极差较大的情况下,不如众数和中位数准确;
5、反映数据“波动范围”的量——极差
极差(R):一组测量数据中,最大值与最小值之差称为极差
特点:极差只指明了测定值的最大离散范围,而未能利用全部测量值的信息,不能精确反映测量值彼此相符合的程度;但计算简单
6、反映数据“波动大小”的量——方差
方差:样本中各数据与样本平均数的差的平方的平均数叫做样本方差(或均方差),随机变量X的方差可记作:S2(或D(X))。
特点:①方差越大,数据的波动性越大;
②
7、反映数据“波动大小”的量——标准差
标准差:方差的平方根,记作S。
特点:①标准差越大,数据的波动性越大;
②
8、用样本来估计总体:一般情况下,如果总体的容量较大,不便分析其数据特征,我们可以通过随机抽取一定的样本,通过样本的数据特征来对总体的数据特征进行估计;但难免有一定误差。
【典型例题】
考点一 合理选择统计量
例1、有一首打油诗“张村有个张千万,隔壁九个穷光蛋,平均起来算一算,人人都是张百万。”这首诗反映了什么现象?如何选择恰当的统计量来反映该村的收入水平?某次数学考试,婷婷得到 78分。全班共30人,其他同学的成绩为1个100分,4个90分,22个80分,以及1个2分和1个10分。婷婷计算出全班的平均分为 77分,所以婷婷告诉妈妈说,自己这次的成绩在班上处于“中上水平”。她说得对吗?如何选择恰当的统计量来反映她的成绩在班上的真实位置?
【分析】在极差较大的情况下,用平均数来反映数据的特征往往出现较大的偏差,具体表现为标准差较大,如打油诗中数据的标准差达到了惊人的3000000,而婷婷班上成绩数据的标准差也达到了19.93,所以才会出现基本上都是不名一文的村子却“人人都是百万富翁”以及排名倒数第三的成绩成了“中上水平”的不正常现象。
【答】上述现象表明:平均数受极端值影响较大,在极差较大的情况下,不宜用平均数来刻画数据的数字特征,可选用众数或中位数。
考点二 从统计图表中提取样本的数字特征
例2、已知一组数据共有二十个,它的频率分布直方图如下(纵轴表示频率):
试根据上图写出该组数据的中位数,众数,平均数并求其标准差。
【分析】①了解频率分布直方图的意义;②了解所求各量的意义。
【解】由图可知:该组数据的中位数是,众数是5,平均数
标准差S=1.64
【说明】如果已知各数据的频率,则求平均值时对频率与对应数据的积求和即可,即。
考点三 反映数据集中趋势的常用量——平均值
例3、在一次射击训练中,甲乙两位选手分别进行了10次射击测试,中靶成绩如下:
甲
10
10
9
9
8
10
10
7
9
8
乙
9
6
10
10
9
10
7
9
10
8
根据上表数据计算,谁的成绩更好?
【分析】①本题是根据10次测试的成绩来对选手的竞技状态进行评价,属于根据样本来对总体进行估计;②两组数据的极差均不大,因此可选用平均数来进行估计。
【解】,因为,因此甲的成绩好于乙的成绩。
考点四 反映数据波动性的常用量——方差或标准差
例4、甲乙两位选手在射击训练中的测试成绩如下:
甲
10
10
9
9
9
9
8
9
9
8
乙
9
6
10
10
9
10
9
9
10
8
根据上表回答:
①哪位选手的状态更好?
②按照历次比赛的数据统计,获奖选手平均中靶的环数至少为9.5,那么应该派哪位选手参赛较好?
【分析】①以这10次测试的平均成绩来进行估计;②经过计算可知,两位选手的平均成绩都不超过9.5,可结合稳定性来考虑;显然,稳定性越好,获奖的可能性越小。
【解】①,因此两位选手的平均成绩是相同的;但是,S甲=0.67,S乙=1.25,因为S甲<>乙,所以甲发挥得更稳定;
②由于,且S甲<>乙,因此可派出乙选手参加比赛。
说明:对第二个问题的处理,也可结合众数进行。甲的数据的众数是9,乙的数据的众数是10和9,反映出大多数情况下,甲能打出9环,而乙能打出9环或10环。
一、教学目标分析
1.知识与技能目标
(1)通过实例体会分布的意义和作用。
(2)在表示样本数据的过程中,学会列频率分布表,画频率分布直方图。
(3)通过实例体会频率分布直方图的特征,能准确地做出总体估计。
2、过程与方法目标:
通过对现实生活的探究,感知应用数学知识解决问题的方法,理解数形结合的数学思想和逻辑推理的数学方法。
3、情感态度与价值观目标:
通过对样本分析和总体估计的过程,感受数学对实际生活的需要,认识到数学知识源于生活并指导生活的事实,体会数学知识与现实世界的联系。
二、 教学的重点和难点
重点:会列频率分布表,画频率分布直方图。
难点:能通过样本的频率分布估计总体的分布。
三、教法与学法分析
1、教法:遵循观察、探究、发现、总结式的教学模式。重点以引导学生为主,让他们能积极、主动的进 行探索,获取知识。由于内容较繁琐,所以要借助多媒体辅助教学。
2、学法:根据本节知识的特点,由于学生已具备一定的基础知识,可采取研究性学习的学习方法。
四、教学过程
(一)情境引入
1.随机抽样有哪几种基本的抽样方法?
简单随机抽样、系统抽样、分层抽样.
2.随机抽样是收集数据的方法,如何通过样本数据所包含的信息,估计总体的基本特征,即
用样本估计总体,是我们需要进一步学习的内容.
3.高二某班有50名学生,在数学必修②结业考试后随机抽取10名,其考试成绩如下:
82, 75, 61, 93, 62, 55, 70, 68, 85, 78.
如果要求我们根据上述抽样数据,估计该班对数学模块②的总体学习水平,就需要有相应的数学方法作为理论指导,本节课我们将学习用样本的频率分布估计总体分布.
(二)新课讲解
知识探究(一):频率分布表
【问题】 我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.
通过抽样调查,获得100位居民2007年的月均用水量如下表(单位:t):
3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6 3.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.4 3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.3 2.8 2.3 2.2
1.7 1.3 3.6 1.7 0.6 4.1 3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3 3.0
2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3 2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4 2.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4 2.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2
思考1:上述100个数据中的最大值和最小值分别是什么?由此说明样本数据的变化范围是
什么?
0.2~4.3
思考2:样本数据中的最大值和最小值的差称为极差.如果将上述100个数据按组距为0.5进行分组,那么这些数据共分为多少组?
(4.3-0.2)÷0.5=8.2
思考3:以组距为0.5进行分组,上述100个数据共分为9组,各组数据的取值范围可以如何设定?
[0,0.5),[0.5,1),[1,1.5),„,[4,4.5].
思考4:如何统计上述100个数据在各组中的频数?如何计算样本数据在各组中的频率?你能将这些数据用表格反映出来吗?
分 组 频数累计 频数 频率
[0,0.5)
4 0.04
[0.5,1)
8 0.08
[1,1.5) 正 正 正 15 0.15
[1.5,2) 正 正 正 正 22 0.22
[2,2.5) 正 正 正 正 正 25 0.25
[2.5,3) 正 正
14 0.14
[3,3.5) 正 一 6 0.06
[3.5,4)
4 0.04
[4,4.5]
2 0.02
合计 100 1.00
思考5:上表称为样本数据的频率分布表,由此可以推测该市全体居民月均用水量分布的大致情况,给市政府确定居民月用水量标准提供参考依据,这里体现了一种什么统计思想?
用样本的频率分布估计总体分布.
思考6:如果市政府希望85%左右的居民每月的用水量不超过标准,根据上述频率分布表,你对制定居民月用水量标准(即a的取值)有何建议?
88%的居民月用水量在3t以下,可建议取a=3
思考7:在实际中,取a=3t一定能保证85%以上的居民用水不超标吗?哪些环节可能会导致结论出现偏差?
分组时,组距的大小可能会导致结论出现偏差,实践中,对统计结论是需要进行评价的. 思考8:对样本数据进行分组,其组数是由哪些因素确定的?
思考9:对样本数据进行分组,组距的确定没有固定的标准,组数太多或太少,都会影响我们了解数据的分布情况.数据分组的组数与样本容量有关,一般样本容量越大,所分组数越多.按统计原理,若样本的容量为n,分组数一般在(1+3.3lgn)附近选取.当样本容量不超过100时,按照数据的多少,常分成5~12组.若以0.1或1.5为组距对上述100个样本数据分组合适吗?
思考10:一般地,列出一组样本数据的频率分布表可以分哪几个步骤进行?
第一步,求极差.(极差=样本数据中最大值与最小值的差)
第二步,决定组距与组数.
(设k=极差÷组距,若k为整数,则组数=k,否则,组数=k+1)
第三步,确定分点,将数据分组.
第四步,统计频数,计算频率,制成表格.
(频数=样本数据落在各小组内的个数, 频率=频数÷样本容量)
知识探究(二):频率分布直方图
思考1:为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:
上图称为频率分布直方图,其中横轴表示月均用水量,纵轴表示频率/组距. 频率分布直方图中各小长方形的和高度在数量上有何特点?
思考2:频率分布直方图中各小长方形的面积表示什么?各小长方形的面积之和为多少?
各小长方形的面积=频率
各小长方形的面积之和=1
思考3:频率分布直方图非常直观地表明了样本数据的分布情况,使我们能够看到频率分布表中看不太清楚的数据模式,但原始数据不能在图中表示出来.你能根据上述频率分布直方图指出居民月均用水量的一些数据特点吗?
(1)居民月均用水量的分布是“山峰”状的,而且是“单峰”的;
(2)大部分居民月均用水量集中在一个中间值附近,只有少数居民月均用水量很多或很少;
(3)居民月均用水量的分布有一定的对称性等.
思考4:样本数据的频率分布直方图是根据频率分布表画出来的,一般地,频率分布直方图的作图步骤如何?
第一步,画平面直角坐标系.
第二步,在横轴上均匀标出各组分点,在纵轴上标出单位长度.
第三步,以组距为宽,各组的频率与组距的商为高,分别画出各组对应的小长方形.
思考5:对一组给定的样本数据,频率分布直方图的外观形状与哪些因素有关?在居民月均用水量样本中,你能以1为组距画频率分布直方图吗?
(三)例题讲解
例1、 某地区为了了解知识分子的年龄结构,随机抽样50名,其年龄分别如下:
42,38,29,36,41,43,54,43,34,44,40,59,39,42,44,50,37,44,45,29, 48,45,53,48,37,28,46,50,37,44,42,39,51,52,62,47,59,46,45,67, 53,49,65,47,54,63,57,43,46,58.
(1)列出样本频率分布表;
(2)画出频率分布直方图;
(3)估计年龄在32~52岁的知识分子所占的比例约是多少.
(1)极差为67-28=39,取组距为5,分为8组.
样本频率分布表:
分 组 频数 频率
[27,32) 3 0.06
[32,37) 3 0.06
[37,42) 9 0.18
[42,47) 16 0.32
[47,52) 7 0.14
[52,57) 5 0.10
[57,62) 4 0.08
[62,67) 3 0.06
合 计 50 1.00
(2)样本频率分布直方图:
频率
(3)因为0.06+0.18+0.32+0.14=0.7, 故年龄在32例 2、为了了解小学生的体能情况,抽取了某小 学同年级部分学生进行跳绳测试,将所得的数据 整理后画出频率分布直方图(如图),已知图中从 左到右的前三个小组的频率分别是0.1,0.3,0.4。 第一小组的频数是5. (1) 求第四小组的频率和参加这次测试的学生人数; (2) 求a,b,c,d并且将直方图补充完整。
(3) 参加这次测试跳绳次数在100次以上为优秀, 试估计该校此年级跳绳成绩优秀率是多少?
(1)从而第四组频率:0.2 参加学生人数5 ÷0.1=50
(2)a=0.016 ,b=0.016 ,c=0.016,d=0.016如图所示
(3)优秀率为0.4+0.2=0.6
例3、2009年10月31日,我国国家食品药品监督管理局已批准8家疫苗生产企业生产甲型H1N1流感疫苗。为了调查这些企业的生产能力,随机抽 查了其中一个企业20天每天生产甲型H1N1流感疫苗的数量
(单位: 万剂),疫苗数量的分组区间为:[45,55],[55,65],[65,75], [75,85],[85,95],由此得到频率分布直方图如图,则由此估计该 企业一个月(以由频率分布直方图知疫苗生产数量在65万剂以上的有三组,这三组的频率比组 距之和是0.025+0.010+0.005=0.040, ∵组距是10,∴三组的频率之和是0.040×10=0.4,
∴生产产品数量在65万剂以上的天数约 为30×0.4=12,故答案为:12
(四)课堂小结
1.频率分布是指一个样本数据在各个小范围内所占比例的大小,总体分布是指总体取值的频率分布规律.我们通常用样本的频率分布表或频率分布直方图去估计总体的分布.
2.频率分布表和频率分布直方图,是对相同数据的两种不同表达方式.用紧凑的表格改变数据的排列方式和构成形式,可展示数据的分布情况.通过作图既可以从数据中提取信息,又可以利用图形传递信息.
3.样本数据的频率分布表和频率分布直方图,是通过各小组数据在样本容量中所占比例大小来表示数据的分布规律,它可以让我们更清楚的看到整个样本数据的频率分布情况,并由此估计总体的分布情况.
(五)课下作业:
练习:1.(1). 习题2.2A组:2.
一. 学习目标
(1)通过实例体会分布的意义与作用; (2)在表示样本数据的过程中,学会列频率分布表,画频率分布直方图,频率折线图; (3)通过实例体会频率分布直方图,频率折线图,茎叶图的各自特点,从而恰当的选择上述方法分析样本的分布,准确的作出总体估计。
二. 学习重点
三.学习难点
能通过样本的频率分布估计总体的分布。
四.学习过程 (一)复习引入
(1 )统计的核心问题是什么?
(2 )随机抽样的几种常用方法有哪些?
(3)通过抽样方法收集数据的目的是什么?
(二)自学提纲
1.我们学习了哪些统计图?不同的统计图适合描述什么样的数据?
2.如何列频率分布表?
3.如何画频率分布直方图?基本步骤是什么?
4.频率分布直方图的纵坐标是什么?
5.频率分布直方图中小长方形的面积表示什么?
6.频率分布直方图中小长方形的面积之和是多少?
(三)课前自测
1.从一堆苹果中任取了20只,并得到了它们的质量(单位:g)数据分布表如下:
分组 [90,100) [100,110) [110,120) [120,130) [130,140) [140,150) 频数 1 2 3 10 1 则这堆苹果中,质量不小于120g的苹果数约占苹果总数的__________%. 2.关于频率分布直方图,下列说法正确的是( ) A.直方图的高表示该组上的个体在样本中出现的频率 B.直方图的高表示取某数的频率 C.直方图的高表示该组上的样本中出现的频率与组距的比值 D.直方图的高表示该组上的个体在样本中出现的频数与组距的比值 3.已知样本:10,8,6,13,8,10,12,11,7,8,9,11,9,12,9,10,11,11,12,那么频率为0.2的范围是( ) A、5.5-7.5 B、7.5-9.5 C、9.5-11.5 D、11.5-13.5 (四)探究教学 典例:城市缺水问题(自学教材65页~68页)
问题1.你认为为了较为合理地确定出这个标准,需要做哪些工作? 2.如何分析数据?根据这些数据你能得出用水量其他信息吗? 知识整理: 1.频率分布的概念: 频率分布: 频数: 频率:
2.画频率分布直方图的步骤: (1).求极差: (2).决定组距与组数 组距: 组数: (3).将数据分组 (4).列频率分布表 (5).画频率分布直方图 问题: .
1.月平均用水量在2.5—3之间的频率是多少?
2.月均用水量最多的在哪个区间?
3.月均用水量小于4.5 的频率是多少?
4.小长方形的面积=?
5.小长方形的面积总和=?
6.如果希望85%以上居民不超出标准,如何制定标准?
7.直方图有那些优点和缺点?
例题讲解: 例1有一个容量为50的样本数据的分组的频数如下: [12.5, 15.5) 3 [15.5, 18.5) 8 [18.5, 21.5) 9 [21.5, 24.5) 11 [24.5, 27.5) 10 [27.5, 30.5) 5 [30.5, 33.5) 4 (1)列出样本的频率分布表; (2)画出频率分布直方图; (3)根据频率分布直方图估计,数据落在[15.5, 24.5)的百分比是多少? (4)数据小于21.5的百分比是多少?
3.频率分布折线图、总体密度曲线 问题1:如何得到频率分布折线图 ? 频率分布折线图的概念:
问题2:在城市缺水问题中将样本容量为100,增至1000,其频率分布直方图的情况会有什么变化?假如增至10000呢?
总体密度曲线的概念:
注:用样本分布直方图去估计相应的总体分布时,一般样本容量越大,频率分布直方图就会无限接近总体密度曲线,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范围内1.总体分布指的是总体取值的频率分布规律,由于总体分布不易知道,因此我们往往用样本的频率分布去估计总体的分布。
4. 茎叶图 茎叶图的概念: 茎叶图的特征:
小结:.总体的分布分两种情况:当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图。
课堂小结:
当堂检测:
1. 一个社会调查机构就某地居民的月收入调查了10000人, 并根据所得数据画了样本的频率分布直方图(如下图)。 为了分析居民的收入与年龄、学历、职业等方面的关系, 要从这10000人中再用分层抽样方法抽出100人作进一步 调查,则 [2500,3000)(元)月收入段应抽取 人。
2、为了解某校高三学生的视力情况,随机抽查了该校200名高三学生的视力情况,得到频率分布直方图(如图), 由于不慎将部分数据丢失,但知道前四组的频数成等比数 列,后6组的频数成等差数列,设最多一组学生数为a,视 力在4.6到5.0之间的频率为b,则
a+b= . 3.在抽查产品的尺寸过程中,将其尺寸分成若干组,[a,b)是其中的一组,抽查出的个体在该组上的频率为m,该组上的直方图的高为h,则ba-=______. 4.为了了解中学生的身高情况,对育才中学同龄的50名男学生的身高进行了测量,结果如下:(单位:cm): 175 168 180 176 167 181 162 173 171 177 171 171 174 173 174 175 177 166 163 160 166 166 163 169 174 165 175 165 170 158 174 172 166 172 167 172 175 161 173 167 170 172 165 157 172 173 166 177 169 181
(1)列出样本的频率分布表。
(2)画出频率分布直方图。
(3)画频率分布折线图;
Copyright 2010-2019 Qinzibuy.com 【亲亲园丁】 版权所有 备案编号:粤ICP备14102101号