当前位置:首页 > 教案教学设计 > 数学教案

样本估计总体公式原理

日期:2022-02-14

这是样本估计总体公式原理,是优秀的数学教案文章,供老师家长们参考学习。

样本估计总体公式原理

样本估计总体公式原理第 1 篇

1936年,美国的《文学摘要》杂志对该年度美国总统选举进行预测.它公开发行了1000万份调查问卷,回收200万份,试图通过这200万份问卷中所反映的选举意向推断出全体选民的选举意向.它的预测结果是兰登与罗斯福的获胜率各为57℅和43℅,而实际结果却是罗斯福以62℅对38℅的巨大优势入主白宫.该杂志因此名声扫地,终于关门大吉.

该调查中,样本容量是200万,已经足够大了,为何还会出现这种反差呢?究其原因,杂志社在发出1000万份调查问卷时,是按照电话本和俱乐部成员名单发放的,所取的样本明显带有倾向性——当时的人很少拥有私人电话或属于某个俱乐部,因此调查一开始就指向了有钱人群体.但是穷人却压倒多数地投了罗斯福的票,这就导致了调查的失败.简言之,该调查的样本部具有代表性,这是个致命的错误抽样的目的是通过对样本的研究以推断总体——这也是统计学的重要意义之一.比如调查某市5000名学生的数学成绩,我们从中抽取500个进行分析.由于样本来自总体,它应包含总体所具有的信息,我们正是通过分析这些信息进而推断总体的特征,比如以上成绩的平均分;但是,如果样本不具有代表性,就会隐藏很多有用的信息,而突出一些不必要的干扰信息——导致了分析结果的误差偏大.选取一个有代表性的样本,是抽样调查有效的首选要素.

另一方面,样本的大小也很重要.总体可以看作一个最大的样本,但是因为时间、人力、物力、破坏性等因素,条件不允许我们做普查,因此只能折中一下:在条件许可的范围内选取一个尽可能大的样本,以期获得更多的必要的信息.

针对不同的问题,有简单随机抽样、系统抽样、分层抽样等多种抽样方法,其共同点是在抽样过程中每个个体被抽取的概率相等,这就从概率的角度保证了所抽取样本尽量具有代表性.下面我们看几个实例.

例1、一个鱼缸里有多少条鱼容易数出来,那么怎样知道一个池塘里有多少条鱼?

该问题不宜普查——否则就要把池塘里的水抽干,而这种做法是不可取的.我们可以采用以下做法:从池塘里捕上100条做上标记,然后放回池塘里去,经过一段时间,待带标记的鱼完全混合于鱼群后,第二次再捕上200条,若其中带标记的鱼有25条,则池塘里的鱼的总数大约是=800条.

如果担心一次试验的结果具有偶然性,我们可以多做几次试验,然后求几次试验的平均数,一般地,数次试验的平均数会更好地接近真实数据。

例2、某农户在山上种了柚桃树88株,现进入第三年收获季节,随意采摘5株果树上的柚桃,称得每株树上的柚桃重量如下(单位:㎏):35,35,34,39,37.估计这年柚桃总产量约是多少?

因为是随机选取样本,应认为该样本具有代表性.计算出选取的5株平均重量是(35+35+34+39+37)÷5=36㎏,那么估计所有柚桃树的总产量大约是633.6㎏.

该例的思想被广泛地用于农业生产。比如要估计试验地里将要成熟的水稻的产量时,我们不是把整片的水稻全部割下来称量(毕竟没有完全成熟),而是选取相对成熟的一小片作为样本,计算其产量,然后用一个比例式求出整片地的产量。

样本不仅在平均数上体现总体,我们在后继课程中还要学习更多的用样本估计总体的数据指标,比如中位数、众数、方差、概率等等,让我们翘首以盼吧!

样本估计总体公式原理第 2 篇

  一. 学习目标

  (1)通过实例体会分布的意义与作用; (2)在表示样本数据的过程中,学会列频率分布表,画频率分布直方图,频率折线图; (3)通过实例体会频率分布直方图,频率折线图,茎叶图的各自特点,从而恰当的选择上述方法分析样本的分布,准确的作出总体估计。

  二. 学习重点

  三.学习难点

  能通过样本的频率分布估计总体的分布。

  四.学习过程 (一)复习引入

  (1 )统计的核心问题是什么?

  (2 )随机抽样的几种常用方法有哪些?

  (3)通过抽样方法收集数据的目的是什么?

  (二)自学提纲

  1.我们学习了哪些统计图?不同的统计图适合描述什么样的数据?

  2.如何列频率分布表?

  3.如何画频率分布直方图?基本步骤是什么?

  4.频率分布直方图的纵坐标是什么?

  5.频率分布直方图中小长方形的面积表示什么?

  6.频率分布直方图中小长方形的面积之和是多少?

  (三)课前自测

  1.从一堆苹果中任取了20只,并得到了它们的质量(单位:g)数据分布表如下:

  分组 [90,100) [100,110) [110,120) [120,130) [130,140) [140,150) 频数 1 2 3 10 1 则这堆苹果中,质量不小于120g的苹果数约占苹果总数的__________%. 2.关于频率分布直方图,下列说法正确的是( ) A.直方图的高表示该组上的个体在样本中出现的频率 B.直方图的高表示取某数的频率 C.直方图的高表示该组上的样本中出现的频率与组距的比值 D.直方图的高表示该组上的个体在样本中出现的频数与组距的比值 3.已知样本:10,8,6,13,8,10,12,11,7,8,9,11,9,12,9,10,11,11,12,那么频率为0.2的范围是( ) A、5.5-7.5 B、7.5-9.5 C、9.5-11.5 D、11.5-13.5 (四)探究教学 典例:城市缺水问题(自学教材65页~68页)

  问题1.你认为为了较为合理地确定出这个标准,需要做哪些工作? 2.如何分析数据?根据这些数据你能得出用水量其他信息吗? 知识整理: 1.频率分布的概念: 频率分布: 频数: 频率:

  2.画频率分布直方图的步骤: (1).求极差: (2).决定组距与组数 组距: 组数: (3).将数据分组 (4).列频率分布表 (5).画频率分布直方图 问题: .

  1.月平均用水量在2.5—3之间的频率是多少?

  2.月均用水量最多的在哪个区间?

  3.月均用水量小于4.5 的频率是多少?

  4.小长方形的面积=?

  5.小长方形的面积总和=?

  6.如果希望85%以上居民不超出标准,如何制定标准?

  7.直方图有那些优点和缺点?

  例题讲解: 例1有一个容量为50的样本数据的分组的频数如下: [12.5, 15.5) 3 [15.5, 18.5) 8 [18.5, 21.5) 9 [21.5, 24.5) 11 [24.5, 27.5) 10 [27.5, 30.5) 5 [30.5, 33.5) 4 (1)列出样本的频率分布表; (2)画出频率分布直方图; (3)根据频率分布直方图估计,数据落在[15.5, 24.5)的百分比是多少? (4)数据小于21.5的百分比是多少?

  3.频率分布折线图、总体密度曲线 问题1:如何得到频率分布折线图 ? 频率分布折线图的概念:

  问题2:在城市缺水问题中将样本容量为100,增至1000,其频率分布直方图的情况会有什么变化?假如增至10000呢?

  总体密度曲线的概念:

  注:用样本分布直方图去估计相应的总体分布时,一般样本容量越大,频率分布直方图就会无限接近总体密度曲线,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范围内1.总体分布指的是总体取值的频率分布规律,由于总体分布不易知道,因此我们往往用样本的频率分布去估计总体的分布。

  4. 茎叶图 茎叶图的概念: 茎叶图的特征:

  小结:.总体的分布分两种情况:当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图。

  课堂小结:

  当堂检测:

  1. 一个社会调查机构就某地居民的月收入调查了10000人, 并根据所得数据画了样本的频率分布直方图(如下图)。 为了分析居民的收入与年龄、学历、职业等方面的关系, 要从这10000人中再用分层抽样方法抽出100人作进一步 调查,则 [2500,3000)(元)月收入段应抽取 人。

  2、为了解某校高三学生的视力情况,随机抽查了该校200名高三学生的视力情况,得到频率分布直方图(如图), 由于不慎将部分数据丢失,但知道前四组的频数成等比数 列,后6组的频数成等差数列,设最多一组学生数为a,视 力在4.6到5.0之间的频率为b,则

  a+b= . 3.在抽查产品的尺寸过程中,将其尺寸分成若干组,[a,b)是其中的一组,抽查出的个体在该组上的频率为m,该组上的直方图的高为h,则ba-=______. 4.为了了解中学生的身高情况,对育才中学同龄的50名男学生的身高进行了测量,结果如下:(单位:cm): 175 168 180 176 167 181 162 173 171 177 171 171 174 173 174 175 177 166 163 160 166 166 163 169 174 165 175 165 170 158 174 172 166 172 167 172 175 161 173 167 170 172 165 157 172 173 166 177 169 181

  (1)列出样本的频率分布表。

  (2)画出频率分布直方图。

  (3)画频率分布折线图;

样本估计总体公式原理第 3 篇

一、教学目标分析

1.知识与技能目标

(1)通过实例体会分布的意义和作用。

(2)在表示样本数据的过程中,学会列频率分布表,画频率分布直方图。

(3)通过实例体会频率分布直方图的特征,能准确地做出总体估计。

2、过程与方法目标:

通过对现实生活的探究,感知应用数学知识解决问题的方法,理解数形结合的数学思想和逻辑推理的数学方法。

3、情感态度与价值观目标:

通过对样本分析和总体估计的过程,感受数学对实际生活的需要,认识到数学知识源于生活并指导生活的事实,体会数学知识与现实世界的联系。

二、 教学的重点和难点

重点:会列频率分布表,画频率分布直方图。

难点:能通过样本的频率分布估计总体的分布。

三、教法与学法分析

1、教法:遵循观察、探究、发现、总结式的教学模式。重点以引导学生为主,让他们能积极、主动的进 行探索,获取知识。由于内容较繁琐,所以要借助多媒体辅助教学。

2、学法:根据本节知识的特点,由于学生已具备一定的基础知识,可采取研究性学习的学习方法。

四、教学过程

(一)情境引入

1.随机抽样有哪几种基本的抽样方法?

简单随机抽样、系统抽样、分层抽样.

2.随机抽样是收集数据的方法,如何通过样本数据所包含的信息,估计总体的基本特征,即

用样本估计总体,是我们需要进一步学习的内容.

3.高二某班有50名学生,在数学必修②结业考试后随机抽取10名,其考试成绩如下:

82, 75, 61, 93, 62, 55, 70, 68, 85, 78.

如果要求我们根据上述抽样数据,估计该班对数学模块②的总体学习水平,就需要有相应的数学方法作为理论指导,本节课我们将学习用样本的频率分布估计总体分布.

(二)新课讲解

知识探究(一):频率分布表

【问题】 我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.

通过抽样调查,获得100位居民2007年的月均用水量如下表(单位:t):

3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6 3.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.4 3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.3 2.8 2.3 2.2

1.7 1.3 3.6 1.7 0.6 4.1 3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3 3.0

2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3 2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4 2.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4 2.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2

思考1:上述100个数据中的最大值和最小值分别是什么?由此说明样本数据的变化范围是

什么?

0.2~4.3

思考2:样本数据中的最大值和最小值的差称为极差.如果将上述100个数据按组距为0.5进行分组,那么这些数据共分为多少组?

(4.3-0.2)÷0.5=8.2

思考3:以组距为0.5进行分组,上述100个数据共分为9组,各组数据的取值范围可以如何设定?

[0,0.5),[0.5,1),[1,1.5),„,[4,4.5].

思考4:如何统计上述100个数据在各组中的频数?如何计算样本数据在各组中的频率?你能将这些数据用表格反映出来吗?

分 组 频数累计 频数 频率

[0,0.5)

4 0.04

[0.5,1)

8 0.08

[1,1.5) 正 正 正 15 0.15

[1.5,2) 正 正 正 正 22 0.22

[2,2.5) 正 正 正 正 正 25 0.25

[2.5,3) 正 正

14 0.14

[3,3.5) 正 一 6 0.06

[3.5,4)

4 0.04

[4,4.5]

2 0.02

合计 100 1.00

思考5:上表称为样本数据的频率分布表,由此可以推测该市全体居民月均用水量分布的大致情况,给市政府确定居民月用水量标准提供参考依据,这里体现了一种什么统计思想?

用样本的频率分布估计总体分布.

思考6:如果市政府希望85%左右的居民每月的用水量不超过标准,根据上述频率分布表,你对制定居民月用水量标准(即a的取值)有何建议?

88%的居民月用水量在3t以下,可建议取a=3

思考7:在实际中,取a=3t一定能保证85%以上的居民用水不超标吗?哪些环节可能会导致结论出现偏差?

分组时,组距的大小可能会导致结论出现偏差,实践中,对统计结论是需要进行评价的. 思考8:对样本数据进行分组,其组数是由哪些因素确定的?

思考9:对样本数据进行分组,组距的确定没有固定的标准,组数太多或太少,都会影响我们了解数据的分布情况.数据分组的组数与样本容量有关,一般样本容量越大,所分组数越多.按统计原理,若样本的容量为n,分组数一般在(1+3.3lgn)附近选取.当样本容量不超过100时,按照数据的多少,常分成5~12组.若以0.1或1.5为组距对上述100个样本数据分组合适吗?

思考10:一般地,列出一组样本数据的频率分布表可以分哪几个步骤进行?

第一步,求极差.(极差=样本数据中最大值与最小值的差)

第二步,决定组距与组数.

(设k=极差÷组距,若k为整数,则组数=k,否则,组数=k+1)

第三步,确定分点,将数据分组.

第四步,统计频数,计算频率,制成表格.

(频数=样本数据落在各小组内的个数, 频率=频数÷样本容量)

知识探究(二):频率分布直方图

思考1:为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:

上图称为频率分布直方图,其中横轴表示月均用水量,纵轴表示频率/组距. 频率分布直方图中各小长方形的和高度在数量上有何特点?

思考2:频率分布直方图中各小长方形的面积表示什么?各小长方形的面积之和为多少?

各小长方形的面积=频率

各小长方形的面积之和=1

思考3:频率分布直方图非常直观地表明了样本数据的分布情况,使我们能够看到频率分布表中看不太清楚的数据模式,但原始数据不能在图中表示出来.你能根据上述频率分布直方图指出居民月均用水量的一些数据特点吗?

(1)居民月均用水量的分布是“山峰”状的,而且是“单峰”的;

(2)大部分居民月均用水量集中在一个中间值附近,只有少数居民月均用水量很多或很少;

(3)居民月均用水量的分布有一定的对称性等.

思考4:样本数据的频率分布直方图是根据频率分布表画出来的,一般地,频率分布直方图的作图步骤如何?

第一步,画平面直角坐标系.

第二步,在横轴上均匀标出各组分点,在纵轴上标出单位长度.

第三步,以组距为宽,各组的频率与组距的商为高,分别画出各组对应的小长方形.

思考5:对一组给定的样本数据,频率分布直方图的外观形状与哪些因素有关?在居民月均用水量样本中,你能以1为组距画频率分布直方图吗?

(三)例题讲解

例1、 某地区为了了解知识分子的年龄结构,随机抽样50名,其年龄分别如下:

42,38,29,36,41,43,54,43,34,44,40,59,39,42,44,50,37,44,45,29, 48,45,53,48,37,28,46,50,37,44,42,39,51,52,62,47,59,46,45,67, 53,49,65,47,54,63,57,43,46,58.

(1)列出样本频率分布表;

(2)画出频率分布直方图;

(3)估计年龄在32~52岁的知识分子所占的比例约是多少.

(1)极差为67-28=39,取组距为5,分为8组.

样本频率分布表:

分 组 频数 频率

[27,32) 3 0.06

[32,37) 3 0.06

[37,42) 9 0.18

[42,47) 16 0.32

[47,52) 7 0.14

[52,57) 5 0.10

[57,62) 4 0.08

[62,67) 3 0.06

合 计 50 1.00

(2)样本频率分布直方图:

频率

(3)因为0.06+0.18+0.32+0.14=0.7, 故年龄在32例 2、为了了解小学生的体能情况,抽取了某小 学同年级部分学生进行跳绳测试,将所得的数据 整理后画出频率分布直方图(如图),已知图中从 左到右的前三个小组的频率分别是0.1,0.3,0.4。 第一小组的频数是5. (1) 求第四小组的频率和参加这次测试的学生人数; (2) 求a,b,c,d并且将直方图补充完整。

(3) 参加这次测试跳绳次数在100次以上为优秀, 试估计该校此年级跳绳成绩优秀率是多少?

(1)从而第四组频率:0.2 参加学生人数5 ÷0.1=50

(2)a=0.016 ,b=0.016 ,c=0.016,d=0.016如图所示

(3)优秀率为0.4+0.2=0.6

例3、2009年10月31日,我国国家食品药品监督管理局已批准8家疫苗生产企业生产甲型H1N1流感疫苗。为了调查这些企业的生产能力,随机抽 查了其中一个企业20天每天生产甲型H1N1流感疫苗的数量

(单位: 万剂),疫苗数量的分组区间为:[45,55],[55,65],[65,75], [75,85],[85,95],由此得到频率分布直方图如图,则由此估计该 企业一个月(以由频率分布直方图知疫苗生产数量在65万剂以上的有三组,这三组的频率比组 距之和是0.025+0.010+0.005=0.040, ∵组距是10,∴三组的频率之和是0.040×10=0.4,

∴生产产品数量在65万剂以上的天数约 为30×0.4=12,故答案为:12

(四)课堂小结

1.频率分布是指一个样本数据在各个小范围内所占比例的大小,总体分布是指总体取值的频率分布规律.我们通常用样本的频率分布表或频率分布直方图去估计总体的分布.

2.频率分布表和频率分布直方图,是对相同数据的两种不同表达方式.用紧凑的表格改变数据的排列方式和构成形式,可展示数据的分布情况.通过作图既可以从数据中提取信息,又可以利用图形传递信息.

3.样本数据的频率分布表和频率分布直方图,是通过各小组数据在样本容量中所占比例大小来表示数据的分布规律,它可以让我们更清楚的看到整个样本数据的频率分布情况,并由此估计总体的分布情况.

(五)课下作业:

练习:1.(1). 习题2.2A组:2.

样本估计总体公式原理第 4 篇

矩估计

最简单的矩估计法是用一阶样本原点矩估计总体期望,而用二阶样本中心矩估计总体方差。

最大似然估计

最合理的参数估计量应该是使得从模型中抽取该n组样本观测值的概率最大。

最小二乘法

最小二乘法是正态分布下最大似然估计的特例。

KL散度

相对熵,来源于信息论的方法。和最大似然也是殊途同归。

最小均方误差

看起来和二小乘一样

最大后验估计

来自于贝叶斯估计

幼儿园学习网 | 联系方式 | 发展历程

Copyright 2010-2019 Qinzibuy.com 【亲亲园丁】 版权所有 备案编号:粤ICP备14102101号