日期:2022-02-14
这是总体均值的无偏估计,是优秀的数学教案文章,供老师家长们参考学习。
在学完通过抽样来收集数据后,我们必须通过图、表计算来分析数据。这就需要对总体作出相应的估计。一般有两种估计,一是用样本频率分布估计总体的分布,二是用样本的数字特征估计总体的数字特征。
用样本频率分布估计总体的分布,可以用频率分布表和频率分布直方图,此时要明确它的具体做法分五个步骤进行,知道直方图中的小长方形的面积表示相应各组的频率,了解应用直方图的优缺点;再者就是茎叶图也被用来表示数据,懂得如何作茎叶图,特别指出叶是指数据中的最后一个数字,注意是否需要补0,当然也要知道它的优缺点。
用样本的数字特征估计总体的数字特征,这里的数字特征包括众数、中位数、平均数、标准差和方差。给出一组具体的样本数据后,通过计算获取的数字特征的值是准确的,但如果通过频率分布直方图获取的,所得的数值只是近似值(如何算?)。对于标准差或方差,要懂得公式、取值范围、和特点。
1、数据的两个特征:集中趋势和波动性。集中趋势指的是数据的“一般水平”或曰“平均水平”,波动性指的是数据围绕“平均值”的变化情况。
2、反映数据“大多数水平”(集中趋势)的量——众数
众数:即样本数据中频数最大(或频率最高)的数据。
特点:①可以不存在或不止一个;
②不受极端数据的影响,求法简单;
③可靠性差,如0,0,2,3,5这组数据中,众数是0,它很难真实反映这组数据的“平均水平”(集中趋势);
④众数在难以定义“平均数”或“中位数”时常用,故一般可用于统计非数字型数据,如“牛,羊,马,鱼,牛”这组数据中,众数是“牛”;
⑤众数在销售统计中常用
3、反映数据“中间水平”(集中趋势)的量——中位数
中位数:把一组数据按从小到大的数序排列,在中间的一个数字(或两个数字的平均值)叫做这组数据的中位数。
特点:①中位数把样本数据分为两部分,一部分大于中位数,另一部分小于中位数;
②中位数不受少数几个极端值的影响;
③由于当样本数据为偶数个时,中位数等于中间两个数据的平均值,因此有时中位数未必在样本数据中
4、反映数据“平均水平”(集中趋势)的量——平均数
平均数:所有数据之和再除以数据的个数所得值,又称算术平均数。
公式:
特点:一般情况下能有效地反映数据的集中趋势;但易受极端值的影响,在极差较大的情况下,不如众数和中位数准确;
5、反映数据“波动范围”的量——极差
极差(R):一组测量数据中,最大值与最小值之差称为极差
特点:极差只指明了测定值的最大离散范围,而未能利用全部测量值的信息,不能精确反映测量值彼此相符合的程度;但计算简单
6、反映数据“波动大小”的量——方差
方差:样本中各数据与样本平均数的差的平方的平均数叫做样本方差(或均方差),随机变量X的方差可记作:S2(或D(X))。
特点:①方差越大,数据的波动性越大;
②
7、反映数据“波动大小”的量——标准差
标准差:方差的平方根,记作S。
特点:①标准差越大,数据的波动性越大;
②
8、用样本来估计总体:一般情况下,如果总体的容量较大,不便分析其数据特征,我们可以通过随机抽取一定的样本,通过样本的数据特征来对总体的数据特征进行估计;但难免有一定误差。
考点一 合理选择统计量
例1、有一首打油诗“张村有个张千万,隔壁九个穷光蛋,平均起来算一算,人人都是张百万。”这首诗反映了什么现象?如何选择恰当的统计量来反映该村的收入水平?某次数学考试,婷婷得到 78分。全班共30人,其他同学的成绩为1个100分,4个90分,22个80分,以及1个2分和1个10分。婷婷计算出全班的平均分为 77分,所以婷婷告诉妈妈说,自己这次的成绩在班上处于“中上水平”。她说得对吗?如何选择恰当的统计量来反映她的成绩在班上的真实位置?
分析:在极差较大的情况下,用平均数来反映数据的特征往往出现较大的偏差,具体表现为标准差较大,如打油诗中数据的标准差达到了惊人的3000000,而婷婷班上成绩数据的标准差也达到了19.93,所以才会出现基本上都是不名一文的村子却“人人都是百万富翁”以及排名倒数第三的成绩成了“中上水平”的不正常现象。
解析:上述现象表明:平均数受极端值影响较大,在极差较大的情况下,不宜用平均数来刻画数据的数字特征,可选用众数或中位数。
考点二 从统计图表中提取样本的数字特征
例2、已知一组数据共有二十个,它的频率分布直方图如下(纵轴表示频率):
试根据上图写出该组数据的中位数,众数,平均数并求其标准差。
分析:①了解频率分布直方图的意义;②了解所求各量的意义。
解析:由图可知:该组数据的中位数是
,众数是5,平均数
标准差S=1.64
说明:如果已知各数据的频率,则求平均值时对频率与对应数据的积求和即可,即
。
考点三 反映数据集中趋势的常用量——平均值
例3、在一次射击训练中,甲乙两位选手分别进行了10次射击测试,中靶成绩如下:
甲
10
10
9
9
8
10
10
7
9
8
乙
9
6
10
10
9
10
7
9
10
8
根据上表数据计算,谁的成绩更好?
分析:①本题是根据10次测试的成绩来对选手的竞技状态进行评价,属于根据样本来对总体进行估计;②两组数据的极差均不大,因此可选用平均数来进行估计。
解析:
,因为
,因此甲的成绩好于乙的成绩。
考点四 反映数据波动性的常用量——方差或标准差
例4、甲乙两位选手在射击训练中的测试成绩如下:
甲
10
10
9
9
9
9
8
9
9
8
乙
9
6
10
10
9
10
9
9
10
8
根据上表回答:
①哪位选手的状态更好?
②按照历次比赛的数据统计,获奖选手平均中靶的环数至少为9.5,那么应该派哪位选手参赛较好?
分析:①以这10次测试的平均成绩来进行估计;②经过计算可知,两位选手的平均成绩都不超过9.5,可结合稳定性来考虑;显然,稳定性越好,获奖的可能性越小。
解析:①
,因此两位选手的平均成绩是相同的;但是,S甲=0.67,S乙=1.25,因为S甲乙,所以甲发挥得更稳定;
②由于
,且S甲乙,因此可派出乙选手参加比赛。
说明:对第二个问题的处理,也可结合众数进行。甲的数据的众数是9,乙的数据的众数是10和9,反映出大多数情况下,甲能打出9环,而乙能打出9环或10环。
1 、数据的两个特征:集中趋势和波动性。集中趋势指的是数据的“一般水平”或曰“平均水平”,波动性指的是数据围绕“平均值”的变化情况。
2 、反映数据“大多数水平”(集中趋势)的量——众数
众数:即样本数据中频数最大(或频率最高)的数据。
特点:①可以不存在或不止一个;
②不受极端数据的影响,求法简单;
③可靠性差,如0 ,0 ,2 ,3 ,5 这组数据中,众数是0 ,它很难真实反映这组数据的“平均水平”(集中趋势);
④众数在难以定义“平均数”或“中位数”时常用,故一般可用于统计非数字型数据,如“牛,羊,马,鱼,牛”这组数据中,众数是“牛”;
⑤众数在销售统计中常用
3 、反映数据“中间水平”(集中趋势)的量——中位数
中位数:把一组数据按从小到大的数序排列,在中间的一个数字(或两个数字的平均值)叫做这组数据的中位数。
特点:①中位数把样本数据分为两部分,一部分大于中位数,另一部分小于中位数;
②中位数不受少数几个极端值的影响;
③由于当样本数据为偶数个时,中位数等于中间两个数据的平均值,因此有时中位数未必在样本数据中
4 、反映数据“平均水平”(集中趋势)的量——平均数
平均数:所有数据之和再除以数据的个数所得值,又称算术平均数。
公式:
特点:一般情况下能有效地反映数据的集中趋势;但易受极端值的影响,在极差较大的情况下,不如众数和中位数准确;
5 、反映数据“波动范围”的量—— 极差
极差(R ):一组测量数据中,最大值与最小值之差称为极差
特点:极差只指明了测定值的最大离散范围,而未能利用全部测量值的信息,不能精确反映测量值彼此相符合的程度;但计算简单
6 、反映数据“波动大小”的量—— 方差
方差:样本中各数据与样本平均数的差的平方的平均数叫做样本方差(或均方差),随机变量X 的方差可记作:S 2 (或D (X ))。
特点:①方差越大,数据的波动性越大;
②
7 、反映数据“波动大小”的量—— 标准差
标准差:方差的平方根,记作S 。
特点:①标准差越大,数据的波动性越大;
②
8 、用样本来估计总体:一般情况下,如果总体的容量较大,不便分析其数据特征,我们可以通过随机抽取一定的样本,通过样本的数据特征来对总体的数据特征进行估计;但难免有一定误差。
考点一合理选择统计量
例1 、有一首打油诗“张村有个张千万,隔壁九个穷光蛋,平均起来算一算,人人都是张百万。” 这首诗反映了什么现象?如何选择恰当的统计量来反映该村的收入水平?某次数学考试,婷婷得到78 分。全班共30 人,其他同学的成绩为1 个100 分,4 个90 分,22 个80 分,以及1 个2 分和1 个10 分。婷婷计算出全班的平均分为77 分,所以婷婷告诉妈妈说,自己这次的成绩在班上处于“中上水平”。她说得对吗?如何选择恰当的统计量来反映她的成绩在班上的真实位置?
解析:上述现象表明:平均数受极端值影响较大,在极差较大的情况下,不宜用平均数来刻画数据的数字特征,可选用众数或中位数。
考点二从统计图表中提取样本的数字特征
例2 、已知一组数据共有二十个,它的频率分布直方图如下(纵轴表示频率):
试根据上图写出该组数据的中位数,众数,平均数并求其标准差。
分析:①了解频率分布直方图的意义;②了解所求各量的意义。
由图可知:该组数据的中位数是,众数是5 ,平均数
标准差S=1.64
说明:如果已知各数据的频率,则求平均值时对频率与对应数据的积求和即可,即
。
考点三反映数据集中趋势的常用量——平均值
例3 、在一次射击训练中,甲乙两位选手分别进行了10 次射击测试,中靶成绩如下:
甲
10
10
9
9
8
10
10
7
9
8
乙
9
6
10
10
9
10
7
9
10
8
根据上表数据计算,谁的成绩更好?
分析:①本题是根据10 次测试的成绩来对选手的竞技状态进行评价,属于根据样本来对总体进行估计;②两组数据的极差均不大,因此可选用平均数来进行估计。
,因为,因此甲的成绩好于乙的成绩。
考点四反映数据波动性的常用量——方差或标准差
例4 、甲乙两位选手在射击训练中的测试成绩如下:
甲
10
10
9
9
9
9
8
9
9
8
乙
9
6
10
10
9
10
9
9
10
8
根据上表回答:
①哪位选手的状态更好?
②按照历次比赛的数据统计,获奖选手平均中靶的环数至少为9.5 ,那么应该派哪位选手参赛较好?
分析:①以这10 次测试的平均成绩来进行估计;②经过计算可知,两位选手的平均成绩都不超过9.5 ,可结合稳定性来考虑;显然,稳定性越好,获奖的可能性越小。
①,因此两位选手的平均成绩是相同的;但是,S 甲=0.67 ,S 乙=1.25 ,因为S 甲
②由于S 甲
说明:对第二个问题的处理,也可结合众数进行。甲的数据的众数是9 ,乙的数据的众数是10 和9 ,反映出大多数情况下,甲能打出9 环,而乙能打出9 环或10 环。
1、数据的两个特征:集中趋势和波动性。集中趋势指的是数据的“一般水平”或曰“平均水平”,波动性指的是数据围绕“平均值”的变化情况。
2、反映数据“大多数水平”(集中趋势)的量——众数
众数:即样本数据中频数最大(或频率最高)的数据。
特点:①可以不存在或不止一个;
②不受极端数据的影响,求法简单;
③可靠性差,如0,0,2,3,5这组数据中,众数是0,它很难真实反映这组数据的“平均水平”(集中趋势);
④众数在难以定义“平均数”或“中位数”时常用,故一般可用于统计非数字型数据,如“牛,羊,马,鱼,牛”这组数据中,众数是“牛”;
⑤众数在销售统计中常用
3、反映数据“中间水平”(集中趋势)的量——中位数
中位数:把一组数据按从小到大的数序排列,在中间的一个数字(或两个数字的平均值)叫做这组数据的中位数。
特点:①中位数把样本数据分为两部分,一部分大于中位数,另一部分小于中位数;
②中位数不受少数几个极端值的影响;
③由于当样本数据为偶数个时,中位数等于中间两个数据的平均值,因此有时中位数未必在样本数据中
4、反映数据“平均水平”(集中趋势)的量——平均数
平均数:所有数据之和再除以数据的个数所得值,又称算术平均数。
公式:
特点:一般情况下能有效地反映数据的集中趋势;但易受极端值的影响,在极差较大的情况下,不如众数和中位数准确;
5、反映数据“波动范围”的量——极差
极差(R):一组测量数据中,最大值与最小值之差称为极差
特点:极差只指明了测定值的最大离散范围,而未能利用全部测量值的信息,不能精确反映测量值彼此相符合的程度;但计算简单
6、反映数据“波动大小”的量——方差
方差:样本中各数据与样本平均数的差的平方的平均数叫做样本方差(或均方差),随机变量X的方差可记作:S2(或D(X))。
特点:①方差越大,数据的波动性越大;
②
7、反映数据“波动大小”的量——标准差
标准差:方差的平方根,记作S。
特点:①标准差越大,数据的波动性越大;
②
8、用样本来估计总体:一般情况下,如果总体的容量较大,不便分析其数据特征,我们可以通过随机抽取一定的样本,通过样本的数据特征来对总体的数据特征进行估计;但难免有一定误差。
【典型例题】
考点一 合理选择统计量
例1、有一首打油诗“张村有个张千万,隔壁九个穷光蛋,平均起来算一算,人人都是张百万。”这首诗反映了什么现象?如何选择恰当的统计量来反映该村的收入水平?某次数学考试,婷婷得到 78分。全班共30人,其他同学的成绩为1个100分,4个90分,22个80分,以及1个2分和1个10分。婷婷计算出全班的平均分为 77分,所以婷婷告诉妈妈说,自己这次的成绩在班上处于“中上水平”。她说得对吗?如何选择恰当的统计量来反映她的成绩在班上的真实位置?
【分析】在极差较大的情况下,用平均数来反映数据的特征往往出现较大的偏差,具体表现为标准差较大,如打油诗中数据的标准差达到了惊人的3000000,而婷婷班上成绩数据的标准差也达到了19.93,所以才会出现基本上都是不名一文的村子却“人人都是百万富翁”以及排名倒数第三的成绩成了“中上水平”的不正常现象。
【答】上述现象表明:平均数受极端值影响较大,在极差较大的情况下,不宜用平均数来刻画数据的数字特征,可选用众数或中位数。
考点二 从统计图表中提取样本的数字特征
例2、已知一组数据共有二十个,它的频率分布直方图如下(纵轴表示频率):
试根据上图写出该组数据的中位数,众数,平均数并求其标准差。
【分析】①了解频率分布直方图的意义;②了解所求各量的意义。
【解】由图可知:该组数据的中位数是,众数是5,平均数
标准差S=1.64
【说明】如果已知各数据的频率,则求平均值时对频率与对应数据的积求和即可,即。
考点三 反映数据集中趋势的常用量——平均值
例3、在一次射击训练中,甲乙两位选手分别进行了10次射击测试,中靶成绩如下:
甲
10
10
9
9
8
10
10
7
9
8
乙
9
6
10
10
9
10
7
9
10
8
根据上表数据计算,谁的成绩更好?
【分析】①本题是根据10次测试的成绩来对选手的竞技状态进行评价,属于根据样本来对总体进行估计;②两组数据的极差均不大,因此可选用平均数来进行估计。
【解】,因为,因此甲的成绩好于乙的成绩。
考点四 反映数据波动性的常用量——方差或标准差
例4、甲乙两位选手在射击训练中的测试成绩如下:
甲
10
10
9
9
9
9
8
9
9
8
乙
9
6
10
10
9
10
9
9
10
8
根据上表回答:
①哪位选手的状态更好?
②按照历次比赛的数据统计,获奖选手平均中靶的环数至少为9.5,那么应该派哪位选手参赛较好?
【分析】①以这10次测试的平均成绩来进行估计;②经过计算可知,两位选手的平均成绩都不超过9.5,可结合稳定性来考虑;显然,稳定性越好,获奖的可能性越小。
【解】①,因此两位选手的平均成绩是相同的;但是,S甲=0.67,S乙=1.25,因为S甲<>乙,所以甲发挥得更稳定;
②由于,且S甲<>乙,因此可派出乙选手参加比赛。
说明:对第二个问题的处理,也可结合众数进行。甲的数据的众数是9,乙的数据的众数是10和9,反映出大多数情况下,甲能打出9环,而乙能打出9环或10环。
Copyright 2010-2019 Qinzibuy.com 【亲亲园丁】 版权所有 备案编号:粤ICP备14102101号