届高考数学第一轮复习教案第40讲 统计
2013届高考数学第一轮复习教案第40讲统计本文简介:2013年普通高考数学科一轮复习精品学案第40讲统计一.课标要求:1.统计案例通过典型案例,学习下列一些常见的统计方法,并能初步应用这些方法解决一些实际问题。(1)通过对典型案例(如“肺癌与吸烟有关吗“等)的探究,了解独立性检验(只要求2×2列联表)的基本思想、方法及初步应用;(2)通过对典型案例(
2013届高考数学第一轮复习教案第40讲统计本文内容:
2013年普通高考数学科一轮复习精品学案
第40讲
统计
一.课标要求:
1.统计案例
通过典型案例,学习下列一些常见的统计方法,并能初步应用这些方法解决一些实际问题。
(1)通过对典型案例(如“肺癌与吸烟有关吗“等)的探究,了解独立性检验(只要求2×2列联表)的基本思想、方法及初步应用;
(2)通过对典型案例(如“质量控制“、“新药是否有效“等)的探究,了解实际推断原理和假设检验的基本思想、方法及初步应用;
(3)通过对典型案例(如“昆虫分类“等)的探究,了解聚类分析的基本思想、方法及初步应用;
(4)通过对典型案例(如“人的体重与身高的关系“等)的探究,进一步了解回归的基本思想、方法及初步应用。
2.随机变量的分布列
(1)在对具体问题的分析中,理解取有限值的离散型随机变量及其分布列的概念,认识分布列对于刻画随机现象的重要性;
(2)通过实例(如彩票抽奖),理解超几何分布及其导出过程,并能进行简单的应用;
(3)在具体情境中,了解条件概率和两个事件相互独立的概念,理解n次独立重复试验的模型及二项分布,并能解决一些简单的实际问题;
(4)通过实例,理解取有限值的离散型随机变量均值、方差的概念,能计算简单离散型随机变量的均值、方差,并能解决一些实际问题;
(5)通过实际问题,借助直观(如实际问题的直方图),认识正态分布曲线的特点及曲线所表示的意义。
二.命题走向
统计案例
本部分内容主要包括回归分析的基本思想及其初步应用和独立性检验的基本思想和初步应用,是教材新增内容,估计高考中比重不会过大。
预测2013年的高考主要有以下几种情况:
(1)知识点将会考察回归分析的基本思想方法,用独立性检验判断A与B间的关系,及2×2列联表;
(2)考查的形式主要以选择、填空题为主,但不会涉及很多;
随机变量的分布列
本部分内容主要包括随机变量的概念及其分布列,离散性随机变量的均值和方差,正态分布,从近几年的高考观察,这部分内容有加强命题的趋势。
预测2013年的高考对本部分内容的考查有以下情况:
(1)考查的重点将以随机变量及其分布列的概念和基本计算为主,题型以选择、填空为主,有时也以解答题形式出现;
(2)预计2013年高考还是实际情景为主,建立合适的分布列,通过均值和方差解释实际问题;
三.要点精讲
统计案例
1.相关系数
相关系数是因果统计学家皮尔逊提出的,对于变量y与x的一组观测值,把
叫做变量y与x之间的样本相关系数,简称相关系数,用它来衡量两个变量之间的线性相关程度。
相关系数的性质:≤1,且越接近1,相关程度越大;且越接近0,相关程度越小。
显著性水平:显著性水平是统计假设检验中的一个概念,它是公认的小概率事件的概率值。它必须在每一次统计检验之前确定。显著性检验:(相关系数检验的步骤)由显著性水平和自由度查表得出临界值,显著性水平一般取0.01和0.05,自由度为n-2,其中n是数据的个数在“相关系数检验的临界值表”查出与显著性水平0.05或0.01及自由度n-2(n为观测值组数)相应的相关数临界值r0
05或r0
01;例如n=7时,r0.05=0.754,r0.01=0.874求得的相关系数r和临界值r0.05比较,若r>r0.05,上面y与x是线性相关的,当≤r0.05或r0.01,认为线性关系不显著。
结论:讨论若干变量是否线性相关,必须先进行相关性检验,在确认线性相关后,再求回归直线;
通过两个变量是否线性相关的估计,实际上就是把非确定性问题转化成确定性问题来研究;
我们研究的对象是两个变量的线性相关关系,还可以研究多个变量的相关问题,这在今后的学习中会进一步学到。
2.卡方检验
统计中有一个有用的(读做“卡方”)统计量,它的表达式是:
,经过对统计量分布的研究,已经得到了两个临界值:3.841与6.635。当根据具体的数据算出的k>3.841时,有95%的把握说事件A与B有关;当k>6.635时,有99%的把握说事件A与B有关;当k3.841时,认为事件A与B是无关的。
随机变量
1.随机变量的概念
如果随机试验的结果可以用一个变量来表示,那么这样的变量叫做随机变量。随机变量常用希腊字母ξ、η等表示。
对于随机变量可能取的值,我们可以按一定次序一一列出,这样的随机变量叫做离散型随机变量。
注:随机变量ξ是关于试验结果的函数,即每一个试验结果对应着一个实数;随机变量ξ的线性组合η=aξ+b(a、b是常数)也是随机变量。
2.离散性随机变量的分布列
一般地,设离散型随机变量可能取得值为:
X1,X2,…,X3,…,
取每一个值Xi(I=1,2,…)的概率为P(,则称表
X1
X2
…
xi
…
P
P1
P2
…
Pi
…
为随机变量的概率分布,简称的分布列。
两条基本性质:①…);②P1+P2+…=1。
3.独立
相互独立事件:事件A(或B)是否发生对事件B(或A)发生的概率没有影响.这样的两个事件叫做相互独立事件。
独立重复试验:若n次重复试验中,每次试验结果的概率都不依赖于其他各次试验的结果,则称这n次试验是独立的。
公式
(1)两个相互独立事件同时发生的概率,等于每个事件发生的概率的积,即P(A·B)=P(A)·P(B);
推广:若事件A1,A2,…,An相互独立,则P(A1·A2…An)=P(A1)·P(A2)·…·P(n)。[来源:学*科*网Z*X*X*K]
(2)如果在一次试验中***发生的概率为P,那么在n次独立重复试验中这个事件恰好发生k次的概率:Pn(k)=CPk(1-P)n-k。
4.随机变量的均值和方差
(1)随机变量的均值
…;反映随机变量取值的平均水平。
(2)离散型随机变量的方差:
……;反映随机变量取值的稳定与波动,集中与离散的程度。
基本性质:;。
5.几种特殊的分布列
(1)两点分步
两点分布:对于一个随机试验,如果它的结果只有两种情况,则我们可用随机变量,来描述这个随机试验的结果。如果甲结果发生的概率为P,则乙结果发生的概率必定为1-P,所以两点分布的分布列为:
1
0
P
P
1-p
均值为E=p,方差为D=p(1-p)。
(2)超几何分布
重复进行独立试验,每次试验只有成功、失败两种可能,如果每次试验成功的概率为p,重复试验直到出现一次成功为止,则需要的试验次数是一个随机变量,用ξ表示,因此事件{ξ=n}表示“第n次试验成功且前n-1次试验均失败”。所以,其分布列为:
ξ
1
2
…
n
…
P
p
p(1-p)
…
…
(3)二项分布
如果我们设在每次试验中成功的概率都为P,则在n次重复试验中,试验成功的次数是一个随机变量,用ξ来表示,则ξ服从二项分布.则在n次试验中恰好成功k次的概率为:
二项分布的分布列为:
ξ
0
1
…
…
n
P
…
…
记ε是n次独立重复试验***发生的次数,则ε~B(n,p);其概率…。期望Eε=np,方差Dε=npq。
6.正态分布
正态分布密度函数:,均值为Eε=μ,方差为。
正态曲线具有以下性质:
(1)曲线在x轴的上方,与x轴不相交。
(2)曲线关于直线x
=μ对称。
(3)曲线在x
=μ时位于最高点。
(4)当x
μ时,曲线下降。并且当曲线向左、右两边无限延伸时,以x轴为渐近线,向它无限靠近。
(5)当μ一定时,曲线的形状由σ确定。σ越大,曲线越“矮胖”,表示总体越分散;σ越小,曲线越“瘦高”,表示总体的分布越集中。
从理论上讲,服从正态分布的随机变量的取值范围是R,但实际上取区间(μ-3σ,μ+3σ)外的数值的可能性微乎其微,在实际问题中常常认为它是不会发生的。因此,往往认为它的取值是个有限区间,即区间(μ-3σ,μ+3σ),这即实用中的三倍标准差规则,也叫3σ规则。在企业管理中,经常应用这个规则进行产品质量检查和工艺生产过程控制。
四.典例解析
题型1:线性相关性检验
例1.一个工厂在某年里每月产品的总成本y(万元)与该月产量x(万件)之间由如下一组数据:
x
1.08
1.12
1.19
1.28
1.36
1.48
1.59
1.68
1.80
1.87
1.98
2.07
y
2.25
2.37
2.40
2.55
2.***
2.75
2.92
3.03
3.14
3.26
3.36
3.50
1)画出散点图;2)检验相关系数r的显著性水平;3)求月总成本y与月产量x之间的回归直线方程.
解析:
i
1
2
3
4
5
6
7
8
9
10
11
12
xi
1.08
1.12
1.19
1.28
1.36
1.48
1.59
1.68
1.80
1.87
1.98
2.07[来源:学
解析:设离散性随机变量可能取的值为,所以,即,
又的数学期望,则,即,,∴
。
点评:均值计算时要根据公式进行简化计算,从而达到简化运算的目的。
题型6:随机变量的方差
例11.甲、乙两名工人加工同一种零件,两人每天加工的零件数相等,所得次品数分别为ε、η,ε和η的分布列如下:
ε
0
1
2
η
0
1
2
P
P
试对这两名工人的技术水平进行比较。
分析:一是要比较两名工人在加工零件数相等的条件下出次品数的平均值,即期望;二是要看出次品数的波动情况,即方差值的大小。
解析:工人甲生产出次品数ε的期望和方差分别为:
,
;
工人乙生产出次品数η的期望和方差分别为:
,
;
由Eε=Eη知,两人出次品的平均数相同,技术水平相当,但Dε>Dη,可见乙的技术比较稳定。
点评:期望仅体现了随机变量取值的平均大小,但有时仅知道均值的大小还不够。如果两个随机变量的均值相等,还要看随机变量的取值如何在均值周围变化,即计算方差。方差大说明随机变量取值较分散,方差小说明取值分散性小或者取值比较集中、稳定。
题型7:正态分布
例12.在某校举行的数学竞赛中,全体参赛学生的竞赛成绩近似服从正态分布。已知成绩在90分以上(含90分)的学生有12名。
(Ⅰ)、试问此次参赛学生总数约为多少人?
(Ⅱ)、若该校计划奖励竞赛成绩排在前50名的学生,试问设奖的分数线约为多少分?
可共查阅的(部分)标准正态分布表
0
1
2
3
4
5
6
7
8
9
1.2
1.3
1.4
1.9
2.0
2.1
0.8849
0.9032
0.9192
0.9713
0.9772
0.9821
0.8869
0.9049
0.9207
0.9719
0.9778
0.9826
0.888
0.9066
0.9222
0.9726
0.9783
0.9830
0.8907
0.9082
0.9236
0.9732
0.9788
0.9834
0.8925
0.9099
0.9251
0.9738
0.9793
0.9838
0.8944
0.9115
0.9265
0.9744
0.9798
0.9842
0.8962
0.9131
0.9278
0.9750
0.9803
0.9846
0.8980
0.9147
0.9292
0.9756
0.9808
0.9850
0.8997
0.9162
0.9306
0.9762
0.9812
0.9854
0.9015
0.9177
0.9319
0.9767
0.9817
0.9857
解析:(Ⅰ)设参赛学生的分数为,因为~N(70,100),由条件知,
P(≥90)=1-P(<90)=1-F(90)=1-=1-(2)=1-0.9772=0.228.
这说明成绩在90分以上(含90分)的学生人数约占全体参赛人数的2.28%,因此,
参赛总人数约为≈526(人)。
(Ⅱ)假定设奖的分数线为x分,则P(≥x)=1-P( 故设奖得分数线约为83.1分。 点评:本小题主要考查正态分布,对独立事件的概念和标准正态分布的查阅,考查运用概率统计知识解决实际问题的能力。 五.思维总结 1.一般情况下,在尚未断定两个变量之间是否具有线性相关关系的情况下,应先进行相关性检验.在确认其具有线性相关关系后,再求其回归直线方程;由部分数据得到的回归直线,可以对两个变量间的线性相关关系进行估计,这实际上是将非确定性的相关关系问题转化成确定性的函数关系问题进行研究.由于回归直线将部分观测值所反映的规律性进行了延伸,它在情况预报、资料补充等方面有着广泛的应用。 2.对卡方统计量的表达式的由来,学生只需要了解,作为探究问题可以在课后学习。 统计的基本思维模式是归纳的,它的特征之一是通过部分数据来推测全体数据的性质,因此,统计推断可能是错误的,也就是说,我们从数据上体现的只是统计上的关系,而不是因果关系。