福师 《 生物统计学 》1108 次考试批次视频串讲

42
2022年6年8年 1

Upload: christopher-wolf

Post on 31-Dec-2015

164 views

Category:

Documents


15 download

DESCRIPTION

福师 《 生物统计学 》1108 次考试批次视频串讲. 主讲人:孙中亮. 《 生物统计学 》. 第一部分:基本理论 绪论 生物统计学 第一章 数据与特征数 第二章 概率与分布 第三章 概率分布律 第四章 抽样分布 - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: 福师 《 生物统计学 》1108 次考试批次视频串讲

2023年4月19日 1

Page 2: 福师 《 生物统计学 》1108 次考试批次视频串讲

400-810-6736 www.open.com.cn

《生物统计学》

第一部分:基本理论 绪论 生物统计学绪论 生物统计学 第一章 数据与特征数第一章 数据与特征数 第二章 概率与分布第二章 概率与分布 第三章 概率分布律第三章 概率分布律 第四章 抽样分布第四章 抽样分布第二部分:基本方法 第五章 均数差异显著性检验第五章 均数差异显著性检验 第六章 参数估计第六章 参数估计 第七章 卡方检验第七章 卡方检验 第八、九章 方差分析第八、九章 方差分析 第十、十一章 相关与回归第十、十一章 相关与回归 第十二章 实验设计的原则第十二章 实验设计的原则

2

Page 3: 福师 《 生物统计学 》1108 次考试批次视频串讲

400-810-6736 www.open.com.cn

考试形式

2023年4月19日

Page 4: 福师 《 生物统计学 》1108 次考试批次视频串讲

400-810-6736 www.open.com.cn

绪论

• 知识点回顾: (( 11 )总体和样本)总体和样本 总体是根据研究目的确定的所要研究的所有对象;样本

是试验观察到的所有对象;样本是总体的一部分。 注意:两者特征值和参数的表示形式不同,分别用希腊

字母和拉丁字母表示。 (( 22 )生物统计学)生物统计学 应用数理统计原理,根据样本特征推断总体特征。常见

的错误:没有经过数理统计,直接得出总体特征等同于样本特征。 (( 33 )假设检验)假设检验 目的,原理,常见错误

2023年4月19日 4

【【假设检验假设检验】】[[ 实验及结果实验及结果 ] ] 实验组服用金花清感方,痊愈率实验组服用金花清感方,痊愈率 95.3%95.3% ;; 对照组不服药,痊愈率对照组不服药,痊愈率 89.1%89.1% 。。[[ 张三的推断张三的推断 ] ] 由于实验组痊愈率高于对照组,所以药有效。由于实验组痊愈率高于对照组,所以药有效。目的:目的:比较总体特征之间有无差异比较总体特征之间有无差异原理:原理:先假设总体特征之间无差异先假设总体特征之间无差异 再分析在此情况下是否也会出现再分析在此情况下是否也会出现““实验所观察到的结实验所观察到的结果果””

若不会出现,则判定所比较的总体特征之间有差异;若不会出现,则判定所比较的总体特征之间有差异; 若也会出现,则判定所比较的总体特征之间无差异;若也会出现,则判定所比较的总体特征之间无差异;实例分析:实例分析:在药无效情况下不会出现这样的结果,则药有效;在药无效情况下不会出现这样的结果,则药有效; 在药无效情况下也会出现这样的结果,则药无效。在药无效情况下也会出现这样的结果,则药无效。常见错误:常见错误:没有进行假设检验没有进行假设检验

Page 5: 福师 《 生物统计学 》1108 次考试批次视频串讲

400-810-6736 www.open.com.cn

例题

2023年4月19日 5

11 、根据假设检验原理,如果在假设的、总体特征 ______ 的总体中不能抽到所观察到的样本特征,则判定所要比较的总体特征 ______ 。

A 、有差异,有差异 B 、有差异,无差异 C 、无差异,有差异 D 、无差异,无差异【解析】可理解为假设相同,若与观察结果不符,则推翻原假设。

【基本原理】假设检验,首先是对研究的总体提出假设,在此假设下构造合适的统计量,并由统计量的抽样分布计算样本统计量的概率。根据估计出的统计量的概率值大小,做出接受或否定原假设的推断。

Page 6: 福师 《 生物统计学 》1108 次考试批次视频串讲

400-810-6736 www.open.com.cn

第十二章:实验设计的原则

• 知识点回顾: ( 1 )影响因素 处理因素是想要研究的因素;非处理因素除研究的因素外,其他对结

果有影响的因素。

2023年4月19日 6

[[ 实验及结果实验及结果 ] ] 张三亲眼观察到李四服用某秘方后痊愈了。张三亲眼观察到李四服用某秘方后痊愈了。[[ 张三的推断张三的推断 ] ] 实践是检验真理的唯一标准。实践是检验真理的唯一标准。““吃药后病好了吃药后病好了”” 这个实践结果验证了这个实践结果验证了““该秘方有效该秘方有效””是真理。是真理。影响因素影响因素概念:概念:处理因素处理因素————想研究的因素想研究的因素

非处理因素非处理因素————其它影响因素,不可避免。其它影响因素,不可避免。实例分析:实例分析:处理因素处理因素————某秘方某秘方

非处理因素非处理因素————其它药物、自愈、不明原因其它药物、自愈、不明原因……确定结果出现的原因确定结果出现的原因注意:注意:结果既可能是处理因素、也可能是非处理因素导致的结果既可能是处理因素、也可能是非处理因素导致的正确方法:正确方法:只有排除非处理因素导致结果发生的可能,只有排除非处理因素导致结果发生的可能,

才能确定结果是处理因素导致的。才能确定结果是处理因素导致的。常见错误:常见错误:没有排除非处理因素导致结果发生的可能没有排除非处理因素导致结果发生的可能

3、假设检验就是先确定 ______是否可能导致结果的发生。然后再依此得出______的结论。

A 、处理因素,结果是否发生 B 、处理因素,处理是否有效C 、非处理因素,结果是否发生 D、非处理因素,处理是否有效【解析】在实验设计中,有意识地安排一些重要的非处理因素,使它们的水平出现有规律的变化,以便尽可能的消除它们对实验结构的影响,更好地显露出处理因素的效应大小。

Page 7: 福师 《 生物统计学 》1108 次考试批次视频串讲

400-810-6736 www.open.com.cn

( 2 )实验设计目的目的:突出处理效应、消除条件效应、评估误差效应。原则原则:对照 ( 突显处理效应,消除条件效应 ) 、重复和随机化 ( 消除条件

效应,评估误差效应 ) 。常见错误常见错误:选择错误特征——无法体现处理效应 缺乏对照——无法体现处理效应 臆想对照的特征——无法体现处理效应 条件不一致——无法消除条件效应、误为处理效应 未重复——无法评估误差效应、误为处理效应 人为选择观察对象——无法消除条件效应

2023年4月19日 7

[ 实验及结果 ] 传统药物已经使用几千年了。 要是无效,人类早就死绝了。[ 张三的推断 ] 人类繁衍至今的事实证明了药有效。[ 所犯错误 ] 选择错误特征——无法体现处理效应(人的死亡与否不能反应药物是否有效;服药后病况有所改善且不服药病就不能好,才可以证明此药的疗效)

臆想对照特征——无法体现处理效应(有些症状不经药物治疗也可以痊愈)

Page 8: 福师 《 生物统计学 》1108 次考试批次视频串讲

400-810-6736 www.open.com.cn

例题14 、关于实验设计的随机化原则,错误的叙述是 。A 、从总体中抽取样本时必须遵循随机化原则B 、在人群中不是随机抽取、而是挑选 20~25 岁的人作为实验对象,这违背了随机化原

则C 、违背随机化原则,就无法正确评估误差的大小、无法确定处理是否有效D 、违背随机化原则,处理因素可能与条件因素发生叠加、从而无法确定处理是否有效【解析】“在人群中不是随机抽取、而是挑选 20~25 岁的人作为实验对象”并不违背随机

化原则,可以把年龄作为一种区组因素考虑。通过样本来推断总体是统计分析的基本特点。只有从总体中随机抽取的样本才具有代表性。若研究的对象并不是全部年龄段的人群,而只是 20-25 岁之间的年轻人,那么在这样的一个群体中随机抽样,也是正确的。

问答题:随机化的原则、目的;违背随机化原则可能导致的后果?【参考】实验设计必须遵循随机化,其原则是若干对象随机分配到各组进行实验或从总体

中随机抽取若干对象进行观察;目的是消除条件效应,评估误差效应;若违背随机化的原则,可能导致的后果是无法正确评估误差大小;导致“人为选择”与处理因素叠加。

2023年4月19日 8

Page 9: 福师 《 生物统计学 》1108 次考试批次视频串讲

400-810-6736 www.open.com.cn

基础理论部分

• 知识点回顾: ( 1 )数据类型 连续型数据 (度量数据 ) :特定区间内的任何值都可能出现;离散

型数据 ( 计数数据 ) :只可能是整数而不可能是小数。

2023年4月19日 9

1 、在特定区间内任何值都可能出现的数据称为 ______ 数据。A 、定性 B 、计数 C 、连续型 D 、离散型【解析】:连续性变数资料:这种资料的各个观察值不一定是整数,两个相邻的整数间可以有带小数的任何值出现,其小数位数的多少由度量工具的精度而定,它们之间的变异是连续的。离散型数据只可能是整数而不能是小数。

( 2 )特征数 度量 数据集中点的度量——平均数 数据变异程度的度量——标准差 数据分布的对称程度的度量——偏斜度 数据分布的陡峭程度的度量——峭度

5、 CV用于度量 。A 、数据的集中点 B 、数据分布的对称程度 C 、数据的变异程度 D 、数据分布的陡峭程度【解析】:平均数是资料的代表数,其代表性的强弱受资料中各观察值变异程度的影响。变异系数 CV 是标准差相对于平均数的百分数,是数据变异程度的度量。

Page 10: 福师 《 生物统计学 》1108 次考试批次视频串讲

2023年4月19日 10

( 3 )小概率原理 小概率事件在 1次试验中几乎不会发生;显著性水平 α :人为设定的小概率标准。如默认显著水平 α1=0.05 、极显著水平 α2=0.01 。

( 4 )单尾检验 上尾检验:用于比较未知参数是否大于已知参数时。若 p(X>x)<α ,则认为在 1次抽样中 x 实际是抽不到的,判定未知参数大于已知参数。 下尾检验:用于比较未知参数是否小于已知参数时。若 p(X<x)<α ,则认为在 1次抽样中 x 实际是抽不到的,判定未知参数小于已知参数。

5、根据小概率原理, ______小概率事件实际上不会发生。A、在 n 次试验中 B、当 n 足够大时 C、在 1次试验中 D、不论进行多少次试验【解析】统计假设检验就是根据小概率事件的不可能性原理来决定是不是要接受或者推翻原假设,因此,对于小概率事件的理解一定要准确,即在 1次试验中几乎不可能发生。

9 、若得出 m1与m2存在“差异极显著”,表示 ______ 。比较 m1 是否大于 m2

时,若得出“无显著差异”,表示 ______ 。A 、“ m1与m2 的值存在差异”的可能性极大, m1=m2

B 、“ m1与m2的值存在差异”的可能性极大,m1 ≤m2

C、m1与m2 的值相差极大, m1=m2

D、m1与m2 的值相差极大, m1 ≤ m2

【解析】在差异性水平上,默认 α=0.05 是显著水平; α=0.01 是极显著水平。在反应形式上是极显著水平左上方两颗星,显著水平左上方一颗星。

Page 11: 福师 《 生物统计学 》1108 次考试批次视频串讲

400-810-6736 www.open.com.cn

( 5 )概率分布律 在 1 次随机试验中可能出现哪种结果是随机的,但不同结果出现的

概率是有规律的,称为概率分布律。确定了概率分布律,就获得了所有结果的概率。

2023年4月19日 11

3、 _____ 分布的概率函数为: 。它是在 n次试验中某结果 _____ 的概率。A 、二项,恰好出现 x次 B 、二项,出现 x次及 x次以上 C 、泊松,恰好出现 x次 D 、泊松,出现 x次及 x次以上【解析】二项分布的定义已经在知识点中说明。泊松分布是一种可以用来描述和分析随机地发生在单位时间或者空间里的稀有事件的分布。作为一种离散型随机变量的概率分布,其均值和方差是相等的,这是泊松分布的一个显著特点。

5 、若 X~N(4, 9) ,则表示 X服从 ______ 分布,其总体标准差为 ______ 。A 、二项, 9 B 、二项, 3 C 、正态, 9 D 、正态, 3 【解析】正态分布是一种常见的连续型随机变量的概率分布。正态分布的曲线是以参数 μ和 σ2 的不同表现为一系列的曲线,所以正态分布曲线是一个曲线簇,不是一条曲线。参数 μ 是正态分布的位置参数, σ2 是性状参数。 σ2 表示总体的变异度,越大曲线越“胖”,表明数据比较分散;越小表明数据越集中在平均数 μ 的周围。

Page 12: 福师 《 生物统计学 》1108 次考试批次视频串讲

400-810-6736 www.open.com.cn

( 6 )抽样分布 指统计量的概率分布。如:样本平均数 的分布、 的分布、 的分布、 F分布、 χ2 分布等。

2023年4月19日 12

1 、统计量的分布是 ______ 。A 、正态分布 B 、二项分布 C 、随机分布 D 、抽样分布【解析】研究总体与从中抽取的样本之间的关系是统计学的中心内容,对这种关系的研究可从两个方面着手:一是从总体到样本,这就是研究抽样分布的问题;二是从样本到总体,这就是统计推断的问题。统计推断是以总体分布和抽样分布的理论关系为基础的。

4、

4 、样本均数之差的分布服从 ______。A、正态分布 B、 F 分布 C、 2分布 D、 t分布【解析】样本平均数的抽样分布服从或者逼近正态分布。因此,两个样本的平均数之差也是服从或者逼近正态分布。

Page 13: 福师 《 生物统计学 》1108 次考试批次视频串讲

400-810-6736 www.open.com.cn

第五章:均数差异性检验

• 知识点回顾: 单个样本均数的差异性检验:这是检验某一样本平均数与一已知

总体平均数是否有显著差异的方法。即检验无效假设 H0 和备择假设H1 的问题,具体的方法有 u检验和 t检验。

两个样本平均数的差异性检验:就是由两个样本平均数之差,去推断两个样本所在的总体的平均数之间是否存在差异,实际上就是检验两个处理的效应是否一样。

2023年4月19日 13

7、判断是否 时,必须进行双侧检验。A、 μ1>μ2 B、 μ1≥μ2 C、 μ1<μ2 D、 μ1≠μ2

【解析】选用双侧检验还是单侧检验,应根据专业的要求在试验设计的时候就确定下来。一般而论,若事先不知道 μμ0谁大谁小,为了检验两者之间是否有差异,则用双侧检验;如果凭借一定的专业知识和经验,推测 μμ0不会相等,为了检验两者谁大谁小应该选择单侧检验。

10 、当作出“差异 ”的结论时可能犯 I 型错误,犯错误的概率用 表示。A 、不显著, B 、不显著, C 、显著, D 、显著,【解析】统计假设检验是根据小概率事件的实际不可能性原理来决定是否接受原来的假设,因此作出任何的判断都是有一定的错误风险的。如果非真实差异错判为真实差异,就是第一类错误,犯错的概率为显著水平 α ;若把真实的差异错判为非真实的差异,即是第二类错误,犯错的概率为 β 。

Page 14: 福师 《 生物统计学 》1108 次考试批次视频串讲

400-810-6736 www.open.com.cn

第六章:参数估计

知识点回顾:• 1. 点估计:用某一个样本统计数直接估计相应的总体参数。• 2. 区间估计:在一定概率保证下,结合抽样误差,估计出参数可能

出现的一个范围(区间),使绝大数该参数的点估计值都能够包含在这个区间内,这种估计参数的方法叫做参数的区间估计,所给出的这个区间叫做置信区间。

2023年4月19日 14

3 、用于估计一个参数的估计量有多种。其中,具有 ______ 的为最优估计。A 、无偏性 B 、有效性 C 、相容性 D 、都必须【解析】样本统计量具备的三个原则:无偏性、有效性、相容性。

Page 15: 福师 《 生物统计学 》1108 次考试批次视频串讲

400-810-6736 www.open.com.cn

第七章:卡方检验(计算题)

知识点回顾:• 1. 所谓非参数统计,就是对总体分布的具体形式不必做任何限制性假

定和不以总体参数具体数值估计或者检验为目的的推断统计,这种统计主要用于对某种判断,或假设进行检验,故称为非参数检验。

• 2. 拟合优度检验是检验来自总体中的一类数据其分布是否与某种理论分布相一致的统计方法。

• 3. 独立性检验是根据次数资料判断两类因子彼此相关或相互独立的假设检验。

2023年4月19日 15

5 、拟合优度检验的自由度为 _____ 。若 _____ 就要使用有矫正的公式计算 c2

值。A、 df=(R-1)(C-1), df=1 B、 df=k-1, df=1 C、 df=(R-1)(C-1), df>1 D、 df=k-1, df>1【解析】卡方分布用于进行次数分布的拟合优度检验时有一定的相似性,为使这类检验更加确切,一般需要注意以下几点:⑴总观察次数 n 应较大,一般不少于 50.⑵分组数最好在 5 组以上。⑶每组的理论次数不应太少,至少为 5 ,尤其是首尾各组,若理论次数少于 5 ,最好将其与相邻的组合并为一组。⑷自由度为 1 时,应计算校正的 c2 值。

Page 16: 福师 《 生物统计学 》1108 次考试批次视频串讲

例:例: (v+v)×(v+v) 的后代有正常翅 ( 显性 ) 和残翅 (隐性 )2 种表现型。 观察 392 个后代,其中正常翅 311 个。问:是否符合分离律?(1)(1)HH00 :: O-TO-T=0=0

(2)(2) 已知:已知: kk=2=2 ,, 11==0.050.05 ,, 22==0.010.01

计算用表计算用表

(3)(3)dfdf==kk-1=2-1=1-1=2-1=1 ,,查查《《 22 分布的上侧临界值分布的上侧临界值 ((22)) 表表 》》得:得:

单侧单侧 220.050.05==3.8413.841 ,单侧,单侧 22

0.010.01==6.6356.635

(4)(4)

(5)∵(5)∵22<<22 ,,∴∴ pp>0.05>0.05 , 结论:与分离率无显著差异, 结论:与分离率无显著差异。。

计算题——拟合优度检验

表现型表现型 正常翅正常翅 残翅残翅 ΣΣ

观测数观测数 O O 311311 8181 392392理论数理论数 T T 294294 9898 392392

22

1

( -0.5)ki i

i i

O T

T

2 2( 311-294 -0.5) ( 81-98 -0.5)

294 98 =3.704=3.704

Page 17: 福师 《 生物统计学 》1108 次考试批次视频串讲

400-810-6736 www.open.com.cn

计算题————拟合优度检验

17

例 7-1 纯合的黄圆与绿皱豌豆杂交、 F1 代自交。观察 F2代 556粒,其中黄圆315粒、黄皱 101粒、绿圆 108粒、绿皱 32粒。问:是否符合自由组合律?

解: (1)H0: O-T=0 (2)已知: k=4, a1=0.05, a2=0.01 计算用表

(3)df=k-1=4-1=3 ;查《 χ2 分 布 的上侧临界值 ( ) 表》得 =7.815 、 =11.345

(4) )

(5)∵ χ2< ,∴ p>0.05 结论:符合自由组合律。

Page 18: 福师 《 生物统计学 》1108 次考试批次视频串讲

例:例:为了解中药“金花清感方”能否改善甲流患者的症状, 设实验组 102 人口服“金花清感方”,症状改善率为 95.1% ; 设对照组 103 人不服药,症状改善率为 89.3% 。 问:“金花清感方”能否提高症状改善率?(1)(1)HH00 :: O-TO-T=0=0(2)(2) 已知:已知: RR=2=2 ,, CC=2=2 ,, 11==0.050.05 ,, 22==0.010.01 (3)(3)dfdf=(=(RR-1)(-1)(CC-1)=(2-1)(2-1)=1-1)=(2-1)(2-1)=1 查查临界值表临界值表得:得: 22

0.050.05==3.8413.841 ,, 220.010.01==6.6356.635

(4)(4)

=1.642=1.642

(5)∵(5)∵22<<22 ,,∴∴ pp>0.05>0.05 ,结论:“金花清感方”不能提高症状改善率,结论:“金花清感方”不能提高症状改善率

计算题——独立性检验

组 组 别 别

改善例数 改善例数 无改善例数 无改善例数 ΣΣ

实验组实验组 97(94.039)97(94.039) 5 (7.961)5 (7.961) 102102对照组对照组 92(94.961)92(94.961) 11 (8.039)11 (8.039) 103103

ΣΣ 189189 1616 2052052 2( 97-94.039 -0.5) ( 5-7.961 -0.5)

94.039 7.961

22

1

( -0.5)ki i

i i

O T

T

2 2( 92-94.961 -0.5) (11-8.039 -0.5)

94.961 8.039

计算用表计算用表

Page 19: 福师 《 生物统计学 》1108 次考试批次视频串讲

例:例: 用射线 1 照射 3570 个细胞,有 192 个出现畸变; 用射线 2 照射 3616 个细胞,有 319 个出现畸变; 用射线 3 照射 3814 个细胞,有 194 个出现畸变。 问:不同射线所引起的畸变数有无差异?(1)(1)HH00 :: O-TO-T=0 =0

(2)(2) 已知:已知: RR=3=3 ,, CC 11==0.050.05 ,, 22==0.010.01

(3)(3)dfdf=(R-1)(C-1)=(R-1)(C-1) =(3-1)(2-1)=2=(3-1)(2-1)=2 ,, 查查 22 临界值表临界值表得:得:22

0.050.05==5.991, 5.991, 220.010.01==9.2109.210

(4)(4)

=52.543=52.543

(5)∵(5)∵22>>22,,∴∴pp<0.01 <0.01 结论结论 :: 不同射线所引起的畸变数有极显著差异不同射线所引起的畸变数有极显著差异

计算题——独立性检验

正常细胞数正常细胞数 畸变细胞数畸变细胞数 ΣΣ

射线射线 11 3378(3341.195)3378(3341.195) 192(228.805)192(228.805) 35703570射线射线 22 3297(3384.247)3297(3384.247) 319(231.753)319(231.753) 36163616射线射线 33 3620(3569.557)3620(3569.557) 194(244.443)194(244.443) 38143814

ΣΣ 1029510295 705705 1100011000

2 2 2(192 228.805) (319-231.753) (194-244.443)

228.805 231.753 244.443

22

1

( )ki

i i

O T

T

2 2 2(3378 3341.195) (3297-3384.247) (3620-3569.557)

3341.195 3384.247 3569.557

计算用表计算用表

Page 20: 福师 《 生物统计学 》1108 次考试批次视频串讲

400-810-6736 www.open.com.cn

第八九章:方差分析(操作题)

知识点回顾: 方差分析的最大功用在于:( 1 )它能够将引起变异的多种因素的各自作用一一剖析出来,做出量的

估计,进而辨明哪些原因是起主要作用的,哪些原因是次要作用的。( 2 )它能充分应用资料提供的信息将试验中由偶然因素造成的随机误差

无偏地估计出来,从而大大提高了对实验结果分析的准确性,为统计假设检验的可靠性提供依据。

2023年4月19日 20

3 、比较多个总体平均数时,若采用多个 t 检验会 ______犯 I 型错误的概率。因此应采用 ______ 。A 、提高, u 检验 B 、提高,方差分析 C 、减少, u 检验 D 、减少,方差分析【解析】使用 t 检验会增加犯一类错误的概率,主要原因:一是导致变异的各种因素所起作用的大小量的估计不准确;二是因为没有考虑相互比较的多个处理均数依其大小顺序排列的秩次距问题。

Page 21: 福师 《 生物统计学 》1108 次考试批次视频串讲

操作题——数据输入

三种原料、三种温度发酵的酒精产量已输入工作表(如右表)。三种原料、三种温度发酵的酒精产量已输入工作表(如右表)。要求判断温度因素、以及原料与温度的交互作用是否影响产量。要求判断温度因素、以及原料与温度的交互作用是否影响产量。

请在以下对话框中填入需要输入的内容:请在以下对话框中填入需要输入的内容:

Page 22: 福师 《 生物统计学 》1108 次考试批次视频串讲

操作题——下结论

三种原料、三种温度发酵的酒精产量已三种原料、三种温度发酵的酒精产量已输入工作表(如右表)。要求判断温度因输入工作表(如右表)。要求判断温度因素、以及原料与温度的交互作用是否影响素、以及原料与温度的交互作用是否影响产量。操作结果见下表。产量。操作结果见下表。

原料因素:原料因素: p p == 结论:结论:

0.0400.040 原料对产量有显著影响原料对产量有显著影响

Page 23: 福师 《 生物统计学 》1108 次考试批次视频串讲

400-810-6736 www.open.com.cn

第十十一章:相关与回归(操作题)

知识点回顾:1. 自变量:在回归分析中,常把可以控制或者能够精确观察,或比较容易测定的变量,常用 x 表示。因变量:把另一个与 x 有密切关系,但是取值却具有随机性的变量称为因变量,常用 y 表示。

2. 意义 :相关反映两变量的相互关系,即在两个变量中,任何一个的变化都会引起另一个的变化,是一种双向变化的关系。回归是反映两个变量的依存关系,一个变量的改变会引起另一个变量的变化,是一种单向的关系。

3. 相关系数 r与回归系数 b : r与 b的绝对值反映的意义不同。 r的绝对值越大,散点图中的点越趋向于一条直线,表明两变量的关系越密切,相关程度越高。 b的绝对值越大,回归直线越陡,说明当 X 变化一个单位时, Y 的平均变化就越大。反之也是一样。

2023年4月19日 23

3 、如果 T对W存在 ______ 关系,则 T______ 。A 、相关,自变量 B 、相关,因变量 C 、回归,自变量 D 、回归,因变量【解析】注意函数和回归的区别,前者是存在确定的因变量与自变量相对应;后者是存在因变量的分布与自变量对应。另外,在书写格式上,是“因变量对自变量存在回归关系。”6 、相关系数的值在 ______ 之间。其绝对值越大则相关关系越 ______ 。A、 +∞~-∞ ,强 B、 +∞~-∞ ,弱 C、 +1~-1 ,强 D、 +1~-1 ,弱【解析】相关系数表示两个变量之间关系密切程度及性质的指标。越大表明关系越密切。

Page 24: 福师 《 生物统计学 》1108 次考试批次视频串讲

400-810-6736 www.open.com.cn

操作题————线性回归不同 NaCl含量 (g·kg-1) 的土壤上生长的植物叶片单位面积干重 (mg·dm-2) 如下

表。

已知含盐量与干重呈线性关系。求直线回归方程。请将数据按照 Excel 所要求的格式输入工作表中:

2023年4月19日 24

Page 25: 福师 《 生物统计学 》1108 次考试批次视频串讲

400-810-6736 www.open.com.cn

不同 NaCl含量的土壤上生长的植物叶片单位面积干重输入 Excel工作表后,下一步应点击 Excel的 __工具 ____菜单的“数据分析”。在下图所示的数据分析对话框中选择的分析工具是:

_回归 ____ 。

2023年4月19日 25

Page 26: 福师 《 生物统计学 》1108 次考试批次视频串讲

400-810-6736 www.open.com.cn

不同 NaCl含量 (g·kg-1) 的土壤上生长的植物叶片单位面积干重 (mg·dm-2)已输入 Excel工作表。请在以下对话框中填入需要输入的内容。

为判断土壤含盐量与叶片干重的关系,操作结果见下表。

2023年4月19日 26

Page 27: 福师 《 生物统计学 》1108 次考试批次视频串讲

400-810-6736 www.open.com.cn

运行结果

2023年4月19日 27

Page 28: 福师 《 生物统计学 》1108 次考试批次视频串讲

400-810-6736 www.open.com.cn

如何下结论:

相关系数为: __0.929_____________。 a=__A___( A 、 81.786 B、 11.161 )。

回归方程为:__ŷ=81.768+11.161x_____________________________________ 。

方差分析: p=__0.002_____ 。回归 __C___( A 、不显著 B 、显著 C、极显著)。

α的 95%置信区间: _67.057~96.515_。 β1的 95%置信区间:__6.054~16.267__ 。

2023年4月19日 28

Page 29: 福师 《 生物统计学 》1108 次考试批次视频串讲

统计分析类型的确定

A、单样本u检验 G、方差齐性检验 M、多重比较

B、双样本u检验 H、等方差成组数据t检验 N、拟合优度检验

C、单样本t检验 I、异方差成组数据t检验 O、独立性检验

D、配对数据t检验 J、单因素方差分析 P、一元线性回归

E、的置信区间估计 K、无重复双因素方差分析 Q、多元线性回归

F、的置信区间估计 L、有重复双因素方差分析

Page 30: 福师 《 生物统计学 》1108 次考试批次视频串讲

( )A

参数估计

假设检验

相关与回归

( )F

C

平均数差异显著性检验

检验

方差分析

多重比较

卡方检验

统计分析类型的确定

Page 31: 福师 《 生物统计学 》1108 次考试批次视频串讲

在在 NaClNaCl 含 量 为含 量 为0.80.8 、、 1.61.6 、、 2.42.4 、、 3.2(g/kg)3.2(g/kg) 的土壤上的土壤上试种烟叶。采收时,每种土壤上各采试种烟叶。采收时,每种土壤上各采集集 77 株,测量各株的单位面积叶片干株,测量各株的单位面积叶片干重(数据略)。问:不同重(数据略)。问:不同 NaClNaCl 含量土含量土壤的烟叶单位面积干重有无差别?壤的烟叶单位面积干重有无差别?

( )A

参数估计

假设检验

相关与回归

( )F

C

平均数差异显著性检验

检验

方差分析

多重比较

卡方检验

单因素方差分析单因素方差分析

Page 32: 福师 《 生物统计学 》1108 次考试批次视频串讲

在在 NaClNaCl 含 量 为含 量 为00 、、 0.80.8 、、 1.61.6 、、 2.42.4 、、 3.23.2 、、 4.04.0 、、 44.8(g/kg).8(g/kg) 的土壤上试种烟叶。采收时,的土壤上试种烟叶。采收时,每种土壤上各采集每种土壤上各采集 77 株,测量各株的株,测量各株的单位面积叶片干重(数据略)。已知单位面积叶片干重(数据略)。已知不同不同 NaClNaCl 含量土壤上的烟叶单位面积含量土壤上的烟叶单位面积干重存在差异。干重存在差异。

问:哪些土壤上的烟叶干重是不同问:哪些土壤上的烟叶干重是不同的?的?

( )A

参数估计

假设检验

相关与回归

( )F

C

平均数差异显著性检验

检验

方差分析

多重比较

卡方检验

多重比较多重比较

Page 33: 福师 《 生物统计学 》1108 次考试批次视频串讲

( )A

参数估计

假设检验

相关与回归

( )F

C

平均数差异显著性检验

检验

方差分析

多重比较

卡方检验

在第一渔场和第二渔场各测量了在第一渔场和第二渔场各测量了 2020条马面鲀体长(数据略)。问:这二条马面鲀体长(数据略)。问:这二个渔场马面鲀体长总体方差是否相等?个渔场马面鲀体长总体方差是否相等?

方差齐性检验方差齐性检验

Page 34: 福师 《 生物统计学 》1108 次考试批次视频串讲

( )A

参数估计

假设检验

相关与回归

( )F

C

平均数差异显著性检验

检验

方差分析

多重比较

卡方检验

在第一渔场和第二渔场各测量了在第一渔场和第二渔场各测量了 2020条马面鲀体长(数据略,已知条马面鲀体长(数据略,已知 σσ11≠σ≠σ

22 )。问:这二个渔场马面鲀的体长)。问:这二个渔场马面鲀的体长是否相同?是否相同?异方差成组数据异方差成组数据 tt 检验检验

Page 35: 福师 《 生物统计学 》1108 次考试批次视频串讲

( )A

参数估计

假设检验

相关与回归

在一定范围内,发酵温度与酒精产量呈线性关系。下在一定范围内,发酵温度与酒精产量呈线性关系。下表为不同的发酵温度所对应的酒精产量表为不同的发酵温度所对应的酒精产量 (( 数据略数据略 )) 。求。求直线回归方程。直线回归方程。一元线性回归方程一元线性回归方程

Page 36: 福师 《 生物统计学 》1108 次考试批次视频串讲

( )A

参数估计

假设检验

相关与回归

( )F

C

平均数差异显著性检验

检验

方差分析

多重比较

卡方检验

下表为不同温度、不同原料下的酒精产量,下表为不同温度、不同原料下的酒精产量,相同条件下设相同条件下设 33 个重复(数据略)。问:个重复(数据略)。问:不同温度、不同原料对酒精产量的影响是不同温度、不同原料对酒精产量的影响是否显著?否显著?有重复双因素方差分析有重复双因素方差分析

Page 37: 福师 《 生物统计学 》1108 次考试批次视频串讲

( )A

参数估计

假设检验

相关与回归

随机抽取某植物叶片随机抽取某植物叶片 160160 片进行观察,片进行观察,发现叶片边缘齿数有发现叶片边缘齿数有 1818 、、 1616 、、 1414 、、 1212 四种,四种,被观察到的叶片数量分别为被观察到的叶片数量分别为 9090 、、 3030 、、 3030 、、 1010片片问:该植物叶片边缘齿数的平均值是多少?问:该植物叶片边缘齿数的平均值是多少? ((=0.05)=0.05) 的置信区间估计的置信区间估计

Page 38: 福师 《 生物统计学 》1108 次考试批次视频串讲

( )A

参数估计

假设检验

相关与回归

( )F

C

平均数差异显著性检验

检验

方差分析

多重比较

卡方检验

随机抽取某植物叶片随机抽取某植物叶片 160160 片进行观察,片进行观察,发 现 叶 片 边 缘 齿 数 有发 现 叶 片 边 缘 齿 数 有1818 、、 1616 、、 1414 、、 1212 四种,被观察到的四种,被观察到的叶片数量分别为叶片数量分别为 9090 、、 3030 、、 3030 、、 1010 片。片。问:这问:这 44 种特征的比例是否符合种特征的比例是否符合 10:2:2:110:2:2:1的比例?的比例? ((=0.05)=0.05)拟合优度检验拟合优度检验

Page 39: 福师 《 生物统计学 》1108 次考试批次视频串讲

( )A

参数估计

假设检验

相关与回归

( )F

C

平均数差异显著性检验

检验

方差分析

多重比较

卡方检验

在高原集训之前随机抽取在高原集训之前随机抽取 1010 名运动员检测名运动员检测血红蛋白含量,在高原集训之后再随机抽血红蛋白含量,在高原集训之后再随机抽取取 1010 名运动员检测血红蛋白含量(数据名运动员检测血红蛋白含量(数据略)。问:高原集训是否提高了血红蛋白略)。问:高原集训是否提高了血红蛋白含量?含量?等方差成组数据等方差成组数据 tt 检验或检验或等方差成组数据等方差成组数据 tt检验,应进行方差齐性检验来确定。检验,应进行方差齐性检验来确定。

Page 40: 福师 《 生物统计学 》1108 次考试批次视频串讲

( )A

参数估计

假设检验

相关与回归

( )F

C

平均数差异显著性检验

检验

方差分析

多重比较

卡方检验

在高原集训之前随机抽取在高原集训之前随机抽取 1010 名运动员检测名运动员检测血红蛋白含量,在高原集训之后再抽取这血红蛋白含量,在高原集训之后再抽取这1010 名运动员检测血红蛋白含量(数据略)。名运动员检测血红蛋白含量(数据略)。问:高原集训是否提高了血红蛋白含量?问:高原集训是否提高了血红蛋白含量?

配对数据配对数据 tt 检验检验

Page 41: 福师 《 生物统计学 》1108 次考试批次视频串讲

考核的形式

选择填空 15%

统计类型 10%

计算题 20% —— 须自备计算器操作题 25%

问答题 30%

Page 42: 福师 《 生物统计学 》1108 次考试批次视频串讲

42

祝大家顺利通过考试!