《生物统计》样卷

发布 2024-01-13 09:55:18 阅读 8269

第一部分名词解释(5*2)

1、 自由度:独立变量的个数(df)若估计参数( )所使用的n个变量,受m个变量约束,则df =n-m。

2、 概率(统计定义):在相同条件下进行n次重复试验,如果随机事件a发生的次数为m,那么m/n称为随机事件a的频率(frequency);当试验重复数n逐渐增大时,随机事件a的频率越来越稳定地接近某一数值 p ,那么就把 p称为随机事件a的概率。

3、 二项分布:如果从二项总体中独立地抽取n个个体,可能得到y个个体属于“此”, n-y个个体而属于“彼”。那么得到的y个“此”个体的数目可能为、…n个。

此处将y作为间断性资料的变量,y共有n+1种取值,这n+1种取值各有其概率,因而由y变量及其概率就构成了一个分布,这个分布叫做二项式概率分布,简称二项式分布或二项分布。

4、 抽样误差:从一总体中抽出的样本,其平均数与原总体平均数的差异。

5、 方差分析:这方法是将k个处理的观测值作为一个整体看待,把观测值总变异的平方和及自由度分解为相应不同变异**的平方和及自由度,进而获得不同变异**总体方差估计值。

6、 参数:根据总体全部观察值计算得到的某性状的特征数。

7、 统计数:根据样本观察值计算得到的某性状的特征数。

8、 试验指标:在试验中具体测定的性状或观察的项目。

9、 试验因素:人为控制的、影响试验指标的原因(单因素与多因素)。

10、 总体:根据研究目的确定的研究对象的全体,其中的一个研究对象称为个体。(总体往往是根据事物的属性人为规定的)。

11、 样本:从总体中抽取的一部分供观察测定的个体组成的集合。

12、样本容量:样本所包含的个体数目(大样本和小样本(p5))

13、 无偏估计值:统计上,如果所有可能样本的某一统计数的平均数等于总体的相应参数,则称该统计数为总体相应参数的无偏估值。

14、 随机误差:完全是偶然的,找不出确切原因引起的误差,也称偶然性误差(spontaneous)。

15、 显著水平:用来推断无效假设否定与否的概率标准叫做显著水平。

16、 无效假设h0:实得差异由抽样误差造成的;

17、 备择假设ha:实得差异由总体参数不同造成的。

18、 局部控制:将整个试验环境或试验小区划分成若干个小环境或区组,在小环境或区组内使非处理因素尽可能一致,实现试验条件的局部一致性,这就是局部控制。

19、 中心极限定理:若随机变量χ服从平均数是μ,方差是σ2的分布(不是正态分布);χ1,χ2,…,n 是由此总体得来的随机样本,则统计数=σχn的概率分布,当n相当大时逼近正态分布n(μ,2/n)这就是中心极限定理。

20、 标准误:书本73页。 平均数抽样总体的标准差。

21、 决定系数和相关系数:书本165页。 r=∑(y-y)/∑y-y),x对y的决定系数,y为相关系数。 越大直接回归效果越好 r=spxy/(ssx*ssy)

22、 随机抽样:又称等概率抽样或概率抽样,指所有抽样单位都有同等机会(相同概率)被抽取进入样本的抽样方法。

23、 小概率原理:在统计学上,把小概率事件在一次试验中看成是实际不可能发生的事件称为小概率事件实际不可能性原理,也称为小概率原理。

24、 完全随机化试验: 完全随机设计是将各处理完全随机地分配给不同的试验单位,每一处理的重复次数可以相等也可以不相等。

25、 随机区组试验: 随机区组设计是随机完全区组设计的简称,先将整个试验地划分为若干个区组,区组数等于重复数,每个区组内土壤肥力等环境条件相对均匀一致,不同区组间允许有差异;然后将每个区组划分成若干小区,小区数等于处理数;再将全部处理独立随机安排在每一区组的各个小区上。

第三部分简答题(2*5)

1、简述田间试验设计的基本原则及其作用。

基本原则:(1)重复(replication)同一试验处理所设置的试验单位数---处理的重复数。

估计试验误差;降低试验误差

2) 随机排列(random assortment):一个区组中每一处理都有同等的机会设置在任何一个试验小区上,避免任何主观成见。 可以获得试验误差的无偏估计。

3)局部控制(local control)

将整个试验环境分成若干个相对最为一致的小环境,再在小环境内设置成套处理,即在田间分范围分地段地控制土壤差异等非处理因素,使之对各试验处理小区的影响达到最大程度的一致

田间试验设计的主要作用:

降低试验误差,提高试验的精确度,使研究人员能从试验结果中获得无偏的处理平均值以及试验误差的估计量,从而能进行正确而有效的比较。

2、标准误和标准差有何联系与区别?个体观察值之间变异的标准差叫标准差反映样本均数之间变异的标准差叫标准误作用差不多所反映的总体不同。

3、假设测验的两类错误是什么?怎样同时减少犯这两类错误的概率?p82。

选取适当的显著水平a和增加试验重复次数n来考虑。选取数值小的显著水平a值可以降低犯i类错误的概率。但同时增加了犯ii类型错误的概率。

所以显著水平a值的选用要同时考虑到犯两类错误的概率。大小。

4、反映变数离散性的特征数主要有哪些?如何定义的? 极差,标准差,变异系数(样本标准差与样本平均数的比值) cv=s/x(上面有一横)

5、反映变数集中性的特征数主要有哪些?如何定义的?算术平均数、中位数、众数、几何平均数、调和平均数。

6、描述间断性变数和连续性变数的理论分布有哪些?并分别写出他们的平均数和标准差。

7、一个变数的分布一般具有哪两大基本特征?反映这两大特征的特征数有哪些?举例说明。

8、判断“重复次数越多,试验误差越小”是否正确,并具体解释。

答:重复次数即每一处理的试验小区数,试验设置重复次数越多,试验误差越小。多于一定的重复次数,误差的减少很慢,精确度的增进不大,而人、物力的花费大大增加,并不经济。

重复次数的多少,一般应根据试验所要求的精确度、试验地土壤差异大小、试验材料如种子的数量、试验地面积、小区大小等而具体决定。

增加重复次数可以预期能比增大小区面积更有效地降低试验误差,从而提高精确度。

9、判断并解释“样本平均数差数的分布比平均数分布分散”的正误。

10、给出线性回归方程的f测验和t测验方法。

11、一个显著的r或b是否就意味着x和y的关系必为线性?为什么?

12、为什么说正态分布是最重要的连续性变数的理论分布?

1. 客观世界的确有许多现象的数据是服从正态分布的。

2. 在适当条件下,可以用来做二项分布及其他间断性/连续性类似分布的近似分布。这样就能用正态分布代替起来分布来计算概率而进行统计推论。

3. 虽然有些总体并不符合正态分布,但从总体中抽出的样本平均数及其他统计数的分布,在样本容量适当大时仍然趋近正态分布。因此可用来研究这些统计数的抽样分布。

13、简述制作次数分布表的基本步骤。

1. 数据排序(升序或降序)

2. 求极差(全距)(即数据中最大观察值与最小观察值的差数)

3. 确定组数、组距。

4. 选定组限和组中值。

5. 把原始资料的各个观察值按分组数列的各组组限归组。

6. 划统计数,作次数分布表。

14、什么叫无效假设?什么叫备择假设?设定两种假设的基本原则是什么?

基本原理是先对总体的特征作出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受作出推断。

15、简述t分布和u分布的异同?

16、为什么要进行变量转换?常用方法有哪些?

17、什么叫统计推断?统计推断的基本内容一般包括哪两个方面?其主要含义是什么?

18、什么是小概率原理?它在假设测验中有何作用?

答:在统计学上,把小概率事件在一次试验中看成是实际不可能发生的事件称为小概率事件实际不可能性原理,也称为小概率原理。

小概率事件实际不可能性原理是统计学上进行假设检验的基本依据。

19、方差分析的基本思想是什么?进行方差分析一般有哪些步骤?

基本步骤:(一)计算各项平方和与自由度;(二)列出方差分析表;(三)进行f检验。

四)若f检验显著,则进行多重比较。

20、多个平均数的测验能否使用u测验或t测验,为什么?

不能。t检验和u测验只能用来进行两个处理平均数的假设检验。不能多个。

因为,1.检验工作量大 2.无统一的试验误差,试验误差估计的精确度和检验的灵敏度低。

3.检验的i型错误概率大,推断的可靠性低。

21、一个试验资料采用哪一种多重比较方法的根据是什么?

一个试验资料,采用哪种多重比较方法,主要应根据否定一个正确的无效假设h0和接受一个不正确的无效假设h0的相对重要性而定。如果否定正确的h0(即犯α错误)是事关重大或后果严重的,应用 q 测验;这就是宁愿使犯β错误的风险较大而不使犯α错误有较大风险。如果接受不正确的h0(即β错误)是事关重大或后果严重的,则易采用 plsd 测验或 ssr 测验,这是宁愿冒较大的α错误的风险,而不愿冒较大的β错误的风险。

在一般的农业试验研究中,较为广泛应用的是 plsd 测验法和 ssr 测验法。

22、方差分析的基本假定有哪些?

1.每个总体都应该服从正态分布2.各个总体的方差必须相同 3. 观察值是独立的。

概率统计样卷

一 填空题 二 选择题 1.d 2.b 3.c 4.a 5.b 三 令事件a为 从乙袋中任取一球为白色 b1为 从甲袋中取二只白球放入乙袋中 b2为 从甲袋中取一只白球 一只黑球放入乙袋中 b3为 从甲袋中取二只黑球放入乙袋中 所以b1 b2 b3构成样本空间的一个完备事件组。1 由全概率公式有 2...

统计样卷答案

一 d,a,c,b,a,b,c,d,c,b,b,d,b,d,c 二 1 对身高进行描述性统计分析求出集中趋势 离散趋势指标和分布形态的指标,并且进行相关的说明。2 这题主要考得是频数分析中的交叉分析,每个空格中包含三个数字,一个是频数,一个是在行中所占比率,一个是在列中所占比率。得出结论主要看p值,...

统计学试卷 样卷

苏州大学统计学试卷 第0卷 共7页。考试形式闭卷 学院东吴商学院专业成绩。年级学号姓名日期 一 单项选择题 每题1分,共15分 1.反映和研究社会经济现象总体一般数量特征和数量关系的方法是 a 综合指标法b 统计分组法。c 归纳推断法d 统计模型法。2.下列选项中属于数量指标的是。a 每股净资产b ...