2019统计学重点

发布 2024-01-07 19:50:10 阅读 5171

统计学复习重点。

一.名词解释

1) 英汉翻译 (名词含义要掌握)

众数(mode) 中位数(median) 四分位(quartile) 均值(mean)峰态(kurtosis)

偏态(skewness) 几何平均(geometric mean) 统计学(sartistics) 截面数据(cross-sectional data)

时间数据(times series data) 总体(population) 样本(sample) 分类变量(rank variable)

頻数(frequency) 列联表(contingency table) 饼图(pie chart)茎叶图(stem-and-leaf-piot)

直方图(histogram) 移动平均法(moving **erage) 指数平滑法(exponential smoothing)

回归模型(regression model) 拟合优度(goodness of fit) 线性趋势(linear trend) 自相关(autocorrtion)

偏自相关(partial autocorrtion)

2) 名词解释(名词的科学定义)

四分位差:也称内距或四分间距,它是上四分位数和下四分位数之差(83)

四分位数:也称四分位点,它是一组数据排序后处于25%和75%位置上的值(77)

众数:一组数据**现次数最多的变量值。

茎叶图:由“茎”和“叶”两部分构成,其图形是由数字组成的,以该组数据的高位数值作树茎,低位数字作树叶,树叶上只保留最后一位数字。

移动平均法:通过对时间序列逐期递移求得平均数作为趋势值或**值的一种**方法(336)

相关系数:是根据样本数据计算的度量两个变量之间线性关系强度的统计量,记为r。(270)

指数平滑法:是通过对过去的观察值加权平均进行**的一种方法(337)

季节指数:刻画了序列在一个年度内各月或各季度的典型季节特征(351)

假设检验:利用样本信息,对提出的命题进行检验的一套程序和方法。

多重共线性:当回归模型中两个或两个以上的自变量彼此相关时,则称回归模型中存在多重共线性(308)

最小二乘法:276

均方误差:标准误差定义为各测量值误差的平方和的平均值的平方根,故又称为均方误差(?)

自相关系数:自相关(autocorrelation)是时间序列各观测值之间的相关。

白噪声序列:对于一个纯随机过程来说,若其期望和方差均为常数,则称之为白噪声过程。白噪声过程的样本实称成为白噪声序列,简称白噪声(?)

ar模型:自回归(autoregression)模型,简称ar模型,是利用观测值yt与以前时期的观测值之间的关系来**值y的一种多元回归方法。

ma模型:移动平均(moving **erage)模型,简称ma模型,是利用观测值yt作为因变量,**yt时产生的**误差作为自变量。

平稳序列:指基本上不存在趋势的序列。

二.简答题

1)什么是统计学?

收集、处理、分析、解释数据并从数据中得出结论的科学,统计学是一门科学,是一种技术,是一门艺术。

2)统计数据可分为哪几种类型,不同类型数据各有什么特点?

分类数据:只能归于某一列别的非数字型数据,它是对事物进行分类的结果,数据变现为类别,是用文字来表述的。

顺序数据:只能归于某一有序类别的非数字型数据。顺序数据虽然也是类别,但这些类别是有序的。

数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。

3)总体、样本、参数、统计量、随机变量内容及关系?

4)一组数据的分布特征可以从哪几个方面进行测度。

数据分布特征可以从三个方面进行测度和描述:一是分布的集中趋势,反映各数据向其中心值靠拢或者集中的程度;二是分布的离散程度,反映各数据远离其中心值的趋势;三是分布的形状,反映数据分布的偏态和峰态。

5)鉴别图表优劣的准则有哪些?

一张好的图形应当:

1精心设计,有助于洞察问题的实质。

2使复杂的观点得到简明、确切、高效的阐述。

3能在最短的时间内,以最少的笔墨给读者提供最大量的信息。

4是多维的。

5表述数据的真实情况。

6)excel的数据透视表用途?

数据透视表是交互式报表,可快速合并和比较大量数据。可旋转其行和列以看到数据源不同汇总,而且可显示感兴趣区域的明细数据。

7)解释描述统计和推断统计。

描述统计:研究数据收集、整理和描述的统计学方法

推断统计:研究如何利用样本数据来推断总体特征的统计学方法。

8)简述众数、中位数和平均数的特点及应用场合。

众数是一组数据分布的峰值不受极端值的影响缺点是具有不唯一性。众数只有在数据量较多时才有意义数据量较少时不宜使用。主要适合作为分类数据的集中趋势测度值。

中位数是一组数据中间位置上的代表值不受极端值的影响。当数据的分布偏斜较大时使用中位数也许不错。主要适合作为顺序数据的集中趋势测度值。

平均数对数值型数据计算的而且利用了全部数据信息在实际应用中最广泛。当数据呈对称分布或近似对称分布时****值相等或相近此时应选择平均数。但平均数易受极端值的影响对于偏态分布的数据平均数的代表性较差此时应考虑中位数或众数。

9)简述参数最小二乘估计的基本原理。

使因变量的观察值与估计值之间的误差平方和达到最小来求得和的方法。即。

用最小二乘法拟合的直线来代表x与y之间的关系与实际数据的误差比其他任何直线都小。

10)如何做回归分析显著性检验(f检验 , t检验的用途)

t检验是对单个变量系数的显著性检验。

f检验是对整个模型的拟合优度检验,即所有变量对被解释变量的显著性检验。

11)假设检验中容易出现哪几类错误?

第ⅰ类错误:错误,原假设为正确时拒绝原假设。

第ⅱ类错误:错误,原假设为错误时未拒绝原假设。

12)多元回归显著性检验方差分析表的原假设是什么。

13)简述时间序列的构成要素。

时间序列可以分为平稳序列与非平稳序列,非平稳序列包含有趋势性、季节性和周期性,因此可将时间序列变化分解为长期趋势,季节变动,周期变动和不规则变动四个因素。长期趋势反映了现象在较长时间内的发展方向,持续向上或向下的态势;季节变动表现为以一年为周期的规则变动;周期变动是围绕长期趋势的一种起伏波动;不规则变动则是随机性,偶然性变动。

14)自相关与偏自相关系数用来测度什么。

自相关系数用来测度时间序列各观测值之间的相关程度;偏自相关系数用来测度其他滞后变量不变时,yt与y t-k相关程度。

15)如何正确选择ar模型与ma模型?

自回归(autoregression)模型,简称ar模型,是利用观测值yt与以前时期的观测值之间的关系来**值y的一种多元回归方法。

ar模型意味着时间序列的任意一个观测值都是由以前的p个观测值的线性组合加上随机误差et

通常的办法是观察时间序列的自相关图和偏自相关图。

ar序列的自相关图和偏自相关图具有的典型特征:自相关图单调递减逐步降为0或交替递减逐步降为0,而它的偏自相关图则具有明显的峰值。

移动平均(moving **erage)模型,简称ma模型,是利用观测值yt作为因变量,**yt时产生的**误差作为自变量。

ma模型意为着时间序列的任意一个观测值都是由目前的和以前的q个随机误差的线性组合。

通常的办法仍然是观察时间序列的自相关图和偏自相关图

自相关图则具有明显的峰值,而它的偏自相关图单调递减逐步降为0或交替递减逐步降为0,三.计算题类型。

1)第一大题名词中涉及计算方面。

2)列联表计算。

3)完成方差分析表。

4)绘制条形图、怕累托图、饼图、蜘蛛图。

5)移动平均,简单指数平滑计算。

6)对本学期学过的统计内容由计算机计算后输出结果做分析。

计算题:众数、中位数、四分位数、方差、平均值,标准差、极差、相关系数 (分出考两题计算题。

2 分类数据第六章的分类变量 10分。

3、spss软件参数的最小二乘估计 15分。

1、求众数、中位数、四分位数、方差、平均值,标准差、极差、相关系数

10人5月销售的的汽车数为。

众数:中位数:

四分位:法一:(根据定义法):

平均数:极差:

方差:标注差:

2、列联表计算。

一家电脑配件**商声称,他所提供的配件100个中拥有次品的个数及概率如下表。求该**商次品数的数学期望和标准差。

3 移动平均,简单指数平滑计算。

下表数据是某商品15个月的销售额(单位:万元)

1)用5期移动平均法**第16周的销售额。

2)才要指数平滑法,用平滑系数a=0.3**第16周的销售额。

4、绘制条形图、怕累托图、饼图、蜘蛛图(

1)绘制条形图、怕累托图、饼图、蜘蛛图。

5、对本学期学过的统计内容由计算机计算后输出结果做分析(看着办,不会的话,尽量多写点)

6)完成方差分析表(一般不大会考)

补:某信息咨询公司受委托调查了解顾客对甲、乙、丙三种品牌矿泉水的喜好程度,随机观察了150名购买者的购买情况,并作如下统计。(看看就好)

问顾客对这三种品牌矿泉水的喜好是否存有差异?

解本题是一维三项概率分布。

令p1、p2、p3分别表示顾客喜好甲、乙、丙品牌的比例,若顾客对这三种品牌矿泉水的喜好没有差异,则意味着顾客中喜好每种品牌的概率均为1/3,因此,可作假设

计算题一般逃不出这几道题了,,计算过程自己去算一遍,就不写出来了,会更有效果)

2019统计学重点

统计学复习重点。一 名词解释 1 英汉翻译 名词含义要掌握 众数 mode 中位数 median 四分位 quartile 均值 mean 峰态 kurtosis 偏态 skewness 几何平均 geometric mean 统计学 sartistics 截面数据 cross sectional ...

2019统计学试卷

2010 2011学年第二学期武汉大学经济与管理学院。统计学 开卷。学号姓名学院专业分数 一 简答题 6选5,每小题4分,共20分 1 分析假设检验中包含的基本思想。2 如何理解权数的意义?在什么情况下,应用简单算术平均数和加权算术平均数计算的结果是一致的?3 方差分析的适用条件及基本假定。4 多元...

统计学试卷A 2019

青岛大学课程考试试卷。2009 2010学年春季学期考试时间 120分钟。课程名称统计学 a卷 b卷 注意事项 答卷前,考生务必把答题纸上密封线内各项内容填写清楚并且填写在密封线与装订线之间 学号应与教务 中学号相同 否则可能得不到成绩。答案必须写在边框内。一 公式默写 每小题5分,共20分 拉氏数...