统计学期末试卷
谢颖
统计学原理期末考试模拟试题
一、填空(每小题2分,***10分)
1.表示单位属性特征的符号是_ _ _ _ _ _,表示单位数量特征的符号是_ _ _ _ _ _ _ _。
2.任何统计分布都必须满足_ _ _ _ _ _ _ _ _和_ _ _ _ _ _ _ _ _两个条件。
3.抽样估计是利用实际调查计算出的_ _ _ _ _ _ _ _ _来估计相应的_ _ _ _ _ _ _ _ _ _ _ _ _ _值。
4.在回归分析中,因变量是_ _ _ _ _ _ _ _ _ _变量,而自变量是_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _。
5.统计总指标的计算形式有_ _ _ _ _ _ _ _ _ _和_ _ _ _ _ _ _ _ _ _。
二、对或错(每道小题2分,***10分)
1.普查一般用于调查某一时间点的社会经济现象的数量,也不排除调查属于时期现象的项目。( )
2.在同一人群中,周期指数的值与周期的长短成正比,时间指数的值与时间间隔成反比。( )
3.在抽样推断中,和指标值是确定且唯一的,而样本指标值是随机变量。( )
4.抽样分数的特点是抽样分数越大,抽样平均误差越大。( )
5.在各种动态序列中,指标值受指标所反映的周期的制约。( )
三、选择题(每小题2分,***12分)
1.构成统计总体的个体事物称为()。
A.调查单位b .标记值c .质量单位d .总体单位
2.复合分组是()
A.两个或两个以上的总体以相同的符号堆叠和分组。
B.为要分组的群体选择一个复杂符号。
c、将从同一人群中选取的两个或两个以上的标志叠加分组。
d .选择两个或两个以上同一群体的标志,并将其并排分组。
3.总指标根据时间条件的不同分为()。
A.数量指标和质量指标b .时间指标和时间指标
C.总单位金额和总标志金额d .物理指标和价值指标
4.计算平均指数最常用的方法和最基本的形式是()。
A.中后卫人数b .模式c .算术平均d .调和平均
5.根据指数化指标的不同性质,统计指标可分为()。
A.总量指标和单项指标b .数量指标和质量指标
C.平均指数和平均指数d .综合指数和平均指数
6.在计算序时平均数时,“首尾一半法”适用于()
A.周期序列计算按时间顺序排列的平均值。等间隔时间序列计算按时间顺序排列的平均值。
c .计算不等间隔时间序列的时序平均值D .计算由两个时间序列组成的相对时间序列动态序列的时序平均值。
四、选择题(每小题2分,***8分)
1.数字分布序列()
A.它由两个因素组成:被某个符号分割成整体的组和每个组中的单元数。
B.它由组距和组数、组限和组中值组成。
c,包括质量分布系列和变量系列。
D.可以用图表的形式表达出来。
E.能证明整体结构和分布特征。
2.调查单位是()
A.要调查的人群
B.需要调查的整体单位的负责人
C.调查项目的承担者
D.负责报告调查结果的单位
E.调查对象包括的具体单位
3.抽样估计中的抽样误差()
A.是必然的。
b可以通过改进调查方法来消除。
c .可以提前计算。
D.调查完成后才能计算。
E.它的大小是可以控制的。
4.设产品单位成本(元)到产量(100件)的线性回归方程为yc=76-1.85x,即()。
a每生产100件,平均单位成本将减少1.85元。
b每生产100件,平均单位成本将减少1.85元。
C.产量和单位成本的变化方向相反。
D.产量和单位成本同向变化。
E.当产量为200件时,单位成本为72.3元。
动词 (verb的缩写)问答(每个小问题5分,***10分)
1.简述变异指数的概念和作用。
2.平均指数的基本含义和计算机形式是什么?
六、计算题(每道小题10分,***50分)
1.一个班40个学生的成绩(分数)是:
57 89 49 84 86 87 75 73 72 68 75 82 97 81
67 81 54 79 87 95 76 71 60 90 65 76 72 70
86 85 89 89 64 57 83 81 78 87 72 61
按照学校的规定,60分以下代表不及格,60-70分代表及格,70-80分代表中等,80-90分代表好,90-100分。
出于好意。要求:
(1)将本班学生分为不及格、及格、一般、良好、优秀五组,拟定一张频数分布表。
(2)标明分组标志和类型;分析一下这个班学生的考试情况。
2.某厂三个车间第一季度的产量如下:
车间计划完成百分比实际产量(件)单位产品成本(元\件)
第一车间90% 198 15
第二车间105% 315 10
第三车间110% 220 8
根据以上数据:
(1)第一季度三个车间产量平均计划完成百分比。
(2)第一季度三个车间的平均单位产品成本。
3.通过回归分析,某种作物的亩产量(y,单位“母丹”)与浇水量(x,单位“英寸”)的线性回归方程为YC = 2.82+1.56x..还知道变量X的方差是99.75,变量Y的方差是312.82。
要求:(1)浇水量为0时计算亩产量;
(2)浇水量每增加一寸,计算平均亩产量;
(3)计算浇水量与亩产量的相关数,分析相关程度和方向。
(要求公式和计算程序,结果保留到小数点后两位。)
4.某企业产品的单位成本为1988,比1987低2%,比1989低5%,比1990低3%,比1996554低3%。以1987为基期,计算该企业单位成本从1988到1991的总下降率和平均下降率。(要求写出公式和计算过程,结果保留小数点后四位。)
从一批零件中抽取200件进行检测,其中188件合格。
要求:(1)计算该批零件合格率的抽样平均误差;
(2)按照95.45% (t=2)的可靠度,间隔估计该批零件的合格率。
6.某企业产品的单位成本为1988,比1987低2%,比1989低5%,比1990低3%,比1996554低3%。以1987为基期,计算该企业单位成本从1988到1991的总下降率和平均下降率。(要求写出公式和计算过程,结果保留小数点后四位。)
7.从一批零件中抽取200件进行检测,其中188件合格。
要求:(1)计算该批零件合格率的抽样平均误差;
(2)按照95.45% (t=2)的可靠度,间隔估计该批零件的合格率。
北京信息科技大学《统计学》课程期末试卷(A卷)
北京信息科技大学
2007-2008学年第一学期
课程所在学院:经济管理学院适用专业课:注:0501502
考试形式:(闭卷)
一、选择题(此大题为* * 15小题,每个小题为1分,* * 15分)
每个问题所列的四个选项中,只有一个符合题目要求。请在题目后的括号内填写其代码。错选、多选或不选都不计分。
1.下列哪一项不属于一元回归中的基本假设(D)?
A.对于所有x,误差项的方差是相同的。
B.误差项服从正态分布。
C.误差项是相互独立的
D.
2.当一组数据分布的偏度系数为负时,数据的众数、中位数、均值之间的关系为(A)。
A.多数>;中位数>平均值/均值
B.平均值>;中位数>模式
C.中位数>;多数>;平均值/均值
D.中位数>;平均值>模式
3.一元回归方程为y = 11.64-0.25x,则下列说法正确的是(c)。
A.自变量平均增加1个单位,因变量平均减少0.25个单位。
B.自变量和因变量之间存在正相关关系。
C.
D.
4.如果有两组数列A和B,那么(A)数列的平均数具有很强的代表性。
A.1 < 2 1 > 2,数列B的平均值的代表性高。
B.1 < 2 1 > 2,B系列平均值的代表性较低。
C.1 = 2 1 > 2,则数列A的平均值的表示高。
D.1 = 2 1 < 2,A系列平均值的代表性较低。
5.如果连续变量序列的最后一组是开组,下限为500,相邻组的组中值为480,那么最后一组的组中值为(a)。
520 B.510 C.500 D.540
6.不受极端变量值影响的平均值是(d)。
A.算术平均值b .调和平均值
C.几何平均d .模式
7.有20名工人看管机器,数量如下:2,5,4,4,3,4,2,2,4,3,4,6,3,4,5,2,4。如果根据上述数据编制频率分布序列,应采用(a)。
A.单项分组b .等距分组c .不等分组d .以上分组均可。
8.如果没有季节变化,季节比应该是(b)。
A.0b.1 C .大于1 D .小于1
9.如果一个定性变量有M个类别,则有必要引入(c)个虚拟变量。
上午下午+1
C.m-1 d .无法判断。
10.第一组工人平均工龄为5年,第二组为7年,第三组为10年。第一组工人人数占总数的20%,第二组占60%,所以三组工人的平均工龄为(b)。
A.8年B.7.2年C.5年D.7.8年
11.某企业2007年各种产品的产量比2006年增加了8%,总生产成本增加了12%,故该厂2007年的单位成本为(D)
A.下降0.62%;b .增长0.62%。
C.它减少了3.7%,而d .它增加了3.7%。
12.相关系数r和斜率b2 (A)的符号。
A.相同b .不同
C.无法判断
13.据知,小姜买入的两只股票的综合价格指数上涨了24点。该股今日平均收盘价为14元,前天平均收盘价为(C)。
10.64
C.11.29d .无法计算。
14.如果今年的增长率与去年相比是112%,去年的增长率与前年相比是3%,那么今年的平均增长率就是(D)。
A.9.0% B.7.4%
C.7.5% D.15.4%
15.已知1%本年增加的绝对值为0.54,去年比上年增加的绝对值为5,则去年比上年的增长率为(c)。
9.3%和8.7%
C.10.2% D .无法计算。
二、选择题(每小题2分,***16分)
每个问题都列出了几个符合题目要求的选项。请将正确选项前的字母放在题目后的括号内。多选、少选、错选都是没有分数的。
1.下列变量是离散变量。
A.库存产品数量b .流动资产对流动负债的比率
C.货物总重量d .按个人计量的货物数量
E.收费公路的交通量f .出席公司年会
2.指出以下数据收集属于通过实验收集数据的方法(A B E)
A.培训机票代理人的新方法与传统方法的比较
通过让两组可比较的孩子用两种不同的组装说明组装玩具来比较两种组装说明。
一份产品评估杂志给它的订户邮寄了一份问卷,要求他们对最近购买的产品进行排名。
在购物中心采访顾客,问他们为什么在那里购物。
e通过在两个可比较的地区采用不同的方法来比较两种不同的养老金促进方法。
3.下列关于群极限的表述哪一个是正确的(A B D)。
A.根据员工人数,相邻组的组界限可以重叠,也可以不连续。
b员工按薪金分组,他们的组限额必须重叠。
C.学生按成绩分组,分组限制必须中断。
D.人是按照身高分组的,他们的分组界限一定是重叠的。
4.下列属于质量指数的有(A B D E)。
A.价格指数b .单位成本指数
C.销售量指数d .工资水平指数
E.劳动生产率指数
5.具体来说,如果下列(A B C)发生,这意味着多重* * *线性可能存在于多重回归模型中。
A.模型中的独立变量对之间存在显著的相关性。
B.线性关系显著,但回归系数的t检验不显著。
C.回归系数的符号与预期相反。
D.
6.算术平均数具有下列哪个性质(B C)?
A.(x-) =最小值B. (x-) = 0
C.(x-) 2 =最小D. (x-) 2 = 0
E.(X- )=1
7.在频率分布系列中。
A.总次数是一定的,频率和频率成反比。b .每组频率之和等于100。
C.每组频率大于0,频率之和等于1 d,频率越小,这组值的作用越小。
E.频率表示每组变量值对总体的相对影响。
8.标准偏差。
A.表示总体单位标志值的一般水平b .反映总体单位的一般水平
C.反映整体单位标志值的分散程度d .反映整体分布的集中趋势
E.反映整体分布趋势。
三、简答题(本大题***2题,每题5分,***10分)
1.年化增长率是多少?有什么用?
2.数值型数据的分组方法有哪些?简述组间距分组的步骤。
(1)可分为单变量值分组和组间距分组两种分组方式。
单变量值分组:以一个变量值为一组;适用于离散变量;适用于变量值很少的情况(+1)
组间距分组:以一个变量值的区间为一组;适用于连续变量;适用于变量值较多的情况;需要遵循“不重不漏”的原则;可以使用等长分组或不等长分组。(+1)
(2) A .确定组数:
(+1)
b确定组距:类宽是一个组的上限和下限之差,可以根据所有数据的最大值和最小值以及划分的组数(+1)来确定。
c .统计每组的频率,并将其排列成频率分布表。(+1)
四。是非题(这个大题是***5个小题,每个小题是1分,还有***5分)
1.当相关系数为+1时,两个变量完全相关,当相关系数为-1时,两个变量不相关。(错误)
2.如果各种商品价格平均上涨5%,销量平均下降5%,销售指数不变。(错误)
3.连续变量和离散变量按组间距分组时,可通过相邻组的组间距重叠来确定组限。(右)
4.根据建立的线性回归方程,我们无法判断两个变量之间的相关程度的紧密程度。(右)
5.设p代表单位成本,q代表产量,那么∑p1q1—∑p0q1代表产品单位成本的变化对总产出的影响。(错误)
四、计算分析题(***54分)
1.将邮局中出境包裹样品的重量近似为盎司:21,18,30,12,14,17,28,10,16。计算这组数据的均值、中位数、众数、极差和四分位区间,从偏度的角度描述数据的分布形态(10分)。
2.表1列出了学生在为期三周的商业统计课程中的课外学习时间以及课程结束时他们的考试成绩的样本数据如下:
表1学生课外学习时间及考试成绩统计表
学生样本1 2 3 4 5 6 7 8
学习时间,X 20 16 34 23 27 32 18 22
测试分数,Y 64 61 84 70 88 92 72 77
用EXCEL回归,结果如下:(***15分)
汇总输出
回归统计
倍数R 0.862109
r平方0.743232
调整后的R平方0.700437
标准误差6.157605
观察值8
方差分析
显著性F
回归分析+0 658 . 586868868686
剩余6 227.4966 37.438+01
共计7 886人
系数标准误差t统计P值
截距40.08163265 8.889551 4.50884785 0.0065471
x变量1 1.496598639 0.359119 4.16741915 0.005895457
分析并回答下列问题:
(1)学习时间与考试成绩的相关系数是多少,考试成绩的恶化有多少是学习时间的变化造成的?86.21% 74.32%
(2)根据EXCEL回归输出的结果,写出估计的回归方程,说明回归系数的实际意义。
(3)检验线性关系的显著性。
(4)根据标准化残差图,判断关于随机误差项正态分布的假设是否成立。
标准化残差分布在-2和2之间,所以随机误差项服从正态分布的假设成立。
3.随机抽取15大型商场销售的同类产品相关数据(单位:元),用EXCEL对结果进行回归。下表显示结果:(***15分)。
汇总输出
回归统计
倍数R 0.593684
r平方0.35246
调整后的R平方0.244537
标准误差69.75121
观察值15
方差分析
显著性F
回归分析231778.654338+0515 5438366
剩余12 58382.78 4865.232
总计14 90160.93
系数标准误差t统计P值
截距375.6018288 339.410562 1.10662976 0.290145025
x变量1 0.537840951 0.21044674 2.5571054 0.02519961
x变量2 1.457193542 0.667706586 2.18238606 0.049681066
相关系数矩阵
Y X1 X2
Y 1
X1 0.308952067 1
X2 0.001214062 0.8528576 1
注:X变量1为买入价/元。
x变量2是销售费用/元。
因变量y为销售价格/元。
(1)指出Y和X1以及Y和X2之间的相关系数。有没有证据证明进价、售价、销售费用之间存在线性关系?0.3089 0.0012没有,因为相关系数小。
(2)根据申诉结果,你认为用进价和销售费用来预测有用吗?无效的
(3)根据EXCEL回归输出的结果,写出估计的回归方程,检验线性关系是否显著()。不显著
(4)解释决定系数R2。结论与问题(2)一致吗?R2=35.25%。在销售价格的总变异中,用估计回归方程解释的比例为35.25%,两者是一致的。(+3)
(5)x 1与X2的相关系数是多少?这是什么意思?高度相关
(6)模型中是否存在多重* * *线性?对模型有什么特别的建议吗?可能有多个* * *线性;进一步检验是否存在多重* * *线性,检验X1与X2的样本相关系数的显著性(rx1x2=-0.8529)。如果显著,则可以确定存在多重* * *线性。(+2)
对模型的建议:根据研究目的,删除相对次要的解释变量。(+1)
4.以下某公司生产的三种产品的数据如下表所示(***14分):
商品单价计量单位销售量(万元)
2005, 2006, 2005, 2006
一公斤400 480 0.8 0.82
b吨80 88 1.15 1.05
C部分50 60 1.20 1.38
(1)计算三种产品的销售指数;
(2)计算三种产品的销售指数;
(3)计算三种产品的单价指数;
(4)计算分析产量和单价变化对销售影响的相对数和绝对数。
北京信息科技大学
2007-2008学年第一学期
统计学期末考试试卷标准答案(A卷)
一、选择题(此大题为* * 15小题,每个小题为1分,* * 15分)
每个问题所列的四个选项中,只有一个符合题目要求。请在题目后的括号内填写其代码。错选、多选或不选都不计分。
1.(一)2。(一)3。(C) 4。(A) 5。(四)
6.第七条第一款第八项第二款第九项。(C) 10。(二)
11.12。(A) 13。(C) 14。15。(三)
二、选择题(每小题2分,***16分)
每个问题所列的五个选项中,有两到五个符合题目要求。请将正确选项前的字母放在题目后的括号内。多选、少选、错选都是没有分数的。
1.(ADEF)。(安倍)3。(ABD ) 4。(阿卜杜勒)5。(美国广播公司)
6.(公元前)7年。(CDE)。(CE)
三、简答题(本大题***2题,每题5分,***10分)
1.年化增长率是多少?有什么用?
(1)当增长率用年表示时,称为年化增长率或年率,(+2)
其计算公式为:
m是一年中的周期数;n是跨度的总数。
季度增长率年化时,m = 4。
月增长率年化时,m = 12。
当m = n时,上式为年增长率(+2)。
(2)可以将月度增长率或季度增长率转换为年度增长率,以实现增长率之间的可比性。(+1)
2.数值型数据的分组方法有哪些?简述组间距分组的步骤。
(1)可分为单变量值分组和组距分组两种分组方式。
单变量值分组:以一个变量值为一组;适用于离散变量;适用于变量值很少的情况(+1)
组间距分组:以一个变量值的区间为一组;适用于连续变量;适用于变量值较多的情况;需要遵循“不重不漏”的原则;可以使用等长分组或不等长分组。(+1)
(2) A .确定组数:
(+1)
b确定组距:类宽是一个组的上限和下限之差,可以根据所有数据的最大值和最小值以及划分的组数(+1)来确定。
c .统计每组的频率,并将其排列成频率分布表。(+1)
四。是非题(这个大题是***5个小题,每个小题是1分,还有***5分)
1.当相关系数为+1时,两个变量完全相关,当相关系数为-1时,两个变量不相关。(×)
2.如果各种商品价格平均上涨5%,销量平均下降5%,销售指数不变。(×)
3.连续变量和离散变量按组间距分组时,可通过相邻组的组间距重叠来确定组限。(√)
4.根据建立的线性回归方程,我们无法判断两个变量之间的相关程度的紧密程度。(√)
5.设p代表单位成本,q代表产量,那么∑p1q1—∑p0q1代表产品单位成本的变化对总产出的影响。(×)
动词 (verb的缩写)计算与分析题(***55分)
中位数位置:(10+1)/2=5.5。
中位数
从偏度的角度描述数据的分布形态:均值>中位数,正(右)偏。
(+2)
2.(1)学习时间与考试成绩的相关系数是多少,考试成绩的恶化有多少是学习时间的变化造成的?
r=0.862109,(+1)
R2=0.743232,而74.3232%的考试成绩的恶化是由学习时间的变化引起的。(+2)
(2)根据EXCEL回归输出的结果,写出估计的回归方程,说明回归系数的实际意义。
(+3)
回归系数的含义是学习时间每增加一小时,平均考试成绩增加1.497分。(+2)
(3)检验线性关系的显著性
显著性F = 0.005895457÷5%
线性关系是重要的。(+3)
(4)根据标准化残差图判断随机误差项服从正态分布的假设是否成立。
标准化残差分布在-2和2之间,所以随机误差项服从正态分布的假设成立。(+4)
3.(1)指出Y和X1以及Y和X2之间的相关系数。有没有证据证明进价、售价、销售费用之间存在线性关系?
(1)ryxi = 0.308952067 ry x2 = 0.001214062,
没有证据。(+2)
(2)根据以上结果,你认为用进价和销售费用来预测有用吗?
没用(+2)
(3)根据EXCEL回归输出的结果,写出估计的回归方程,检验线性关系是否显著()。
显著性F = 0.073722 & gt=5%
线性关系并不显著。(+3)
(4)解释决定系数R2,看看结论是否与问题(2)一致。
R2=35.25%。在销售价格的总变异中,用估计回归方程解释的比例为35.25%,两者是一致的。(+3)
(5)x 1与X2的相关系数是多少?这是什么意思?
Rx1x2=-0.8529,高度相关(+2)。
(6)模型中是否存在多重* * *线性?对模型有什么特别的建议吗?
可能有多个* * *线性;进一步检验是否存在多重* * *线性,检验X1与X2的样本相关系数的显著性(rx1x2=-0.8529)。如果显著,则可以确定存在多重* * *线性。(+2)
对模型的建议:根据研究目的,删除相对次要的解释变量。(+1)
4.(1)三款产品销售指数;(+3)
三个产品的销售指数=∑q1p1/∑q0p0。
=568.8/472=120.51%
∑q 1p 1-∑q0p 0 = = 568.8-472 = 96.8万元。
(2)三种产品的销售指标;(+3)
Iq=∑q1p01/∑q0p0
=557.2/472=118.05%
∑q1p0-∑q0p0
= 557.2-472 = 85.2万元
(三)三种产品的价格指数;(+3)
IP =∑q 1p 1/∑q 1p 0
=568.8/557.2=1.0208=12.08%
∑q1p1-∑q1p0
=568.8-557.2=11.6万元
(4)分析产量和单价变化对销售影响的相对数和绝对数。(+5)
120.51%=118.05%*102.08% (+3)
96.8万元= 85.2万元+11.6万元(+2)