2、1 指出下列哪些是不合法的变量名?为什么?
a、 Educl2yr b、 &ab345 c、 fund_$ d、 my_ e、 With-1 f、 Student's g、 My age h、 论文数量 i、 grade02
2、2 为下列变量指定其类型、测度水平,并为适合定义值标签的变量定义相应的值标签 a、 公交公司年载客量 h、 每天上网的小时数 c、 某市的行政区划 d、 某地每日的平均气温
e、 对待电视节目中武打片的态度 f、 10~11时内到汽车站候车人数 g、 血液中白细胞数量 h、 库存物资种类 l、 某市日啤酒消耗量 i、 运动会比赛项目
2、3 搜集数据,建立一个数据文件记录你所在班级学生下列情况:学号、姓名、年龄、籍贯、民族、家庭电话号码、出生年月日、评定成绩等级(优、良、中、可、差)等,给出正确的变量名、变量类型、标签及值标签、测度水平。
2、4 试对一个数据文件的部分变量和全部变量作转置练习,指出: (1)在转置后的文件中,系统产生的新变量有何特征? (2)文件转置后原来文件中的变量的哪些信息将会丢失?
2、5 下面的表,分别为某企业1991年~1995年5年中各季度计划完成和实际完成的产量(单位:万吨)数据资料,试建立一个SPSS数据文件保存这两个表中的数据。 年份 1991 1992 1993 1994 1995 一季度 计划数 14 17 16 18 20 实际数 12.5 17.2 16.5 18.4 20.5 18 18 20 20 21 二季度 计划数 实际数 21.4 19.8 16.8 19.2 25.8 18 17 18 20 25 三季度 计划数 实际数 18.5 19.2 17.7 20.5 22.5 四季度 计划数 20 20 21 22 25 实际数 20.4 22.5 19.6 20.8 24.5 然后对建立的数据文件调用Aggregate命令分别按季度、年汇总各季度和各年度的计 划产量和实际完成的产量、平均产量。
2、6 某地区农科所为了研究该地区种植的两个小麦品种“中麦9号”、 “豫展1号”产量的差异,从该地区的两个村庄各选5块田地,分别种植两个品种小麦,使用相同的田间管理,收获后,测得各个地块生产的小麦的千粒重(g)数据资料如下表。 id 1 2 3 4 5 甲村 中麦9号 43.11 42.15 37.59 38.23 40.19 豫展1号 48.91 45.63 41.59 44.23 37.43 id 6 7 8 9 10 乙村 中麦9号 43.87 36.71 43.59 40.83 42.51 豫展1号 44.75 45.67 43.15 46.71 39.55 为了使用Data—Aggregate命令,分别按照“小麦品种”和“村”对小麦的千粒重(g)进行分类汇总,试定义有关变量,并建立数据文件,完成分类汇总工作。
1
2、7 某地20家企业的情况如下: 编号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 部门 工业 交通 商业 交通 工业 工业 邮电通讯 商业 交通 工业 工业 交通 工业 工业 商业 邮电通讯 工业 工业 商业 交通 所有制类型 国有 国有 集体 个体 集体 国有 国有 个体 个体 国有 集体 个体 国有 集体 股份制 国有 国有 股份制 国有 国有 年产值(万元) 职工人数(人) 年工资总额(万元) 2805.58 1265.40 256.50 26.88 560.00 800.50 2580.98 125.45 590.60 950.00 1556.00 950.00 335.00 2455.08 1780.58 2500.00 775.00 3305.00 498.08 965.58 1235 605 105 20 223 568 890 65 148 325 485 354 105 680 646 485 354 1015 202 246 812.63 435.60 68.58 14.00 156.07 256.74 854.40 65.16 130.24 268.13 394.20 257.90 82.43 639.20 471.25 486.98 272.58 912.00 139.20 159.95 根据上述资料建立数据文件,并完成下列统计整理工作,并回答有关问题: (1)调用Sort Cases命令分别对年产值、职工人数和年工资总额进行排序。许多SPSS文件中都定义一个表示观测量序号的id变量,按照自己的体会指出这个id变量的作用。 (2)调用Aggregate命令分别按部门和所有制类型作分类汇总。
(3)首先调用Sort Cases命令分别按部门:按所有制类型;按部门和所有制类型进行排序。再执行Analyze → Descriptives Statistics → Descriptives,对年产值、职工人数和年工资总额进行描述。
(4)首先调用Split File命令分别按部门和所有制类型将文件分组,再重复(3)的操作,比较二者的差异。
2、8 针对一个数据文件(如对习题2、6建立的数据文件)作选择观测量练习,并回答下列问题:
(1)选择随机抽样方法,抽取约30%的观测量作为样本,将此执行两次,所得到的样本是否相同? (2)将随机选择的部分观测量能否作为样本加以保存?下一次打开这个文件要使用上次选择的随机样本作统计分析,应执行何种操作?
2、9 下表列出3个民族的血型分布数据,为了统计各个民族和各种血型的人数,选择合适的结构将此组输入到SPSS数据窗口建立数据文件。 (提示:定义人数为权变量)
2
血型 人数 A B O AB 民族 傣族 佤族 土家族 112 150 205 40 200 112 135 73 362 219 310 69
2、10 下表是某大学一个系的学生按照年级、性别和年龄复合分组的人数的资料。 年龄分组 17~19 20~22 22~25 25以上 一年级 男 85 20 1 0 女 54 8 1 0 男 48 28 11 1 二年级 女 28 10 2 0 男 0 30 49 1 三年级 女 0 15 23 2 四年级 男 0 18 66 1 女 0 6 34 1 为了解全系学生各个年级、不同性别和年龄段人数的分布,计算全系学生的平均年龄等统计量,研究如何定义一个恰当的SPSS数据文件,以便完成这个统计任务。 (提示:例如,可以选择如下一种方法,定义4个数值型变量:
grade:年级,取值为1,2,3,4分别代表4个年级;sex:性别,取值为1,2分别代 表男性和女性;age:年龄,取各组组中值18,21,24,26分别代表4个年龄段;numbers: 人数,并定义此变量为加权变量,但需注意输入数据时,凡年龄段人数为0者皆莫输入。)
第3章 习 题
3、1 修改下列命令语句的语法错误: total = partl + part2 + part3 .
Compute salaryl = base * 1.25 + award – tax . /salary2 = base + award - tax .
if (math >= 90) Compute grade = 1 .
3、2 在Compute对话框中,假定定义目标变量是一个字符型变量,表达式框中输入字符串表达式,单击Paste按钮,在Syntax窗口中,观察对应的Compute命令语句和IF命令语句的格式。
3、3 设数据文件中定义了一个变量x,变量值为0,1,…,90,试应用SPSS的Compute功能输出一个0°~ 90°角的正弦、余弦、正切和余切的函数值表。
3、4 试给出用SPSS输出自变量x值为0.1,0.2,…,10的指数函数e x和log(x)值表的操作过程。 3、5 假定下列表达式中的自变量皆为SPSS数据文件中已定义的变量,试将它们写成SPSS表达式:
bb24ac3x,(a0,b24ac0)(1)|2xcosysinz| ;(2) ;(3)
2y2a11ex
3
3、6 设离散型随机变量X服从参数 n =10,p = 0.85的二项分布,试利用SPSS的二项累积分布函数CDE.BINOM(q,n,p)计算X的概率分布。并计算随机变量X的数学期望和方差。
3、7 设100件产品中有10件次品,从中随机地抽出15件,求其中的次品数X的分布律。并计算随机变量X的数学期望和方差。
(提示:使用SPSS的超几何分布函数CDE.HYPER(X,total,sample,hits),其中total为产品总数,sample为抽取的样本数,hits为全部产品中的次品数,X的取值为0,1,2,…,10)。
3、8 利用SPSS的Compute功能或编写程序,对α = 0.1,0.05,0.025,0.01,0.005: (1)调用标准正态分布的逆分布函数PROBIT(prob),输出一张的标准正态分布的上侧α分位点表,即P{Xz}。
(2)调用T分布的逆分布函数IDE.T(p,df),输出一张自由度从1 ~ 45的T分布的上侧α分位点表,即P{t(n)t(n)}。
类似地调用分布和F分布的逆分布函数,输出卡方分布和F分布的上侧α分位点表。 3、9 如下图(局部)所示的文件中记录了某公司职工workage(工龄)、wage(月基本工资)、dutyday(出勤天数)、w_e_fee(应扣水电费)等项数据的资料,公司财务规定,工资按照下列原则发放: 1 2 3 4 id 1 2 3 4 name 陆 玲 张玉林 孙兰平 郭东立 sex 女 男 男 男 branch 办公室 计划处 财务处 总务处 workage 25 28 12 22 wage 585.00 697.45 429.65 526.50 dutyday 22 19 19 21 w_e_fee 30.60 47.40 34.00 35.09 2 (1)出满勤22天或以上者,按照“日基本工资×出勤天数+工龄×1.8-应扣水电费”计算; (2)出勤15天或以上,20天以下者,按照“日基本工资×出勤天数+工龄×1.2-应扣水电费”计算;
(3)出勤15天以下者,按照“日基本工资×出勤天数+工龄-应扣水电费”计算。 其中“日基本工资=月基本工资/22.5”,试编写一个计算输出职工当月实发工资的SPSS语法程序。
3、10某厂产品和成本资料如下表: 产量 产品 A B C D E 计量单位 件 只 米 公斤 吨 基期 1005 400 800 2500 85 报告期 1100 500 750 2650 80 单位成本 基期 10.00 9.50 8.20 4.20 585.00 报告期 9.50 10.50 7.80 4.00 560.00 试计算该厂产品的产量指数、单位成本指数以及总成本指数。
4
3、11 设有某地区1978年—1990年粮食总产量(万吨)、蔬菜总产量(万吨)、年末总人口数(万人)、国民生产总值(亿元)等经济指标的历史资料,如下表所示。
定义变量year、food、veg、popul、GDP代表各项指标,建立数据文件,并使用SPSS的Compute命令计算:
(1)人均粮食产量、人均蔬菜产量、人均国民生产总值; (2)表列各项指标的环比发展速度、定基发展速度;
(3)表列各项指标的环比增长量、定基增长量。或者调用SPSS的Create Time Series(产生时间序列)命令,选用一阶变差计算环比增长量、定基增长量。 年份 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 粮食总产量 蔬菜总产量 年末总人口 国民生产总值 81.55 85.58 89.88 98.46 97.06 103.50 105.35 112.22 118.98 118.46 125.56 125.85 131.25 307.45 350.56 388.45 393.88 423.02 429.00 433.55 440.00 455.79 460.58 455.33 465.60 465.25 130.00 145.00 150.00 156.00 157.00 168.00 172.00 178.00 183.00 190.00 195.00 198.00 203.00 35.55 39.00 39.36 43.33 49.90 53.10 56.00 59.65 66.00 72.50 76.00 77.50 83.65
3、12 假设有一个记录某厂全体职工年龄(age)、工资(wage)的数据文件,现需要将年龄和工资分别按下列规定划分:
age wage 高 wage >800 较高 中等 较低 600 第4章 习 题 4、1 编辑一个你班级学生信息的数据文件,定义下列变量:id(学号)、name(姓名)、sex(性别)、group(学习小组)、math(数学考试成绩)、english(英语成绩)等,输入数据,然后做如下工作: (1)以变量math和english作为概述变量,以sex和group作为分组变量,并选择若干描述统计量,输出关于这两门功课考试情况的层分析报告。 (2)使用观测量概述功能,按照sex或者group作为分组变量,分别输出两门功课考试成 5 绩的观测量概述报告。 (3)使用行概述和列概述功能,分别输出两门功课考试成绩的观测量概述报告。 4、2 比较本章的4项概述报告过程的差异,回答下列问题: (1)可以使用哪些概述报告功能输出各分组概述变量的极差? (2)统计学中变量的标准差与均值之比称为标准差系数,应该使用哪种功能才能计算各分组概述变量的标准差系数? 4、3 对习题3、6的表列数据建立的数据文件,作出如下的统计分析报告: (1)按部门和所有制形式选择系统默认选项输出层分析报告,观察各部门和各种所有制企业的年总产值、职工总人数、工资总额;平均产值、企业平均人数、平均工资等。 (2)按部门和所有制形式选择与(1)中相同的统计量,分别输出行概述报告和列概述报告。 (3)根据输出报告中提供的数据,对该地区各部门或各种所有制企业的经济发展水平和职工收益作出简要的分析。 4、4 对于PU例4、4、2的问题,试分析使用SPSS有无更简洁的方法求出平均价格。 4、5 某市市场管理人员调查了该市6家百货商店一个月内29时彩电的销售量和销售额的数据,列于下表中,试选用合适的SPSS功能计算该市当月29时彩电的平均价格。 sell(销量:台) total(万元) 85 21.83 60 16.27 82 22.24 102 30.22 93 23.18 71 18.56 4、6 下列表中列出某地区1986年~1995年(七五一八五计划)粮食产量、人口、工业总产值、国民生产总值的环比发展速度,试选用OLAP Cubs或者Case Summaries过程,分两个5年计划分别输出该地区上述各项指标的平均发展速度,以及全期的平均发展速度。 (提示:建立数据文件后,定义一个按5年计划分类的分类变量,在概述统计量对话框中选用Geomitric Mean。) 年份 year 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 粮食产量 人口发展 环比速度(%) 环比速度(%) food_cir popu_cir 104.20 91.34 114.50 99.43 104.50 103.80 100.40 104.50 100.50 101.10 102.40 111.50 103.40 104.00 100.60 113.30 102.20 103.30 103.10 97.94 工业总产值 环比速度(%) indu_cir 110.00 114.00 110.80 101.60 107.10 101.40 101.20 101.20 103.50 101.00 国民生产总值 环比速度(%) GDP_cir 104.80 104.30 99.90 100.40 103.70 101.50 103.80 101.40 100.30 100.00 4、7 根据习题4、6的数据资料,执行丁Transform—Compute命令,分别计算七五—八五计划期间各项指标的平均发展速度,以及全期的平均发展速度。 4、8 下表所列的是某市2000年竣工的21幢商品楼所处地段(district)、标定价格(price) 6 和最终出售价格(sale) (单位:元/平方米)资料。 district 城中心 城中心 卫星城 城中心 近郊区 远郊区 远郊区 price 3300 3600 2400 3500 2250 1850 1760 sale 3540 3500 2350 3650 2300 1780 1800 district 远郊区 卫星城 卫星缄 近郊区 近郊区 近郊区 城中心 price 1880 1950 1900 1850 1780 1840 2800 sale 1750 1950 1950 1780 1650 1700 2800 district 城中心 远郊区 远郊区 近郊区 近郊区 卫星城 卫星城 price 3050 1670 1680 1780 1850 2050 2020 sale 3200 1650 1650 1680 1900 2000 2100 试建立相应的数据文件调用OLAP Cube过程、按行概述报告过程、按列概述报告过程分别输出统计报告,概述各地段楼房价格的平均(标定、实际)价格、价格标准差、最低价格、最高价格等。 4、9 SPSS自带的系统数据文件“world95.Save”记录了世界上109个国家和地区经济发展基本情况的数据,文件包含26个变量,针对这一数据文件,做如下工作: (1)选择其中:country(国家)、populatn(以千人计人口总数)、lifeexpf(女性人口的平均寿命)、lifeexpm(男性人口的平均寿命)、gdp_cap(人均国民生产总值)和region(各国所属的区域或经济组织)等6个变量建立变量子集。 (2)使用这个子集,选择region为分组变量,选择populam、lifeexpf、lifeexpm和gdp_cap为概述分析变量,执行OLAP Cubes过程,输出层分析报告表。报告中特别输出变量lifeexpf与lifeexpm的差值百分数比。 (3)执行行概述报告和列概述报告,比较各种报告的差异。 (4)选择文件中其他变量作为概述变量或分组变量重复上述工作。 第5章 习 题 5、1 下列数据记录的是30名大学生每周上网的时间数(以小时计):0,0,1,1,1,1,1,1,1,2,2,2,2,2,2,3,3,3,3,4,4,4,4,5,5,6,8,8,9,10。试填写如下的统计表。 Statistics TIME上网时间 Valid 30 7 Missing 0 Sum 98 Mean Median Mode Std. Deviation 2.6643668 5、2 某公司所属企业月销售额(万元)的条形图如下图所示,根据图填写统计量表中的缺项数值。 销售额(万元)Frequency76543210506575808595Statistics SALES Mode Std. Dev 10.3279 Minimum Maximum Sum Valid Missing Mean Median 0 5、3 对同一个分析变量执行频数分析过程,分别输出条形图和直方图,比较二者的区别。 5、4 下列频数表是对一份关于被调查者对自己职业满意程度的社会调查数据资料,执行频数分析过程输出的频数表。其中定义opinion为数值型变量,标签为“对工作的满意程度”,值为1,2,3,4。试填写表中空格处的数值。 opinion 对工作的满意程度 Valid Missing Total Frequency 77 75 28 218 10 Percent 16.7 33.8 12.3 95.6 100 Valid Percent 35.3 34.4 12.8 100 Cumulative Percent 17.4 87.2 100 1(非常满意) 2(比较满意) 3(不太满意) 4(很不满意) Total System 5、5 调查100名健康女大学生的血清总蛋白含量(g %)如下表,试作频数表分析。 7.43 7.88 6.88 7.80 7.04 8.05 6.97 7.12 7.27 7.20 7.43 7.12 7.20 7.50 7.35 7.88 7.43 7.03 7.20 6.43 7.58 8.03 6.97 7.43 7.35 7.35 7.50 7.04 6.80 7.04 7.20 7.65 7.43 7.65 7.76 7.04 6.50 7.65 8.16 7.54 7.27 7.27 6.72 7.65 7.43 7.58 7.35 7.50 7.27 7.35 7.35 7.27 8.16 7.65 7.35 8.05 7.95 7.56 7.50 7.88 7.20 7.20 7.72 7.58 6.50 7.43 7.12 6.97 6.80 7.35 7.50 7.35 7.58 7.58 6.88 7.65 7.04 7.12 8.12 7.50 7.04 6.73 7.20 7.50 7.43 7.35 7.95 7.35 7.47 7.27 6.88 7.95 7.72 6.73 7.04 6.73 7.65 6.73 7.27 8.43 8 5、6 考虑下列 25个人的年龄:21,23,23,24,25,25,30,30,32,35,37,37,40,40,41,41,42,42,45,75,完成下列茎叶图。 AGE Stem-and-Leaf Plot Frequency Stem & . Leaf . 3 . 4 Extremes Stem width: 10.00 Each leaf: 1 case(s) 2 5、7 下图为从某厂全部职工中随机抽出的31名职工的年工资(元)分布的茎叶图: WAGE Stem-and-Leaf Plot Frequency Stem & Leaf 4.00 41 . 5566 5.00 42 . 23344 6.00 43 . 556668 8.00 44 . 02455688 4.00 45 . 1458 .00 46 . 3.00 47 . 356 1.00 Extremes (>=8850) Stem width: 100.00 Each leaf: 1 case(s) (1)根据茎叶图列出这31个人的年工资额,定义变量建立数据文件,使用Compute对话框,计算年工资的Z得分; (2)建立记录工资的数据文件,输出该公司职工工资的描述性统计表。指出全厂职工年工资的均值、标准差、95%置信区间等。 5、8 试根据某个班级会计、统计、管理3门功课考试成绩的箱图(下图)回答下列问题: 110100908070605014030N =505050会计成绩统计成绩管理成绩 9 (1)估计该班各科考试成绩的中位数。 (2)估计管理成绩的内四分位数界。 (3)从会计成绩的奇异值的位置估计该学生的会计成绩。 (4)哪一门功课成绩的变异程度最大?哪一门成绩的变异程度最小? 5、9 下表是从住房和社区服务问题调查中抽出的容量为18的样本,调查住户的住房购还是租用(1=“自购”,2=“租用”)以及对社区服务的满意程度(1=“不满意”,2=“满意”,3=“很满意”) person 1 2 3 4 5 6 7 8 owner 1 2 1 1 2 1 1 1 approve 1 2 1 1 2 2 1 1 person 9 10 11 12 13 14 15 16 owner 2 2 2 2 l l 2 1 approve 1 3 1 1 3 2 1 3 填写如下交叉表,并调用SPSS的交叉表过程,进一步分析人们对城市服务的满意程度。 OWNER*APPROVE Crosstabulation owner 1 Count 2 Count APPROVE 1 2 3 Total Total Count 5、10 针对习题4、8建立的数据文件,调用Ratio统计过程,分析各地段的商品楼的标格与实际销售价格比率变化的分布情况,各地段价格比率是否均匀或一致? 第6章 习 题 6、1 试组织编辑一个你们班级期末各门功课考试成绩的数据文件,按性别和学习小组分析考试成绩之间的差异。 6、2 设 Xi(i1,2,,n)为取自某个未知方差的正态总体的样本,总体均值μ的(1 -α)100%置信区间为(Xt/2(n1)ss,Xt/2(n1)) ,考虑怎样利用SPSSnn计算出这个置信区间?SPSS中也没有给出求总体方差的区间估计的过程,考虑能否自行设 计一个计算方差的区间估计的方法? 6、3 从某化工厂生产的两批瓶装无水酒精中,分别抽出12瓶和14瓶进行检查,据以往经验,假定两批产品中杂质含量均服从正态分布,且两批产品杂质含量相互独立,调用SPSS的独立样本T检验过程,检验两批产品杂质含量的差异,得到如下分析表,试填写表中的 10 空格,并对结果作出解释。 Group Statistics ALCOHL 酒精中杂质含量 Independent Samples Test ALCOHL酒精中杂质含量 Levene's Test for Equality of Variances F Sig t df Equal variances assumed 0.005 0.946 -1.081 0.290 0.1954 -0.6146 0.1920 Equal variances not assumed -1.090 23.897 0.287 0.1939 -0.6116 0.1890 BATCH 批号 1 2 N 12 14 Mean 2.6208 2.8321 Std. Deviation Std. Error Mean 0.4707 0.1383 Sig. (2-tailed) t-test for Equality Mean Difference of Means Std. Error Difference 95% Confidence Lower Interval of the Difference Upper 6、4 使用对习题2、6建立的两种品种小麦千粒重的数据文件,执行Analyze—Compare Means—Means命令,对小麦品种和不同村庄对小麦千粒重的影响进行分析。并与使用Aggregate命令汇总的结果作比较。 6、5 设下列样本为取自某未知方差的正态总体的样本: 99.33 98.75 100.52 101.35 98.65 99.70 99.58 104.12 100.84 对给定α= 0.1,0.05,0.01,计算总体均值 μ的(1-α)100%置信区间。 (提示:首先定义变量x输入样本值,定义变量p输入数值0.95,0.975,0.995,并建立数据文件;执行Descriptives命令输出变量x的mean和S.E.mean;用Compute对话框,调用逆分布函数IDF.T(p,df)计算分位点数值:最后再用得到的mean和S.E.mean值利用Compute对话框或者编程计算置信区间上下限。) 6、6 试将例6、2、1中所列的3批元件样本的测量数据合并,作为同一个变量“Ohm”的观察值,定义变量“batch”(批次)标记各元件所属的批次,建立数据文件,使用独立样本T检验过程,两两比较各批次样本的测量电阻均值之间的差异。 6、7 对下列试验进行检验,指出哪个试验应该使用独立样本检验,哪个应该使用配对样本检验? (1)让一组测试者一一自报自己的体重,然后测量他们的体重,得到两组数据。检验自报体重与实际体重之间的差异。 11 (2)对人造纤维在60°和80°的水中分别作试验,检验温度对人造纤维缩水率的影响。 (3)从一批产品中抽取部分产品,交由两名检验人员分别测量产品的某项性能指标。检验两人的测量结果是否存在差异。 (4)某商场分别询问了素不相识的20位男性顾客和20位女性顾客,了解他们对想要购买的电冰箱容量的要求,检验男性和女性顾客对电冰箱容量要求的差异。 6、8 某日从两台机器加工的同一种零件中分别抽取10个和9个样品,测量其尺寸(单位:cm): 甲机器:6.25, 5.78, 6.45, 6.00, 5.88, 5.76, 6.00, 5.85, 5.94, 5.79 乙机器:6.08, 6.25, 5.94, 5.94, 5.79, 6.03, 5.85, 6.10, 5.93 据以往的经验,甲乙机器生产的零件尺寸均服从正态分布。设显著性水平α= 0.05,问两台机器生产的零件尺寸的均值有无显著差异?使用两种方法定义变量,分别调用单个样本T检验和独立样本T检验过程进行检验,总结二种检验的适用条件、输出结果的差异。 6、9 让10个失眠患者分别服用甲乙两种安眠药,观察延长睡眠时间的情况,得到如下配对数据: 甲药延时量 1.90 0.80 1.10 0.10 -0.10 4.40 5.50 1.60 4.60 3.40 乙药延时量 0.70 -1.60 -0.20 -1.2 -0.10 3.40 3.70 0.80 0.00 2.20 在显著检验性水平α= 0.05下,试用配对样本的T检验过程,检验两种药物的疗效有无显著差异? 6、10 一工厂的两个化验员每天同时从工厂的冷却水中取样,测量一次水中的含氯量(ppm),下面列出10天的记录: 化验员A: 1.15 1.86 0.75 1.82 1.14 1.65 1.90 0.89 1.12 1.09 化验员B: 1.00 1.90 0.90 1.80 1.20 1.70 1.95 1.87 1.69 1.92 设各化验员的化验结果服从正态分布,试选用适当的检验过程,检验两个化验员测盏 的结果之间是否有显著差异? (α= 0.05、0.01) 6、11 SPSS配带的系统文件world95.sav中,保存1995年世界上109个国家和地区的部分指标的数据,其中变量“lifeexpf ”和“lifeexpm”分别为各国或地区女性和男性人口的平均寿命。 (1)假若将这两个指标数据作为样本,试用配对样本的T检验过程检验,女性人口的平均寿命是否确实比男性人口的平均寿命长。 (2)调用Data→Select Cases命令,从中抽取部分随机样本,重复(1)进一步证实检验结果 第7章 习 题 7、1 根据例7、2、1中列出的样本数据,建立数据文件,使用系统默认值进行单因素方差分析,检验不同的品种的小麦的平均产量有无显著差异? 7、2 针对习题2、6所建立的数据文件,使用系统默认值进行单因素方差分析,分别检验不同的小麦品种和不同的村庄对小麦的千粒重有无显著影响? 12 7、3 教学研究人员想要检验3种不同教学方法的效果,随机地抽取16名水平相当的学生,分成3组,每组用一种方法教学。一段时间后进行测验,根据测验结果作单因素差分析,得到如下方差分析表。试填写表中所缺数值,并判断3种教学方法的效果有无显著差异? (α= 0.05) SCORE 成绩 Between Groups Within Groups Total Sum of Squares df 817.633 1382.235 2 14 16 Mean Square F Sig. 0.025 7、4 为了评比某种型号的电池质量,分别从A、B、C三个工厂生产的同种型号电池中各随机地抽取5只电池为样本,经试验得到其寿命(小时)如下: 样品 工厂 A B C A1 A2 A3 A4 A5 40 48 38 42 45 36 34 30 28 32 39 40 43 50 50 假设电池寿命服从正态分布,试在显著性水平α= 0.05下,检验电池的平均寿命有无显著差异? 7、5 将4个不同的水稻品种A1、A2、A3、A4安排在面积相同的4种不同土质的地块B1、B2、B3、B4中试种,测得各地块的产量(kg)如下: 地块 品种 A1 A2 A3 A4 B1 B2 B3 B4 135 120 147 132 154 129 125 125 125 129 120 133 115 124 119 123 假设水稻品种与地块之间无交互作用,建立适当的数据文件,试用SPSS的Univariate命令,在显著性水平α= 0.05,检验: (1)不同的品种对水稻的产量有无显著的影响? (2)不同的土质对水稻的产量有无显著的影响? 7、6 下表给出某种化工产品生产过程在3种浓度、4种温度下得率的数据: 浓度 (%) 2 4 6 温度(°C) 10 14,10 9,7 5,11 24 11,11 10,8 13,14 38 13,9 7,11 12,13 52 10,12 6,10 14,10 建立适当的数据文件,试用SPSS的Univariate命令,在显著性水平α= 0.05下,检验各因子的主效应与交互作用对得率的影响。 13 7、7 在一个考察纤维弹性(spring)受收缩率(fac_a)和拉伸倍数(fac_b)的试验中,两因素各取4种水平,因素的各种搭配下分别作两次试验,根据试验结果的数据文件,执行SPSS的Univariate命令得到如下的方差分析表: Tests of Between—Subjects Effects Dependent Variable:SPRING 纤维弹性 Source Corrected Model Intercept FAC_A(收缩率) FAC_B(拉伸倍数) FAC_A*FAC_B Error Total Corrected Total Type Ⅲ sum of Squares 157.719 a 174492.781 70.594 7.594 79.531 21.500 174673.000 180.219 df 15 1 3 3 9 16 32 31 Mean Square 10.518 174492.781 23.531 2.865 7.837 1.344 F 7.874 129855.093 17.512 2.132 6.576 Sig. 0.000 0.000 0.000 0.136 0.001 a R Squared=.881 (Adjusted R Squared =.769) 根据表中的输出结果指出:收缩率和拉伸倍数对纤维弹性有无显著影响,两因素的交互作用对纤维弹性有无显著影响,写出简单的检验报告。(检验的显著性水平α= 0.05) 7、8 下表中记录的是3名工人分别在4台不同的机器上工作3天的日产量。 机器 工人 甲 乙 丙 A1 15,15,17 19,19,16 16,18,21 A2 17,17,17 15,15,15 19,22,22 A3 15,17,16 18,17,16 18,18,18 A4 18,20,22 15,16,17 17,17,17 假定各工人的日产量服从正态分布,建立适当的数据文件,使用SPSS的Univariate命令,在显著性水平α= 0.05下,检验: (1)工人的操作水平之间有无显著差异? (2)不同的机器之间有无显著差异? (3)不同工人的操作水平与不同的机器之间的交互作用是否显著? 7、9 用3种栽培技术和4种施肥方案相互搭配组成12种育苗方案作杨树育苗试验,在每一种方案下培育3株杨树苗,测得苗高的数据资料如下表所示: 施肥(B)栽培技术(A) A1 A2 A3 B1 52,43,39 53,47,41 38,42,49 B2 48,37,29 50,41,30 48,47,36 B3 34,42,38 44,36,39 40,32,37 B4 58,45,42 60,46,44 43,56,41 设苗高服从等方差的正态分布,建立适当的数据文件,试用SPSS的Univariate命令在显著性水平α= 0.05下,检验: (1)不同栽培技术对苗高有无显著影响? (2)不同施肥方案对苗高有无显著影响? (3)二者的交互作用对苗高的影响是否显著? 14 第8章 习 题 8、1 对下列各对变量,判断它们之间是否存在相关关系,相关系数为正、负、还是零? (1)每日卡路里的摄入量与体重。 (2)海拔与平均气温。 (3)国内生产总值与新生婴儿的死亡率。 (4)家庭的总收入与文化生活的服务支出。 (5)结婚年龄与受教育的时间。 (6)每日的吸烟数量与肺功能。 8、2 调用SPSS的系统数据文件world95.sav,针对文件中的变量: (1)男性人口的平均寿命(1ifeexpm)、女性人口的平均寿命(1ifeexpf)以及每天卡路里摄入量(colories): (2)男性人口的平均寿命(1ifeexpm)、女性人口的平均寿命(1ifeexpf)以及人均国民生产总值(gdp_cap): (3)男性人口的平均寿命(1ifeexpm)、女性人口的平均寿命(1ifeexpf)以及识字(1iteracy); (4)成人识字率(1iteracy)、人均国民生产总值(gdp_cap)。 分别执行Bivariate(二元相关)命令,分析变量之间的相关关系。 8、3 下表中列出某地区九个市县社会商品零售总额(亿元)、城市居民年平均收入(元)、农民年平均收入(万元)的数据,分别记为变量retail、townsman、farmers。 市县编号 retail townsman farmers 1 58.75 0.468 0.166 2 18.29 0.375 0.135 3 15.29 0.410 0.151 4 12.58 0.370 0.149 5 11.24 0.430 0.154 6 15.60 0.379 0.125 7 15.09 0.350 0.104 8 14.36 0.360 0.119 9 15.14 0.370 0.159 执行Bivariate(二元相关)命令,分析变量之间的相关关系。 8、4 某医院研究某种代乳粉的营养价值时,用大白鼠作试验,得大白鼠进食量(克)和增加体重(克)之间的关系的原始数据如下表,用x表示大白鼠进食量和用y表示大鼠增加体重,试作x与y之间的相关分析。 进食量x(克) 820 780 158 720 130 867 180 690 134 787 167 934 186 679 145 639 120 820 158 增加体重y(克) 165 8、5 下表中列出某班10名学生高一(x)和高二(y)数学期末考试的成绩。 id x y 1 74 76 2 71 72 3 75 71 4 68 70 5 76 76 6 73 79 7 67 65 8 75 79 9 70 77 10 74 72 执行Bivariate(二元相关)命令,分析变量之间的相关关系。 15 8、6 4位教师对6名学生的作文竞赛评定的名次如下表。 学生 1 2 3 4 5 6 评定教师 1 3 4 2 6 1 5 2 4 3 1 5 2 6 3 2 1 3 6 4 5 4 1 3 4 5 2 6 执行Bivariate命令,计算斯皮尔曼和肯德尔相关系数分析评定结果之间的相关关系。 8、7 两位评酒师对20种酒的等级(1~10)进行评定,评定结果如下表所示。 drink 1 2 3 4 5 6 7 8 9 10 A 6 4 7 8 2 7 9 7 2 4 B 8 5 4 7 3 4 9 8 5 3 drink 11 12 13 14 15 16 17 18 19 20 A 6 8 4 3 6 9 9 4 4 5 B 9 5 2 3 8 10 8 6 3 5 建立数据文件,回答下列问题: (1)执行Bivariate命令,计算斯皮尔曼和肯德尔相关系数分析评定结果之间的相关关系。 (2)执行Distances命令,分析评定结果之间的相似关系。 (3)执行Distances命令,计算观测量之间的欧几里得距离,分析观测量之间的亲疏关系。 8、8 在图8-7的距离分析不相似测度对话框中,Transform Values(值转换)栏提供了数值转换方法,针对各种方法给出相应的数学计算公式。在数据窗口任意定义一个变量,并赋予若干变量值,应用SPSS的Compute对话框,用建立的计算公式对该变量执行数值转换,观查转换的结果。 第9章 习 题 9、1 现测得变量x与y的数据如下表: i x y 1 49.2 16.7 2 50.0 17.0 3 49.3 26.8 4 49.0 16.6 5 49.0 16.7 6 49.5 16.8 7 49.8 16.9 8 49.9 17.0 9 50.2 17.0 10 50.2 17.1 (1)建立数据文件,执行二元相关命令,判断变量x与y之间是否有线性相关关系; (2)若线性相关,执行Analyze→Regression→Linear命令分别求出y关于x和x关于y的回归方程;比较二者的不同。 16 9、2 试根据习题3、8中的数据资料,建立下列变量之间的回归方程,分析它们之间的关系。 (1)分别建立因变量GDP(国民生产总值)、food、veg、popul与year之间的一元线性回归方程。给出分析报告; (2)建立因变量GDP与food、veg、popul之间的多元线性回归方程,给出分析报告。 9、3 某研究所每年的净收益(income)的主要影响因素为该所每年实际研究费用(fee)和研究人员数量(invest),收集近九年来的数据资料如下: fee(万元) invest(人) 123.5 254 123.8 257 1630 125.6 275 1660 126.4 290 1690 127.1 295 1720 127.3 296 1750 128.9 311 1780 130.4 326 1840 131.8 341 1870 income(万元) 1600 建立数据文件,求因变量income对自变量fee和invest的线性回归方程,给出分析结果报告。如设自变量fee和invest取下列各对数值时,求出income的预测值。 fee : invest : 135、140、160、188、200 360、380、400、400、410 9、4 锡克试验阴性(%)随着年龄的增长而增高,某地区医院调查得到儿童年龄(岁)Y与锡克试验阴性率Y的资料如下: 年龄X(岁) 锡克试验阴性率Y(%) 1 57.1 2 76.0 3 90.9 4 93.0 5 96.7 6 95.6 7 96.2 建立数据文件,试执行Regression → Curve Estimation (曲线估计过程)命令,选用二次、三次和对数曲线模型拟合此组数据。 9、5 研究某地区土壤中所含植物可给磷的情况,得到下列表中的数据: 土壤子样序号 1 2 3 4 5 6 7 8 9 x1 0.4 0.4 0.6 1.7 1.9 9.4 3.1 4.7 10.1 x2 53 23 34 65 36 44 19 24 31 x3 158 163 157 123 143 46 37 59 117 y 64 60 61 77 54 81 71 54 93 土壤子样序号 10 11 12 13 14 15 16 17 18 x1 10.9 12.6 11.6 23.1 23.1 21.6 23.1 26.8 29.9 x2 37 58 29 46 50 44 56 58 51 x3 111 112 173 114 134 73 168 202 124 y 76 51 93 96 77 93 95 168 99 其中:x1为土壤中含无机磷浓度; x2为土壤中溶于K2C03溶液并受溴化物水解的无机磷浓度; x3为土壤中溶于K2C03溶液但不受溴化物水解的无机磷浓度; y为种植在20°C土壤内的玉米中的可给态磷。 建立数据文件,执行Analyze → Regression → Linear命令并选择逐步回归,求y关于x1、x2、x3、的线性回归方程,并给出分析报告。 17 9、6 维尼纶厂生产牵切纱的工艺流程由牵切、粗纺、细纺三道工序组成,根据经验粗纱的重量不匀率Z与牵切条干不匀率x及牵切重量不匀率y有关,试验测定20个样品得到下表中的数据: 序号 1 2 3 4 5 6 7 8 9 10 x(%) 15.58 10.68 15.62 15.78 13.22 16.44 11.40 16.17 14.03 15.67 y(%) 1.95 1.37 2.39 1.14 1.85 1.32 2.05 1.11 1.47 1.38 Z(%) 1.34 1.27 1.56 1.48 1.40 1.82 0.85 1.40 1.15 1.89 序号 11 12 13 14 15 16 17 18 19 20 x(%) 12.74 11.73 14.84 13.73 15.12 17.88 13.38 14.21 16.80 10.81 y(%) 1.35 1.33 1.09 1.27 1.78 2.52 1.43 2.27 1.41 1.78 Z(%) 0.87 1.53 1.25 2.47 1.83 2.41 1.69 1.50 1.19 2.44 序号 21 22 23 24 25 26 27 28 29 x(%) 10.81 17.26 14.92 18.14 18.15 10.31 11.40 12.57 17.61 y(%) 1.32 1.31 1.42 2.13 1.20 0.98 1.27 0.87 1.21 Z(%) 1.35 1.57 1.64 1.64 2.34 0.65 1.19 2.06 1.57 建立数据文件,求出Z关于x和y的回归方程,根据方程的检验结果,再选用逐步回归法求解。 9、7 测得云杉平均树高h(米)和平均树径d(厘米)之间下列数据: d h 15 13.9 20 17.1 25 20.0 30 22.1 35 24.0 40 25.6 45 27.0 50 28.3 22 29.4 60 30.2 65 31.4 建立数据文件并调用Curve Estimation(曲线估计过程)求平均树高h(米)和平均树径d(厘米)之间的下列曲线拟合模型: (1)二次函数habdcd; (2)幂函数had; (3)指数函数hab; (4)对数函数habln(d); 并分析哪种曲线拟合较好? 9、8 对习题9、7的数据,调用Nonlinier(非线性回归过程)求平均树高h(米)和平均树径d(厘米)之间的4种曲线回归模型,与9、7题的曲线拟合结果进行比较。 9、9 利用本章例9、3、1的数据资料,选用表9、20中所列的Verhulst(维尔哈斯特)模型,进行非线性回归分析。 9、10 今搜集到20名糖尿病人的血糖(Y,mmol/L)、胰岛素(X1,mU/L)及生长素(X2,μg/L)的测量数据列于下表: 18 db2序号 1 2 3 4 5 6 7 Y 12.21 14.54 12.27 12.04 7.88 11.10 10.43 X1 15.20 16.70 11.90 14.00 19.80 16.20 17.00 X2 9.51 11.43 7.53 12.71 2.33 13.52 10.07 序号 8 9 10 11 12 13 14 Y 13.32 19.59 9.05 6.44 9.45 10.16 8.38 X1 X2 序号 15 16 17 18 19 20 Y 8.49 7.71 11.38 10.82 12.49 9.21 X1 X2 10.30 18.89 5.90 13.14 18.70 9.63 25.10 5.10 16.40 4.53 22.00 2.16 23.10 4.26 23.20 3.42 25.00 7.34 16.80 12.75 11.20 10.88 13.70 11.06 24.40 9.16 试建立数据文件,试进行多元线性回归分析,求变量Y与X1、X2之间的回归方程。 第10章 习 题 10、1 在一个正20面体的各面上标有0,1,2,…,9十个数字,每个数字在两个面上标出。为了检验其匀称性,今将它投掷800次,各数字朝上的次数如下: 数字 正面朝上的次数 0 79 1 92 2 83 3 79 4 73 5 80 6 76 7 75 8 77 9 91 试建立适当的数据文件,用卡方检验法检验该正20面体是否匀称? 10、2 某炼铁厂在正常生产情况下,记录的116炉铁水中含碳量的百分比数据列于下表: 4.57 4.59 4.42 4.68 4.58 4.50 4.52 4.62 4.60 4.53 4.73 4.64 4.44 4.33 4.43 4.59 4.37 4.48 4.57 4.64 4.54 4.67 4.67 4.53 4.51 4.53 4.50 4.54 4.61 4.53 4.58 4.30 4.72 4.59 4.53 4.55 4.57 4.60 4.54 4.61 4.57 4.49 4.43 4.77 4.67 4.65 4.50 4.52 4.57 4.42 4.28 4.66 4.42 4.50 4.52 4.60 4.72 4.51 4.48 4.57 4.48 4.57 4.40 4.57 4.47 4.44 4.81 4.57 4.49 4.50 4.56 4.53 4.78 4.40 4.49 4.43 4.42 4.48 4.39 4.63 4.50 4.47 4.60 4.51 4.61 4.55 4.47 4.59 4.60 4.62 4.65 4.40 4.52 4.60 4.70 4.55 4.52 4.39 4.57 4.60 4.57 4.63 4.66 4.55 4.57 4.61 4.60 4.36 4.60 4.44 4.57 4.54 4.52 4.68 4.50 4.62 先执行Frequencies命令输出直方图,观察铁水中含碳量大致服从何种分布?再分别用 卡方检验法和单个样本的K-S检验法检验原假设1l:铁水中含碳量服从正态分布。 10、3 某实验室对一个物理参数的值进行了25次独立测量,测量结果与该参数的理论值之间的偏差情况如下:(数据已经经过排序) -2.46 -2.11 -1.23 -0.99 -0.42 -0.39 -0.21 -0.15 -0.10 -0.07 -0.02 0.27 0.40 0.42 0.44 0.70 0.81 0.88 1.07 1.39 1.40 1.47 1.62 1.64 1.76 试用单个样本的K-S检验法检验假设H0 :测量偏差服从正态分布。 10、4 在一大批相同型号的电子元件中随机地抽取10只作寿命试验,测得它们的使用寿命(单位:小时)为 420 500 920 1380 1510 1650 1760 2100 2320 2350 试用单个样本的K-S检验法检验假设H0 :测量偏差服从指数分布。 19 10、5 从随机数表中抽得20个观测数据如下: 0.55 0.80 0.15 0.12 0.21 0.40 0.46 0.17 0.62 0.63 0.71 0.99 0.88 0.30 0.64 0.51 0.68 0.50 0.60 0.77 使用单个样本的K-S检验它是否服从均匀分布? 10、6 为检验两台光测高温计所测定的温度读数之间有无系统误差,用这两台光测高温计同时对一热炽灯灯丝作了10次观察,得到如下数据(℃): 甲高温计 1050 1028 918 1183 1200 980 1258 1308 1420 1500 乙高温计 1070 1020 936 1185 1211 1002 1254 1330 1425 1545 分别用符号检验法和秩和检验法检验这两台光测高温计所测定的温度之间有无系统误差。 10、7 为了建立白炽灯泡的质量管理,从生产线上连续抽出32只灯泡依次贴上序号,然后作寿命试验,得到每只灯泡寿命的数据(千小时)如下: 序号 1 2 3 4 5 6 7 8 寿命 1.11 1.28 1.46 1.35 1.06 1.25 1.44 1.23 序号 9 10 11 12 13 14 15 16 寿命 1.63 2.10 1.21 1.76 2.41 2.08 1.50 1.55 序号 17 18 19 20 21 22 23 24 寿命 1.21 1.60 1.56 0.73 1.26 1.51 1.77 1.16 序号 25 26 27 28 29 30 31 32 寿命 1.30 1.50 1.27 1.56 1.15 1.94 0.84 1.14 经计算这32只灯泡的平均寿命为1.435千小时,执行Transform → Recode → Into Different Variables命令将比平均寿命大的用“+”标记,比平均寿命小的用“-”标记,使用游程检验法检验,“+”、“-”号序列是否可以认为是随机的。 10、8 甲乙两分析员同时分析某浆料中硼砂的含量,测得如下数据(%): 甲 乙 13.5 12.1 15.4 10.8 14.4 13.8 16.4 9.9 11.5 12.2 12.8 14.7 15.2 建立合适的数据文件,选用秩和检验法检验二人分析的结果有无显著差异? 10、9 某轴承厂考虑从生产同一种轴承钢的两家钢厂选一家,购买这家工厂的钢材,搜集了过去一年中每个月两厂产品的合格率(%)数据: 甲厂 92.5 乙厂 94.5 92.0 96.2 94.0 97.0 95.6 89.0 92.5 95.8 89.5 95.5 95.0 96.2 90.8 98.4 95.0 98.0 95.8 95.0 96.2 96.4 95.0 95.0 据这些数据比较两厂钢材有无显著差异,确定应使用哪一种检验方法进行检验?并输出检验结果。 10、10 为了比较3种牌号的汽油,进行一项试验,选取载重量和功率都相同的21辆汽车,每7辆用一种汽油,同时在一条公路上用同样的速度行驶,得到每加仑汽油行驶的里程数据如下(英里): 20 牌号1 牌号2 牌号3 14 20 20 19 21 26 19 18 24 16 20 23 15 19 23 17 19 25 20 18 23 试选择合适的方法检验3种牌号的汽油有无显著差异? 10、11 根据例10、8、1的数据,使用多个相关样本检验过程检验下列原假设:Ho:品尝员的品尝结果无差异。 10、12 预期表面镀铅的钢管比裸钢管的防腐性能好,为此试验考察,将两种钢管成对地埋在6种不同的土壤中,经过8年取出测量它们重量损失的百分数数据如下: 土壤 钢管 镀铅管 裸管 1 0.18 1.70 2 0.08 0.21 3 0.61 1.21 4 0.44 0.89 5 0.77 0.86 6 1.27 2.64 (1)分析两种钢管的防腐性能有无显著差异? (2)分析不同土壤对钢管的腐蚀程度有无显著的影响? 21 因篇幅问题不能全部显示,请点此查看更多更全内容