我也求一份《统计学》第四版课后习题答案..贾俊平 何晓群 金勇进的..不胜感激。

如题所述

  第四章练习题答案

  4.1 (1)众数:M0=10; 中位数:中位数位置=n+1/2=5.5,Me=10;平均数:
  (2)QL位置=n/4=2.5, QL=4+7/2=5.5;QU位置=3n/4=7.5,QU=12
  (3)
  (4)由于平均数小于中位数和众数,所以汽车销售量为左偏分布。
  4.2 (1)从表中数据可以看出,年龄出现频数最多的是19和23,故有个众数,即M0=19和M0=23。
  将原始数据排序后,计算中位数的位置为:中位数位置= n+1/2=13,第13个位置上的数值为23,所以中位数为Me=23
  (2)QL位置=n/4=6.25, QL==19;QU位置=3n/4=18.75,QU=26.5
  (3)平均数 600/25=24,标准差
  (4)偏态系数SK=1.08,峰态系数K=0.77
  (5)分析:从众数、中位数和平均数来看,网民年龄在23-24岁的人数占多数。由于标准差较大,说明网民年龄之间有较大差异。从偏态系数来看,年龄分布为右偏,由于偏态系数大于1,所以,偏斜程度很大。由于峰态系数为正值,所以为尖峰分布。
  4.3 (1)茎叶图如下:
  茎 叶 频数
  5
  6
  7 5
  6 7 8
  1 3 4 8 8 1
  3
  5
  (2) 63/9=7,
  (3)由于两种排队方式的平均数不同,所以用离散系数进行比较。
  第一种排队方式:v1=1.97/7.2=0.274;v2=0.714/7=0.102.由于v1>v2,表明第一种排队方式的离散程度大于第二种排队方式。
  (4)选方法二,因为第二种排队方式的平均等待时间较短,且离散程度小于第一种排队方式。
  4.4 (1) 8223/30=274.1
  中位数位置=n+1/2=15.5,Me=272+273/2=272.5
  (2)QL位置=n/4=7.5, QL==(258+261)/2=259.5;QU位置=3n/4=22.5,QU=(284+291)/2=287.5
  (3)
  4.5 (1)甲企业的平均成本=总成本/总产量=
  乙企业的平均成本=总成本/总产量=
  原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。
  4.6 (1)(计算过程中的表略), 51200/120=426.67

  SK=0.203 K=-0.688
  4.7 (1)两位调查人员所得到的平均身高应该差不多相同,因为均值的大小基本上不受样本大小的影响。
  (2)两位调查人员所得到身高的标准差应该差不多相同,因为标准差的大小基本上不受样本大小的影响。
  (3)具有较大样本的调查人员有更大的机会取得最高或最低者,因为样本越大,变化的范围就可能越大。
  4.8 (1)要比较男女学生体重的离散程度应该采用离散系数。女生体重的离散系数为v女=5/50=0.1,男生体重的离散系数为v男=5/60=0.08,所以女生的体重差异大。
  (2)男生: 60×2.2=132(磅),s=5×2.2=11(磅)
  女生: 50×2.2=110(磅),s=5×2.2=11(磅)
  (3)假定体重为对称分布,根据经验法则,在平均数加减1个标准差范围内的数据个数大约为68%。因此,男生中大约有68%的人体重在55kg-65kg之间。
  (4)假定体重为对称分布,根据经验法则,在平均数加减2个标准差范围内的数据个数大约为95%。因此,男生中大约有95%的人体重在40kg-60kg之间。
  4.9 通过计算标准分数来判断:

  该测试者在A项测试中比平均分数高出1个标准差,而在B项测试中只高出平均分数0.5个标准差,由于A项测试的标准分数高于B项测试,所以,A项测试比较理想。
  4.10 通过标准分数来判断,各天的标准分数如下表:
  日期 周一 周二 周三 周四 周五 周六 周日
  标准分数Z 3 -0.6 -0.2 0.4 -1.8 -2.2 0
  周一和周六两天失去了控制。
  4.11
  (1)应该采用离散系数,因为它消除了不同组数据水平高低的影响。
  (2)成年组身高的离散系数:
  幼儿组身高的离散系数:
  由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离散程度相对较大。
  4.12
  (1)应该从平均数和标准差两个方面进行评价。在对各种方法的离散程度进行比较时,应该采用离散系数。
  (2)下表给出了各种方法的主要描述统计量。
  方法A 方法B 方法C
  平均 165.6
  中位数 165
  众数 164
  标准差 2.13
  极差 8
  最小值 162
  最大值 170 平均 128.73
  中位数 129
  众数 128
  标准差 1.75
  极差 7
  最小值 125
  最大值 132 平均 125.53
  中位数 126
  众数 126
  标准差 2.77
  极差 12
  最小值 116
  最大值 128
  从三种方法的集中趋势来看,方法A的平均产量最高,中位数和众数也都高于其他两种方法。从离散程度来看,三种方法的离散系数分别为: , , 。方法A的离散程度最小,因此,应选择方法A。
  4.13
  (1)用方差或标准差来评价投资的风险。
  (2)从直方图可以看出,商业类股票收益率的离散程度较小,说明投资风险也就较小。
  (3)从投资风险角度看,应该选择风险较小的商业类股票。当然,选择哪类股票还与投资者的主观判断有很大关系。
  第五章练习题答案
  5.1 (1)平均分数是范围在0-100之间的连续变量,Ω=[0,100]
  (2)已经遇到的绿灯次数是从0开始的任意自然数,Ω=N
  (3)之前生产的产品中可能无次品也可能有任意多个次品,Ω=[10,11,12,13…….]
  5.2 设订日报的集合为A,订晚报的集合为B,至少订一种报的集合为A∪B,同时订两种报的集合为A∩B。
  P(A∩B)=P(A)+ P(B)-P(A∪B)=0.5+0.65-0.85=0.3
  5.3 P(A∪B)=1/3,P(A∩ )=1/9, P(B)= P(A∪B)- P(A∩ )=2/9
  5.4 P(AB)= P(B)P(A∣B)=1/3*1/6=1/18
  P( ∪ )=P( )=1- P(AB)=17/18
  P( )=1- P(B)=2/3
  P( )=P( )+ P( )- P( ∪ )=7/18
  P( ∣ )= P( )/P( )=7/12
  5.5 设甲发芽为事件A,乙发芽为事件B。
  (1)由于是两批种子,所以两个事件相互独立,所以有:P(AB)= P(B)P(B)=0.56
  (2)P(A∪B)=P(A)+P(B)-P(A∩B)=0.94
  (3)P(A )+ P(B )= P(A)P( )+P(B)P( )=0.38
  5.6 设合格为事件A,合格品中一级品为事件B
  P(AB)= P(A)P(B∣A)=0.96*0.75=0.72
  5.7 设前5000小时未坏为事件A,后5000小时未坏为事件B。
  P(A)=1/3,P(AB)=1/2, P(B∣A)= P(AB)/ P(A)=2/3
  5.8 设职工文化程度小学为事件A,职工文化程度初中为事件B,职工文化程度高中为事件C,职工年龄25岁以下为事件D。
  P(A)=0.1 P(B)=0.5, P(C)=0.4
  P(D∣A)=0.2, P(D∣B)=0.5, P(D∣C)=0.7
  P(A∣D)=
  同理P(B∣D)=5/11, P(C∣D)=28/55
  5.9 设次品为D,由贝叶斯公式有:
  P(A∣D)= =0.249
  同理P(B∣D)=0.112
  5.10 由二项式分布可得:P(x=0)=0.25, P(x=1)=0.5, P(x=2)=0.25
  5.11 (1) P(x=100)=0.001, P(x=10)=0.01, P(x=1)=0.2, P(x=0)=0.789
  (2)E(X)=100*0.001+10*0.01+1*0.2=0.4
  5.13 答对至少四道题包含两种情况,对四道错一道,对五道。
  C54 C65 =1/64
  5.14 由泊松分布的性质有:
  P(X=1)= ,P(X=2)= ,可得 =2
  P(X=4)=2/3e
  5.15
  所以,当k= -1和k= 时P(x=k)最大。
  5.16 (1)P( >2)= P(x>2)+ P(x<-2)= (0.5)+1- (2.5)=0.6977
  由于N(3,4)关于均值3对称,所以P(x>3)=0.5
  5.17 P(120<x<200)=P(
  ,
  5.18 (1)
  (2)
  第七章 练习题参考答案
  7.1 (1)已知 =5,n=40, =25, =0.05, =1.96
  样本均值的抽样标准差 = =
  (2)估计误差(也称为边际误差)E= =1.96*0.79=1.55
  7.2(1)已知 =15,n=49, =120, =0.05, =1.96
  (2)样本均值的抽样标准差 = = 2.14
  估计误差E= =1.96* 4.2
  (3)由于总体标准差已知,所以总体均值 的95%的置信区间为:
  =120 1.96*2.14=120 4.2,即(115.8,124.2)
  7.3(1)已知 =85414,n=100, =104560, =0.05, =1.96
  由于总体标准差已知,所以总体均值 的95%的置信区间为:
  =104560 1.96* 104560 16741.144即(87818.856,121301.144)
  7.4(1)已知n=100, =81,s=12, =0.1, =1.645
  由于n=100为大样本,所以总体均值 的90%的置信区间为:
  =81 1.645* 81 1.974,即(79.026,82.974)
  (2)已知 =0.05, =1.96
  由于n=100为大样本,所以总体均值 的95%的置信区间为:
  =81 1.96* 81 2.352,即(78.648,83.352)
  (3)已知 =0.01, =2.58
  由于n=100为大样本,所以总体均值 的99%的置信区间为:
  =81 2.58* 81 3.096,即(77.94,84.096)
  7.5(1)已知 =3.5,n=60, =25, =0.05, =1.96
  由于总体标准差已知,所以总体均值 的95%的置信区间为:
  =25 1.96* 25 0.89,即(24.11,25.89)
  (2)已知n=75, =119.6,s=23.89, =0.02, =2.33
  由于n=75为大样本,所以总体均值 的98%的置信区间为:
  =119.6 2.33* 119.6 6.43,即(113.17,126.03)
  (3)已知 =3.419,s=0.974,n=32, =0.1, =1.645
  由于n=32为大样本,所以总体均值 的90%的置信区间为:
  =3.419 1.645* 3.419 0.283,即(3.136,3.702)
  7.6(1)已知:总体服从正态分布, =500,n=15, =8900, =0.05, =1.96
  由于总体服从正态分布,所以总体均值 的95%的置信区间为:
  =8900 1.96* 8900 253.03,即(8646.97,9153.03)
  (2)已知:总体不服从正态分布, =500,n=35, =8900, =0.05, =1.96
  虽然总体不服从正态分布,但由于n=35为大样本,所以总体均值 的95%的置信区间为:
  =8900 1.96* 8900 165.65,即(8734.35,9065.65)
  (3)已知:总体不服从正态分布, 未知, n=35, =8900,s=500, =0.1, =1.645
  虽然总体不服从正态分布,但由于n=35为大样本,所以总体均值 的90%的置信区间为:
  =8900 1.645* 8900 139.03,即(8760.97,9039.03)
  (4)已知:总体不服从正态分布, 未知, n=35, =8900,s=500, =0.01, =2.58
  虽然总体不服从正态分布,但由于n=35为大样本,所以总体均值 的99%的置信区间为:
  =8900 2.58* 8900 218.05,即(8681.95,9118.05)
  7.7 已知:n=36,当 =0.1,0.05,0.01时,相应的 =1.645, =1.96, =2.58
  根据样本数据计算得: =3.32,s=1.61
  由于n=36为大样本,所以平均上网时间的90%置信区间为:
  =3.32 1.645* 3.32 0.44,即(2.88,3.76)
  平均上网时间的95%置信区间为:
  =3.32 1.96* 3.32 0.53,即(2.79,3.85)
  平均上网时间的99%置信区间为:
  =3.32 2.58* 3.32 0.69,即(2.63,4.01)
  7.8 已知:总体服从正态分布,但 未知,n=8为小样本, =0.05, =2.365
  根据样本数据计算得: =10,s=3.46
  总体均值 的95%的置信区间为:
  =10 2.365* 10 2.89,即(7.11,12.89)
  7.9 已知:总体服从正态分布,但 未知,n=16为小样本, =0.05, =2.131
  根据样本数据计算得: =9.375,s=4.113
  从家里到单位平均距离的95%的置信区间为:
  =9.375 2.131* 9.375 2.191,即(7.18,11.57)
  7.10 (1)已知:n=36, =149.5, =0.05, =1.96
  由于n=36为大样本,所以零件平均长度的95%的置信区间为:
  =149.5 1.96* 149.5 0.63,即(148.87,150.13)
  (2)在上面的估计中,使用了统计中的中心极限定理。该定理表明:从均值为 、方差为 的总体中,抽取了容量为n的随机样本,当n充分大时(通常要求 ),样本均值的抽样分布近似服从均值为 ,方差为 的正态分布。
  7.12 (1)已知:总体服从正态分布,但 未知,n=25为小样本, =0.01, =2.797
  根据样本数据计算得: =16.128,s=0.871
  总体均值 的99%的置信区间为:
  =16.128 2.797* 16.128 0.487,即(15.64,16.62)
  7.13 已知:总体服从正态分布,但 未知,n=18为小样本, =0.1, =1.74
  根据样本数据计算得: =13.56,s=7.8
  网络公司员工平均每周加班时间的90%的置信区间为:
  =13.56 1.74* 13.56 3.2,即(10.36,16.76)
  7.14 (1)已知:n=44,p=0.51, =0.01, =2.58
  总体比例 的99%的置信区间为:
  =0.51 2.58 =0.51 0.19,即(0.32,0.7)
  (2)已知:n=300,p=0.82, =0.05, =1.96
  总体比例 的95%的置信区间为:
  =0.82 1.96 =0.82 0.04,即(0.78,0.86)
  (3)已知:n=1150,p=0.48, =0.1,, =1.645
  总体比例 的90%的置信区间为:
  =0.48 1.645 =0.48 0.02,即(0.46,0.5)
  7.15 已知:n=200,p=0.23, 为0.1和0.05时,相应的 =1.645, =1.96
  总体比例 的90%的置信区间为:
温馨提示:答案为网友推荐,仅供参考
相似回答