对美国所有家庭构成的总体考虑一个家庭储蓄方程:
其中,inc表示家庭收入,hhsize表示家庭规模,educ表示户主受教育年数,而age表示户主的年龄。假定E(ulinc,hhsize,educ,age)=0。
(i)假设样本只包括户主年龄在25岁以上的家庭。如果我们对这样一个样本使用OLS,我们能得到βj的无偏估计量吗?请解释。
(ii)现在假设我们的样本只包括无子女的已婚夫妇。我们能估计储蓄方程中的所有参数吗?我们能估计哪些参数?
(iii)假设我们从样本中排除掉储蓄超过每年25000美元以上的家庭。OLS能得到βj的一致估计量吗?
设X1,X2,···,Xn是来自正态总体X~N(μ,σ2)的一个样本,适当选择常数C使为σ2的无偏估计。
A.容许误差、总体标准差、总体率π
B.一类错误的概率α、总体标准差、总体均数
C.容许误差、总体标准差、一类错误的概率α
D.容许误差、总体标准差、总体均数
E.一类错误的概率α、二类错误的概率β、总体参数置信区间
A.最大似然估计是似然函数最大所对应的参数作为估计
B.最大似然估计一定是最小方差无偏估计
C.最大似然方程是最大似然估计的充分条件
D.高斯白噪声中未知常数的最大似然估计为样本均值
利用PHILLIPS.RAW中的数据。
(i)用直至1997年的数据估计教材(18.48)和(18.49)中的模型。参数估计值与教材(18.48)和教材(18.49)中的结果相比有很大不同吗?
(ii)用新方程预测unem1998,小数点后保留两位数。哪个方程预测得更好?
(ii)我们在正文中讨论过,用教材(18.49)预测unem1998为4.90.把它与利用直至1997年的数据得到的预测相比较。多用一年数据求得的参数估计值能给出更好的预测吗?
(iv)用教材(18.48)中估计的模型求出unem的提前两期预测值。即利用α=1.572,p=0.732,h=2时的教材方程(18.55)预测unem与把unem1997=4.9代入教材(18.48)所得到的提前一期预测值相比,哪一个更好?
A.节省费用和时间,调查效率较高
B.不仅可以估计总体参数,同时也可以估计各层的参数
C.方差估计比较复杂
D.抽样误差比较大
E.样本在总体中分布比较均匀,可以降低抽样误差
假设年收入和大麻的消费量由SEM
同时决定,其中fine表示对拥有少量大麻的人员所征收的特定罚款;prison是一个虚拟变量,当一个人因为拥有个人使用大麻而服刑时,该变量为1。假定fine和prison随居民所在的区域(县)不同而改变。
(i)如果educ,ie和prison是外生的,为了得到βj的一致估计,你还需要对系统内的参数作哪些假设?
(ii)假定这些参数已被识别,详细解释你将如何估计βj。
(iii)上述估计有过度识别的问题吗?
A.每一台机器单独抽取多个子组连续样本,使用子组极差的平均值建立各自的控制限
B.多台机器各自抽取子组连续样本,计算出各个子组的极差,合在一起计算极差的平均值,然后使用这个平均值建立针对多台机器的通用控制限
C.多台机器的样本混和在一起,然后抽取多个子组的连续样本,建立起通用控制限
D.单台机器和多台机器的抽样方法无关紧要
本题利用401KSUBS.RAW中的数据。
(i) 计算样本中nettfa的平均值、标准差、最小值和最大值。
(ii) 检验假设平均nettfa不会因为401(k) 资格状况而有所不同, 使用双侧对立假设。估计差异的美元数量是多少?
(iii)根据计算机习题C7.9的第(ii)部分,e401k在一个简单回归模型中显然不是外生的,起码它随着收入和年龄而变化。以收入、年龄和e40lk作为解释变量估计nettfa的一个多元线性回归模型。收入和年龄应该以二次函数形式出现。现在,估计401(k)资格的美元效应是多少?
(iv) 在第(iii) 部分估计的模型中, 增加交互项e401k·(age-41) 和e401k·(age-41)2 。注意样本中的平均年龄约为41岁,所以在新模型中,e401k的系数是401(k)资格在平均年龄处的估计效应。哪个交互项显著?
(v)比较第(iii)和(iv)部分的估计值,401(k)资格在41岁处的估计效应差别大吗?请解释。
(vi) 现在, 从模型中去掉交互项, 但定义5个家庭规模虚拟变量:fsize l, j size2,f size 3, f size 4和f size 5。对有5个或5个以上成员的家庭, fsize 5等于1。在第(iii) 部分估计的模型中, 增加家庭规模虚拟变量, 记得选择一个基组。这些家庭虚拟变量在1%的显著性水平上显著吗?
(vii) 现在, 针对模型
在容许截距不同的情况下, 做5个家庭规模类别的邹至庄检验。约束残差平方和SSR, 从第(vi) 部分得到,因为那里回归假定了相同斜率。无约束残差平方和SSRUR=SSR1+SSR2 +…+SSR5 , 其中SSRf是从仅用家庭规模f估计的方程中得到的残差平方和。你应该明白,无约束模型中有30个参数(5个截距和25个斜率),而约束模型中有10个参数(5个截距和5个斜率)。因此,带检验的约束个数是q=20,而且无约束模型的df为9275-30=9245。