A.继续收集数据,看样本量增加后模型是否改善
B.考虑是否遗漏了其他关键X,再扩大范围重新收集数据
C.进行残差诊断,考虑对模型的删减和改进
D.安排试验设计,进一步确认X对Y的影响是否显著
(i)在方程(11.27)中添加一个线性时间趋势。在一阶差分方程中,时间趋势是必要的吗?
(ii)从式(11.27)中去掉时间趋势并添加变量ww2和pil(不要对虚拟变量进行差分)。这两个变量在5%的水平上是显著的吗?
(iii)用第(ii)部分中的模型估计LRP并求出其标准误。与从式(10.19)得到的结果相比较,在式(10.19)中gfr和pe是以水平值形式而非差分形式出现的。
A.直线相关要求双变量均服从正态分布
B.回归对Y要求较为严格,要求为正态分布变量
C.观察数量之间的依存关系用相关
D.观察数量之间的相关程度用回归
E.同一资料,相关系数与回归系数的假设检验等价
A.当X2不变时,X1每变动一个单位Y的平均变动
B.当X1不变时,X2每变动一个单位Y的平均变动
C.当X1和X2都保持不变时,Y的平均变动
D.当X1和X2都变动一个单位时,Y的平均变动
本题需要使用ELEM 94-95中的数据, 也可参见计算机习题C 4.10。
(i) 利用所有数据, 将lavg sal对bs, lenrol, Istaff和lunch进行回归。报告bs的系数及其常用标准误和异方差-稳健标准误。你对的经济显著性和统计显著性得到什么结论?
(ii)现在去掉四个bs>0.5的观测,即平均福利(假设)占平均薪水50%以上的观测。bs的系数又是多少?利用异方差-稳健标准误来判断,它在统计上显著吗?
(iii)验证bs>0.5的四个观测分别为68、1127、1508和1670。为它们各定义一个虚拟变量。(你可以称它们为d68、d1127、d 1508和d 1670.) 把它们添加到第(i) 部分的回归中, 验证其他变量的OLS系数及其标准
误与第(ii)部分中的结果相同。在5%的显著性水平上,这四个虚拟变量中哪个变量的t统计量在统计上显著不等于0?
(iv)在这个数据集中,验证第(iii)部分回归中具有最大学生化残差(该虚拟变量的t统计量最大)的数据点对OLS估计值具有很大的影响。(即利用除去具有最大学生化残差的数据点之外的所有观测进行OLS回归。)依次去掉bs>0.5的每个观测都具有重要影响吗?
(v) 即便在大样本中, 就OLS对单个观测的敏感性而言, 你有何结论?
(vi) 在第(iji) 部分, 验证LAD估计量对包含这些观测不是很敏感。