令math10表示密歇根州高中学生在一次标准化数学考试中的及格百分比(也可参见例4.2)。我们感兴趣的是估计每个学生的支出对其数学成绩的影响。一个简单的模型是
其中,poverty表示贫困生的比例。变量Inchprg表示学校有资格享受联邦政府午餐资助计划的学生比例。为什么它是povert的一个合适的代理变量?
(ii)下表包含了有和没有Inchprg作为解释变量时的OLS估计值。解释为什么支出对mathl0的影响在列(2)比在列(1)要低。列(2)中的这种影响在统计上仍大于1吗?
(iii)在其他条件相同的情况下,越大的学校通过率越低吗?请解释。
(iv)解释列(2)中Inchprg的系数。
(v)你如何理解R从列(1)到列(2)的显著提高?
假设年收入和大麻的消费量由SEM
同时决定,其中fine表示对拥有少量大麻的人员所征收的特定罚款;prison是一个虚拟变量,当一个人因为拥有个人使用大麻而服刑时,该变量为1。假定fine和prison随居民所在的区域(县)不同而改变。
(i)如果educ,ie和prison是外生的,为了得到βj的一致估计,你还需要对系统内的参数作哪些假设?
(ii)假定这些参数已被识别,详细解释你将如何估计βj。
(iii)上述估计有过度识别的问题吗?
(i)在方程(11.27)中添加一个线性时间趋势。在一阶差分方程中,时间趋势是必要的吗?
(ii)从式(11.27)中去掉时间趋势并添加变量ww2和pil(不要对虚拟变量进行差分)。这两个变量在5%的水平上是显著的吗?
(iii)用第(ii)部分中的模型估计LRP并求出其标准误。与从式(10.19)得到的结果相比较,在式(10.19)中gfr和pe是以水平值形式而非差分形式出现的。
令mvp, 表示工人的边际价值产品, 即企业产品的价格与该工人边际产品的乘积。假定
其中, 解释变量包括受教育程度、工作经历等, 而minwaget是第1个人适当的最低工资。用log(mvpt)和
(i)考虑静态非观测效应模型
其中,enrolit表示学区总注册学生人数,lunchit表示学区中学生有资格享受学校午餐计划的百分数。(因此lunchit是学区贫穷率的一个相当好的度量指标。)证明:若平均每个学生的真实支出提高10%,则math4it约改变β1/10个百分点。
(ii)利用一阶差分估计第(i)部分中的模型。最简单的方法就是在一阶差分方程中包含一个截距项和1994~1998年度虚拟变量。解释支出变量的系数。
(iii)现在,在模型中添加支出变量的一阶滞后,并用一阶差分重新估计。注意你又失去了一年的数据,所以你只能用始于1994年的变化。讨论即期和滞后支出变量的系数和显著性。
(iv)求第(iii)部分中一阶差分回归的异方差-稳健标准误。支出变量的这些标准误与第(iii)部分相比如何?
(v)现在,求对异方差性和序列相关都保持稳健的标准误。这对滞后支出变量的显著性有何影响?
(vi)通过进行一个AR(1)序列相关检验,验证差分误差rit=Δuit含有负序列相关。
(vii)基于充分稳健的联合检验,模型中有必要包含学生注册人数和午餐项目变量吗?
A.平均下来,在冬天里,其他条件不变的情况下下雨的可能性会增加30%
B.平均下来,在冬天里,其他条件不变的情况下下雨的可能性会增加0.3%
C.平均下来,在冬天里,其他条件不变的情况下下雨的可能性会增加30个百分点
D.以上都不对
令mvpi表示工人的边际价值产品,即企业产品的价格与该工人边际产品的乘积。假定
其中,解释变量包括受教育程度、工作经历等,而miwagei是第i个人适当的最低工资。用log(mvpi)和log(minwagei)表示log(wagei)。
本题利用401KSUBS.RAW中的数据。
(i) 计算样本中nettfa的平均值、标准差、最小值和最大值。
(ii) 检验假设平均nettfa不会因为401(k) 资格状况而有所不同, 使用双侧对立假设。估计差异的美元数量是多少?
(iii)根据计算机习题C7.9的第(ii)部分,e401k在一个简单回归模型中显然不是外生的,起码它随着收入和年龄而变化。以收入、年龄和e40lk作为解释变量估计nettfa的一个多元线性回归模型。收入和年龄应该以二次函数形式出现。现在,估计401(k)资格的美元效应是多少?
(iv) 在第(iii) 部分估计的模型中, 增加交互项e401k·(age-41) 和e401k·(age-41)2 。注意样本中的平均年龄约为41岁,所以在新模型中,e401k的系数是401(k)资格在平均年龄处的估计效应。哪个交互项显著?
(v)比较第(iii)和(iv)部分的估计值,401(k)资格在41岁处的估计效应差别大吗?请解释。
(vi) 现在, 从模型中去掉交互项, 但定义5个家庭规模虚拟变量:fsize l, j size2,f size 3, f size 4和f size 5。对有5个或5个以上成员的家庭, fsize 5等于1。在第(iii) 部分估计的模型中, 增加家庭规模虚拟变量, 记得选择一个基组。这些家庭虚拟变量在1%的显著性水平上显著吗?
(vii) 现在, 针对模型
在容许截距不同的情况下, 做5个家庭规模类别的邹至庄检验。约束残差平方和SSR, 从第(vi) 部分得到,因为那里回归假定了相同斜率。无约束残差平方和SSRUR=SSR1+SSR2 +…+SSR5 , 其中SSRf是从仅用家庭规模f估计的方程中得到的残差平方和。你应该明白,无约束模型中有30个参数(5个截距和25个斜率),而约束模型中有10个参数(5个截距和5个斜率)。因此,带检验的约束个数是q=20,而且无约束模型的df为9275-30=9245。
现在,我们用它估计一个鱼肉需求函数。
(i)假定每个时期均衡的鱼肉需求方程可写成
所以容许需求在一周中的每一天都有所不同。把价格变量视为内生的,一致地估计需求方程参数还需要什么额外信息?
(ii)变量wave2t和wave3t度量了过去几天的海浪高度。为了在估计需求方程时将wave2t和wave3t用作log(avg prct)的Ⅳ,我们还需要哪两个假定?
(iii)将log(avg prct)对周工作日虚拟变量和两个浪高指标进行回归。wave 2t 和wave 3t 联合显著吗?这个检验的p值是多少?
(iv)现在,用2SLS估计需求方程。需求价格弹性的95%置信区间是什么?所估计的弹性合理吗?
(vi)给定供给方程明显取决于海浪变量,为了估计供给价格弹性,我们需要哪两个假定?
(vii)在log(avg prc) 的约简型方程中,周工作日虚拟变量联合显著吗?你对能够估计供给弹性有何结论?
讨论对的解释及其统计显著性。