考虑简单回归模型令z为x的二值工具变量。运用式(15.10),ⅣV估计量,可以写成:其中,是zi=0的那
考虑简单回归模型
令z为x的二值工具变量。运用式(15.10),ⅣV估计量,可以写成:其中,是zi=0的那部分样本中yi和xi的样本平均值,而是zi=1的那部分样本中yi和xi的样本平均值。该估计量称为群组估计量, 它是由沃尔德(Wald, 1940) 最先提出。
考虑简单回归模型
令z为x的二值工具变量。运用式(15.10),ⅣV估计量,可以写成:其中,是zi=0的那部分样本中yi和xi的样本平均值,而是zi=1的那部分样本中yi和xi的样本平均值。该估计量称为群组估计量, 它是由沃尔德(Wald, 1940) 最先提出。
(x)=x2或g(x)=log(1+x2) 。定义zi=g(xi)定义一个斜率估计量为
在近来的一篇论文中,埃文斯和施瓦布(EvansandSchwab,1995)研究了就读于天主教高中对将来读大学的概率所产生的影响。为具体起见,令college为二值变量,如果读大学则等于1,否则为0。令CahHS也为二值变量,如果就读于天主教高中则等于1.一个线性概率模型是:
college=β0+β1CathHS+其他因素+u
其中其他因素包括性别、种族、家庭收入和父母的受教育程度。
(i)为什么CathHS可能与u相关?
(ii)埃文斯和施瓦布拥有关于每个学生在大二时进行的标准化测验成绩数据。我们用这些变量能做些什么,以改进就读于天主教高中在其余条件不变情况下的估计值?
(iii)令CathRel为二值变量,若学生是天主教徒则等于1。讨论它成为前面方程中CathHS的一个有效的ⅣV所需要的两个要求。其中哪个可加以检验?
(iv)不足为奇,作为天主教徒对是否就读于一所天主教高中有显著的影响。你认为CathRel作为CathHS的工具变量令人信服吗?
为另一种形式:斜率与原来相同,但截距和误差有所不同,并且新的误差期望值为零。
考虑下面的联立方程模型:
,其中P和Q是内生变量,X是外生变量,u是随机误差项。
(1)求简化形式回归方程;(2)判定哪个方程是可识别的(恰好或过度);
(3)对可识别方程,你将用哪种方法进行估计,并简述基本过程。
考虑一个非常简单的只含有一个不随时间变化回归量的非观测效应面板数据模型:
令λ为代表随机效应的变换参数:这是一个代数特征明显的练习,因此是否知道或是需要估计λ并不重要。
数据集401KSUBS.RAW包含了净金融财富(nenfa)、被调查者年龄(age)、家庭年收入(inc)、家庭规模(fsize)方面的信息,以及参与美国个人的特定养老金计划方面的信息。财富和收入变量都以千美元为单位记录。对于这里的问题,只使用无子女已婚者数据(marr=1,fsize=2)。
(i)数据集中有多少无子女已婚夫妇?
(ii)利用OLS估计模型
nettfa=β0+β1inc+β2age+u;
并以常用格式报告结果。解释斜率系数。斜率估计值有何惊人之处吗?
(iii)第(ii)部分的回归截距有重要意义吗?请解释。
(iv)在1%的显著性水平上,针对H0:β2>1检验H0: β2=1,求出p值。你能拒绝H0吗?
(V)如果你做一个nettfa对inc的简单回归,inc的斜率估计值与第(ii)部分的估计值有很大不同吗?为什么?
使用PNTSPRD.RAW中的数据。
(i)变量sprdcvr是一个二值变量,若在大学篮球比赛中实际分数差距超过拉斯维加斯让分,则此变量取值1。sprdcvr的期望值(比方说u)表示在一场随机抽取的比赛中分差超过让分的概率。在10%的显著性水平上相对于H1:μ≠0.5检验H0:μ=0.5,并讨论你的结果。(提示:将sprdcvr只对一个截距项进行回归便得到一个r统计量,利用这个统计量很容易完成。)
(ii)553个样本中有多少场比赛是在中立场地进行的?
(iii)估计线性概率模型
并以通常的形式报告结论。(报告通常的标准误和异方差-稳健的标准误。)哪个变量在实际上和统计上都是最显著的?
(iv)解释为什么在原假设下,模型中不存在异方差性。
(v)利用通常的F统计量检验第(iv)部分的原假设,你得到了什么结论?
(vi)给定上述分析,你会不会认为,利用赛前可利用的信息,有可能系统地预测拉斯维加斯让分能否实现?
利用HPRICE1.RAW中的数据。
(i)估计模型
并按通常的格式报告你的结果,包括回归标准误。当我们代入lotsize=10000,sqrft=2300和bdrms=4时,求出预测价格,将这个价格四舍五入到美元。
(ii)做一个回归,使你能得到第(i)部分中预测值的一个95%的置信区间。注意,由于四舍五入的误差,你的预测将多少有些不同。
(iii)令price0为具有第(i)部分和第(ii)部分所述特征的住房的未知未来售价。求出price0的一个95%的置信区间,并对这个置信区间的宽度进行评论。
A.x=80, y=30, z=50
B.x=50, y=80, z=80
C.x=30, y=50, z=80
D.x=50, y=30, z=30