线性回归中,检验回归模型的F统计量,通常与给定的F临界值做比较,这里与F相比较的临界值取为,如果是一元线性回归,则临界值直接取为,这里的参数的含义为:
A.为显著性水平,k为回归模型中自变量的个数,n为样本容量
B.为显著性水平,k为样本容量,n为回归模型中自变量的个数
C.为显著性水平,k为回归模型中自变量的次数,n为样本容量
D.为显著性水平,k为回归模型中自变量的个数,n为回归模型中自变量的次数
A.为显著性水平,k为回归模型中自变量的个数,n为样本容量
B.为显著性水平,k为样本容量,n为回归模型中自变量的个数
C.为显著性水平,k为回归模型中自变量的次数,n为样本容量
D.为显著性水平,k为回归模型中自变量的个数,n为回归模型中自变量的次数
利用VOLAT.RAW中的数据。
(i)证实sp500=log(sp500)和lip=log(ip)看来都包含了单位根。利用含四阶滞后变化的DF检验,在含和不含线性时间趋势的情况下分别进行检验。
(ii)做1sp500对lip的简单回归。评论:统计量和R的大小。
(iii)利用第(ii)部分的残差检验Isp500和lip是否协整。利用标准的DF检验和包含两阶滞后的ADF检验。你得到什么结论?
(iv)在第(ii)部分的回归中添加一个线性时间趋势,并利用第(iii)部分同样的检验来检验协整关系。
(v)看来股票价格与真实经济活动之间有长期均衡关系吗?
使用PNTSPRD.RAW中的数据。
(i)变量sprdcvr是一个二值变量,若在大学篮球比赛中实际分数差距超过拉斯维加斯让分,则此变量取值1。sprdcvr的期望值(比方说u)表示在一场随机抽取的比赛中分差超过让分的概率。在10%的显著性水平上相对于H1:μ≠0.5检验H0:μ=0.5,并讨论你的结果。(提示:将sprdcvr只对一个截距项进行回归便得到一个r统计量,利用这个统计量很容易完成。)
(ii)553个样本中有多少场比赛是在中立场地进行的?
(iii)估计线性概率模型
并以通常的形式报告结论。(报告通常的标准误和异方差-稳健的标准误。)哪个变量在实际上和统计上都是最显著的?
(iv)解释为什么在原假设下,模型中不存在异方差性。
(v)利用通常的F统计量检验第(iv)部分的原假设,你得到了什么结论?
(vi)给定上述分析,你会不会认为,利用赛前可利用的信息,有可能系统地预测拉斯维加斯让分能否实现?
本题需要使用1993年的数据,尽管你仍需要首先获得谋杀率的滞后值mrdrte-1.
(i) 将mrd rte对exec和une lTY进行回归。exec的系数和:统计量是多少?这一回归能为死刑的震慑作用提供什么证据吗?
(ii)1993年得克萨斯州报告的死刑人数有多少?(实际上,这是当年和过去两年死刑人数之和。)这个人数与其他州相比如何?在第(i)部分的回归中增加表示得克萨斯州的虚拟变量。它的t统计量异常之大吗?由此看来,得克萨斯看上去是“异常数据”吗?
(iii)在第(i)部分的回归中增加谋杀率的滞后变量。及其统计显著性又有何变化?
(iv)在第(ii)部分的回归中,得克萨斯看上去是“异常数据”吗?在回归中去掉得克萨斯对有何影响?
利用BARIUM.RAW中的数据。
(i)用前119次观测(即不包含1988年的最后12个月观测),估计线性趋势模型。这个回归的标准误是什么?
(ii)同样用除了最后12个月以外的所有数据,估计chnimp的一个AR(1)模型。把这个回归的标准误与第(i)部分中的标准误相比较。哪一个模型提供了更好的样本内拟合?
(iii)用第(i)和第(ii)部分中的模型计算1988年12个月的提前一期预测误差。(每个方法都应该得到12个预测误差。)计算并比较这两种方法的RMSE和MAE。就样本外提前一期预测而言,哪种方法效果更好?
(iv)在第(i)部分的回归中添加月度虚拟变量。它们是联合显著的吗?(当我们检验联合显著性时,不必担心误差中轻度的序列相关。)
(i)利用表13-1中同样的变量估计kids的一个泊松回归模型。解释y82的系数。
(ii)保持其他因素不变,黑人妇女和非黑人妇女在生育上的估计百分数差异是多少?
(iii)求σ。有过度散布和散布不足的证据吗?
(iv)计算泊松回归中的拟合值和作为kidsi和kidsi之相关系数平方的R2。并与线性回归模型中的R2相比较。
本题要用到TRAFFIC2.RAW中的数据。加州1981年至1989年交通事故的这些月度观测在第10章计算机习题11中曾被使用过。
(i)利用标准的迪基-富勒回归, 检验Itotacc, 是否具有单位根。在2.5%的显著性水平上, 你能拒绝单位根的存在吗?
(ii)现在,在第(i)部分的检验中增加两个滞后变化,并计算增广迪基-富勒检验。你得到什么结论?
(iii)在第(ii) 部分的ADF回归中增加一个线性时间趋势变量。现在情况又将如何?
(iv)根据第(i) 部分至第(ii) 部分的结论, 你认为对I to tacc, 的最好刻画是:一个Ⅰ(1)过程还是一个含有线性时间趋势的Ⅰ(O)过程?
(v)在一个ADF回归中, 利用两个滞后项来检验致死交通事故百分数pre fat是否存在单位根。在此情形中,包含一个线性时间趋势与否是否有关系?
A.x与y线性关系显著
B.x与y线性关系不显著
C.x与y线性关系是否显著无法判断
D.以上说法都不对
但比其报告回归中的观测更加有用)。
(i)分别求男女相貌在一般水平之上的比例。相貌在一般水平之上和之下的人哪个更多?
(ii)检验假设:男女相貌在一般水平之上的总体比例相同。报告女人比例更高的单侧P值。(提示:估计一个简单的线性概率模型最容易。)
(iii)现在针对男女分别估计模型
并以通常方式报告结果。在两种情形中解释belavg的系数。用语言解释假设H0:β1=0相对H1:β1<0的含义,并分别求出P值。
(iv)有一般相貌之上的女人比相貌一般的女人工资更高的充分证据吗?请解释。
(v) 对男人和女人都增加解释变量educ, exper,experz,union,goodhlth,black,married, south,bigcity,smllcity和service。“相貌”变量的影响有重要变化吗?