Stata 入门 - 线性回归

Updated: Jun 22

今天我将为大家介绍如何用Stata进行线性回归. 使用Stata的其中一个便利之处在于你可以使用它的下拉菜单选择统计方法. 如果你熟悉Stata的程序语言, 你可以直接在命令窗口输入代码, 也可以得到相同的结果.


我会以auto这个数据作为示例. 首先, 我们将数据读入Stata:

在右上侧的变量窗口, 我们可以看到这个数据库的所有变量; 在左侧我们可以看到刚刚输入的语言.


接下来,我们就要进行线性回归了. 我们假设因变量和自变量之间存在线性关系. 我们使用下拉菜单来选择自变量和因变量. 如果你对于程序语言非常熟悉, 你可以直接在命令窗口手动输入,:

当然, 你也可以像这样从下拉菜单中选择你想要的统计模型. 在下拉菜单中, 统计(S) > 线性模型及相关 > 线性回归:

接着, 我们会看到如下窗口出现. 选择mpg作为因变量, 自变量选择weightforeign (请注意, 你也可以选择其他变量作线性回归):

然后点击"确定", 你会在主窗口看到Stata的输出结果. 同时, 你也可以看到这个线性模型在Stata中对应的程序语言: regress mpg weight foreign


以下是Stata的分析结果, 这是两个表格, 分别表示模型整体的显著性和单个变量的显著性结果. 我们可以通过表格里的一些统计量来对模型做出一些决断, 从而可以进一步看出这个线性模型是否合适:

比如, 我们可以看到线性模型中的各参数, weightforeign在线性模型中的系数是-0.0066和-1.6500, 常数项是41.6797. 我们再来看p值, 在这个假设检验中, 用来判定变量是否显著的参数是0.05. 其中, weight对应的p值小于0.05, 而foreign对应的p值大于0.05, 所以我们可以得出结论, 在这个假设检验中, 变量weightmpg有显著性影响, 而foreign的影响则并不显著. 而如果我们观察整个模型, R平方是0.6627, 均方根误差是3.4071. 对于一个统计模型, R平方越接近1, 均方误差越接近0, 说明这个模型拟合得越好. 所以这个模型还有待于改善, 比如, 除了做线性模型的假设, 我们还可以做多项式拟合等其他拟合.

© 2020 by Survey Design and Analysis Services. 

  • LinkedIn
  • Facebook
  • Twitter
  • YouTube