Stata里的回归拟合以及样条函数

利用Stata进行回归分析非常方便, 因为Stata除了有常用的拟合命令, 比如线性回归 (linear regression), 多项式回归(polynomial regression)之外, 还有分式多项式(fractional polynomial)以及中位样条(median spline)拟合等等实用的回归方法. 今天我们就要为大家介绍如何用Stata的程序语言来画回归曲线. Stata回归拟合中常用的命令有: lfit, qfit, fpfit, mband, mspline, 和lowess. 我们此次示例用到的数据库是allstates.dta, 这个数据库也是可以从网上下载的.


我们用来做拟合的两个变量是ownhomepcturban80, 分别代表拥有住房的比例和远离城市的(偏僻)程度. 从直觉上判断, 离城镇越远, 拥有住房的比例越低. 接下来我们会使用不同的拟合方法来探讨二者的关系.


1. 使用lfit做最基本的线性回归拟合

我们用到的命令是:

上图就是我们非常熟悉的线性回归. 通过观察散点图的分布情况, 我们也可以尝试多项式回归, 比如二次拟合; 或者非参数拟合, 比如局部加权回归散点平滑拟合.


2. 一些其他常用的拟合

除了线性拟合, 我们还可以用Stata做二次拟合, 多项式拟合, 局部加权回归散点平滑拟合等常用拟合. Stata的程序命令也很好使用. 比如, 如果想做局部加权回归散点平滑拟合(lowess):

又或者,你想尝试二次拟合(quadratic fit), 或者多项式拟合(polynomial fit):


如上图所示, 你可以把这些拟合曲线都呈现在一幅图里. 在上图中, 我们使用的是分式多项式拟合(fractional polynomial fit)以及局部多项式拟合(local polynomial fit). Stata特有的这两个命令使我们可以尝试更多的拟合方法, 也使得我们的拟合结果增加了许多客观性.

© 2020 by Survey Design and Analysis Services. 

  • LinkedIn
  • Facebook
  • Twitter
  • YouTube