Stata入门 - 折线图

Stata入门 - 直方图这篇文章里我为大家介绍了如何用Stata画直方图. 今天, 我会为大家介绍如何用Stata绘制另一种实用性很强的统计图 - 折线图. 折线图之所以在统计分析中利用率很高, 是因为它可以简洁明了地显示数据的走向, 尤其是和时间序列有关的变量, 我们可以通过折线图直观地判断其发展趋势.

同样地, 我会为大家介绍如何使用下拉菜单绘图, 这对于初学者来说是再好不过的选择. 当你对程序语言慢慢熟悉后, 选择直接在命令窗口输入语言会节省不少时间, 同时也有更多的灵活性.


为了举例说明, 我会使用uslifeexp.dta这个数据库. 这个数据库记录了从1900年到1999年美国人寿命长短.


首先, 在命令窗口输入:

sysuse uslifeexp

然后在下拉菜单处选择: 图形(G) > 二维图(散点图, 折线图). 然后点击创建:

接着会弹出一个窗口, 在选择绘图类别和类型处选择基本图, 在基本图类型里选择折线图. Y变量选择le_w, X变量选择year. 然后点击接受:

然后点击确定, Stata会绘制出如下图所示的折线图:

这个折线图展示的是从1900年到1999年美国白人的寿命变化. 可以看到从1900到1945年间, 除了在1920年之前的大幅下滑, 虽然有一些上下的波动, 但是整体是呈上升趋势. 1945年之后就呈稳定上升趋势.

在这个折线图的基础上, 我们可以增加另一个折线图. 操作方法和之前一样, 你可以选择一个可以和之前的变量le_w作比较的变量作为X变量, 我选择的是le_b, 也就是黑人的寿命. 点击确认后, Stata就绘制出了如下的图形:

这幅图所包含的信息量还是很大的. 从图中我们可以看出黑人和白人的寿命在这接近100年间的变化趋势基本一致, 然而黑人的寿命却明显短于白人; 以及在1920年前的那一次大幅下降, 和当时的第一次世界大战应该有着密不可分的关系; 仔细观察代表黑人寿命的红线, 我们还可以看到在1920到1930年间, 还有一个明显的下滑, 也和当时的历史事件有着密切的关系.


折线图通过清晰地展示某一变量的变化趋势, 可以有效地协助我们进行数据分析, 尤其是分析和时间序列有关的变量. 这也是为什么折线图在统计分析中备受青睐的原因, 用一条起起伏伏高高低低的折线来把一个复杂的世界展现在人们的眼前, 又有谁会不喜欢呢?


想了解用Stata画图的更多知识 可以来看看这本A Visual Guide to Stata Graphics

© 2020 by Survey Design and Analysis Services. 

  • LinkedIn
  • Facebook
  • Twitter
  • YouTube