Stata入门 - 直方图


今天我会为大家介绍如何用Stata绘制直方图. 直方图是统计里很常用的一种图形. 我们可以用它来说明某一个变量的数量, 或者所占的百分比, 又或者是密度. 如果你是一个Stata的初学者, 建议先从使用下拉菜单来画图. 当你逐渐对程序语言熟悉后, 可以尝试自己直接输入程序语言. 为了说明怎样在Stata里画直方图, 我会用Stata里自带的auto.dta数据库来作为例子, 首先在命令窗口输入:

sysuse auto

然后在下拉菜单处, 选择图形(G) > 直方图. 在弹出的窗口中, 我们可以选择你要展示的变量, 以及Y轴对应的数据: 是密度, 频率, 还是百分比?我选择了rep78作为要研究的变量, 同时, 因为这是一个类别变量, 所有我们要选择离散型数据. 在对应的Y轴区域, 我们可以选择密度, 频率等等. 我在这里选择的是百分比, 也就是看不同类别的修理记录在74个观察样本中各自所占的比例:

然后点击确定, 你就会得到如下图所示的直方图:

我们可以看到在rep78的五个类别中, 修理记录为3的车所占的比例是最高的, 接近45%, 其次是类别4, 所占比例最低的是类别1, 只有不到5%. 直方图的一个最大的优势是可以直观清晰地向我们展示某一个变量的分布情况.

也许你已经注意到了在Stata的结果输出窗口, 对应的程序语言是:

histogram rep78, discrete percent

就像文中开头提到的那样, 你既可以使用下拉菜单来画图, 也可以手动输入. 手动输入提供了更多的灵活性, 同时也会更便捷, 前提是你对这些语言很熟悉, 就可以熟能生巧了.


想了解Stata的更多画图技巧吗? 可以来看看这本A Visual Guide to Stata Graphics



© 2020 by Survey Design and Analysis Services. 

  • LinkedIn
  • Facebook
  • Twitter
  • YouTube