统计学实务(第5版)
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

2.1 统计数据分类

2.1.1 定性数据和定量数据

在统计学中,根据数据反映的测量水平,可把数据区分为名称数据(定类数据)、顺序数据(定序数据)、等距数据(定距数据)和比率数据(定比数据)四种类型。

(1)定类数据(Nominal):表示个体在属性上的特征或类别上的不同变量,仅仅是一种标志,没有序次关系。例如,“性别”,“男”编码为1,“女”编码为2。

(2)定序数据(Ordinal):用数字表示个体在某个有序状态中所处的位置,不能做四则运算。例如,“受教育程度”,文盲半文盲=1,小学=2,初中=3,高中=4,大学=5,硕士研究生=6,博士及其以上=7。

(3)定距数据(Interval):具有间距特征的变量,有单位,没有绝对零点,可以做加减运算,不能做乘除运算。例如,温度。

(4)定比数据(Ratio):数据的最高级,既有测量单位,也有绝对零点,如职工人数、身高。

名称变量不说明事物与事物之间的差异的大小和先后。顺序变量可以就事物的大小多少按照次序对事物进行排列。等距变量具有相等的单位,能表明量的相对大小。它观测数据的单位是相等的,但是零点是相对的。比率变量除了具有量的大小、相等单位,还有绝对零点。它的数据可以进行加减乘除运算。

通常在统计实践中,统计数据简单分为两种基本类型:定性数据和定量数据。

定性数据是指非数值类别的数据(定性数据有时也称为分类数据)。

定量数据代表一定的数量和尺度,它是有数值的。

例如,眼睛颜色属于定性数据,因为眼睛颜色分为蓝色、棕色、淡褐色等。又如,冰激凌的口味、雇员的姓名、动物的性别及电影和餐馆的等级,如不好、一般、好、非常好。

定量数据,如运动员在比赛中跑步的时间、大学毕业生的收入,以及不同班级的学生人数等。

2.1.2 连续数据和离散数据

定量数据又可以进一步分为连续数据和离散数据。

连续数据是指数据能够在一个给定的区间内取任何一个值,相邻两个数值可作无限分割,只能用测量或计量方法取得。

离散数据是指数据只能够取自然数或整数单位,一般用计数方法取得。

连续数据,如一个人的体重可以是零到几百克中的任何一个值,所以表示体重的数据是连续的。

离散数据,如班里同学的学号是离散的,因为学号必须是整数。鞋子的尺码也是离散的数据,因为它只包含整数和半整数值。

2.1.3 横截面数据和面板数据

横截面数据是在同一时间,不同统计单位相同统计指标组成的数据列。横截面数据是按照统计单位排列的。因此,横截面数据不要求统计对象及其范围相同,但要求统计的时间相同。也就是说,必须是同一时间截面上的数据。

面板数据是横截面数据与时间序列数据综合起来的一种数据类型。其有时间序列和横截面两个维度,当这类数据按两个维度排列时,是排在一个平面上的,与只有一个维度的数据排在一条线上有着明显的不同,整个表格像一个面板,所以把“Panel Data”译作“面板数据”。

时间序列数据是指在不同时间点上收集到的数据,这类数据反映了某一事物、现象等随时间的变化状态或程度。