点击查看:2011年中级经济师考试工商管理预习精讲班教辅汇总
第四节 数据分析
一、基础统计分析
(一)描述统计分析
1.集中趋势的测度
集中趋势是指一组数据向其中心值靠拢的倾向,测度集中趋势就是确定数据一般水平的代表值或中心值。集中趋势的测量有三个常用的指标:
(1)众数,是一组数据中出现次数最多的变量值。
对数据确定众数时,只需把数据整理后列出频数(出现次数)分布表,频数最多的那一组为众数。从分布图形来看,众数应对应于图形最高点。有些情况下数据分布可能表现为双众数,甚至多众数,也有另一种情况,即没有众数(均匀分布)。众数的基本思想,是用来反映一组数据若存在聚中趋势,则在数据的中心,变量值出现的频数较高,众数就是这一位置的代表值。
众数的一个突出特点是它不受极端数值的影响。
(2)中位数,是一组数据排序后处于中间位置的变量值,是一组数据的中点,即高于和低于它的数据各占一半。
(3)均值,是集中趋势的主要测度值,用于反映一组数值型数据的一般水平。主要包括算术平均数、调和平均数和几何平均数。
例子:十名学生的成绩
100 |
80 |
95 |
87 |
99 |
79 |
80 |
95 |
92 |
95 |
众数:95(出现3次) 中位数:
79 |
80 |
80 |
87 |
92 |
95 |
95 |
95 |
99 |
100 |
(92+95)÷2=93.5(如果数据是奇数个,则中位数就是中间那个数据)
平均数:
(79+80+80+87+92+95+95+95+99+100)/10=90.2
2.离散程度的测度
数据的离散程度是数据分布的另一重要特征,它是指各变量值远离其中心值的程度,所以也叫离中趋势。
离中趋势是经过综合与抽象后对数据一般水平的概括性描述,它对数据的代表性取决于数据的离散程度,离散程度小代表性就好,反之代表性就差。
(1)极差,也称全距,是一组数据中最大值与最小值之差。
极差是描述数据离散程度的最简单的方法,表明数据的分布范围。它计算简单,易于理解。但是极差由两端数值所决定,不能反映中间数据的分布离散状况。
(2)平均差,也叫平均离差,是各变量值(Xi)与其均值( )离差绝对值的平均数:
平均差反映了所有数据与均值的平均距离。平均差越小,说明数据离散程度越小。
(3)方差和标准差。方差是一组数据中各变量值与均值离差平方的平均数。方差的平方根叫标准差。方差与标准差是描述数据分布特征的重要的统计量,它们是反映数值型数据离散程度最主要、最常用的方法。
根据总体数据和样本数据计算方差及标准差时,计算公式略有不同。
式中Xi是数值序列中的单个数值, 是这组数值的平均值,N是总体数值的个数,n是样本数值的个数。
计算样本方差与标准差时之所以与总体不同,是因为计算样本方差或标准差时,是要把它作为总体方差或标准差的估计量,统计上对估计量要求满足一些条件(一致性、无偏性、有效性),为满足无偏性条件,样本方差计算时,分母要用n-1,而不是n。
【例题10·单选题】(2009年)某产品在5个地区的销售量分别为1500、2000、1000、3000、5000。则该销售量的极差为( )。
A.1000 B.1500 C.2000 D.4000
[答疑编号716030501]
『正确答案』D
『答案解析』极差也称全距,是一组数据中最大值与最小值之差。本题中最大值为5000,最小值为1000,所以极差=5000-1000=4000。