统计数据的整理和显示
1.分类数据的整理与显示 指标:频数与频数分布,比例,百分比,比率 频数分布表:把数据的各个类别及其相应的频数全部列出来就是频数分布或称次数分布,将其用表格的形式表现出来就是频数分布表。 比例是一个总体中各个部分的数量占总体数量的比重 百分比是将比例乘以100而得出 比率是各个不同类别的数量的比值,分母通常取1或100 图示 主要用条形图和圆形图
单选(2004年试题):根据第五次全国人口普查的结果,我国男性占总人口的51.63%,女性占总人口的48.37%,那么人口的性别比为() A, 100:106.74 B, 93.67:100 C, 106.74:100 D, 100:93.67 答案:C 多选(2004年试题):2001年底,我国共有博物馆1458个,其中综合性博物馆769个,历史类博物馆521个,艺术类博物馆57个,自然科技类博物馆19个,其他类型博物馆92个。这一构成应通过绘制()来显示。 A, 条形图 B, 累积频数分布图 C, 圆形图 D, 直方图 E, 折线图 答案:AC
2.顺序数据的整理与显示 除了可以用分类数据的整理及图示方法外,还有累积频数和累计频率。 累积频数:将各类别的频数逐级累加起来,一种方法是从类别顺序的开始一方向类别顺序的最后一方累加频数;另一种方法是从类别顺序的最后一方向类别顺序的开始一方累加频数 累计频率:将各类别的百分比逐级累加起来
3.数值型数据的整理与显示 组距分组的步骤: (1)确定分组组数,经验公式:K= 1+ log10N / log102; (2)对原始资料进行排序; (3)求极差:最大观察值减去最小观察值。 (4)确定各组组距:组距=极差/组数=某组的上限值-该组的下限值 (5)确定组限:组中值=(上限+下限)/ 2 (6)确定各组观察值出现的频数:组距分组遵循“不重不漏”的原则;分组时“上组限不在内”以防止重复。 (7)制作频数分布表 直方图与条形图的区别:前者用面积而后者用条形的长度来表示各类别频数的多少,前者高度与宽度均有意义,前者的各矩形通常是连续排列而后者通常是分开排列。
4统计表 基本结构:表头、行标题、列标题和数字资料 设计要求:科学、实用、简练、美观 要合理安排统计表的结构;表头一般应包括表号、总标题和表中数据的单位等内容;表中的上下两条横线一般用粗线,中间的其他线要用细线,这样使人看起来清楚、醒目;在使用统计表时,必要时可在表的下方加上注释,特别要注意注明资料的来源,以示对他人劳动成果的尊重,并备读者查阅使用
多选(2004年试题):通常情况下,设计统计表要求() A, 没有数字的单元格应空白 B, 左右两边应封口 C, 表中数据一般是右对齐 D, 列标题之间一般用竖线隔开 E, 行标题之间不必用横线隔开 答案:CDE
(三)数据特征的测度
1.集中趋势的测度 众数:一组数据中出现次数最多的变量值;它是一个位置代表值,特点是不受数据中极端值的影响。众数不仅适用于品质数据,也适用于数值型数据。 中位数:是一组数据按一定顺序排序后,处于中间位置上的数值。当数值个数为奇数时,取中间位置的数;当数值个数为偶数时,取中间位置两个数的均值。 它将全部数据等分成两部分,也是一个位置代表值,其特点是不受极端值的影响,在研究收入分配时很有用。 中位数主要用于顺序数据,也适用于数值型数据,但不适用于分类数据。 算术平均数:也称均值,是全部数据的算术平均。它是集中趋势的最主要测度值。 简单均值:等于所有数值相加之和 / 数值个数;加权均值:(各组组中值*各组频数) / 频数之和。 均值是一组数据的重心所在,是数据误差相互抵消后的必然结果,反映出事物必然性的数量特征。其缺点是容易受极端值的影响 几何平均数:将一组中n个数据连乘后再开n次方。是适用于特殊数据的一种平均数,主要用于计算比率或速度的平均。实践中,主要用于计算社会经济现象的平均发展速度
单选(2005年试题) 下列集中趋势测度值中,适用于品质数据的是( )。 A.众数 B.简单算术平均数 C.标准差 D.加权算术平均数 答案:A
单选(2004年试题):以下属于位置平均数的是() A, 几何平均数 B, 算术平均数 C, 众数 D, 极差 答案:C
单选(2004年试题):2003年,某市下辖六个县的棉花种植面积按规模由小到大依次为800公顷、900公顷、1100公顷、1400公顷、1500公顷、3000公顷,这六个县棉花种植面积的中位数是()公顷。 A, 1450 B, 1250 C, 1100 D, 1400 答案:B 解析:变量值一共有6个,偶数个,中位数为最中间两个数的平均数,即第三和第四个数的平均数,为1/2*(1100+1400)= 1250。
2.离散程度的测度 标准差:各变量与其均值离差平方和的平均数的平方根,它是数测量数据离散程度的最主要方法,也是实际中应用最广泛的离散程度测度值。在对社会经济现象进行分析是主要使用标准差。 例:一组5个数据, 1、2、3、4、5,求其标准差。 解:先求均值等于(1+2+3+4+5)/ 5 =3; 再求离差,分别为:(1-3)=-2,(2-3)=-1,(3-3)=0,(4-3)=1,(5-3)=2。 离差平方,分别为:4,1,0,1,4。离差平方和等于4+1+0+1+4=10 离差平方和的平均数:10/5=2,所以方差为2 把2开平方,即得标准差。 离散系数:一组数据的标准差与其相应的均值之比,是测度数据离散程度的相对指标,其作用主要是用于比较不同组别数据的离散程度。 上例中,离散系数等于2的平方根除以3。
单选(2004年试题):如果两组数据是以不同计量单位来表示的,则比较其离散程度的测度值是() A, 离散系数 B, 标准差 C, 方差 D, 极差 答案:A
单选(2004年试题):某学校学生的平均年龄为20岁,标准差为3岁;该校教师的平均年龄为38岁,标准差为3岁。比较该校学生年龄和教师年龄的离散程度,则() A, 学生年龄和教师年龄的离散程度相同 B, 教师年龄的离散程度大一些 C, 教师年龄的离散程度是学生年龄离散程度的1.9倍 D, 学生年龄的离散程度大一些 答案:D 解析:比较不同组别数据的离散程度应该用离散系数。学生年龄的离散系数为(3/20),教师年龄的离散系数为(3/38),学生年龄的离散系数要大一些。 |