统计数据的概念
第十讲 统计(一)
一、内容提要 本部分的主要内容为:统计与统计数据、统计数据的整理与显示、数据特征的测度三部分。 知识结构: 统计这一部分包括六章: (一)统计与统计数据 (二)统计数据的整理与显示 (三)数据特征的测度 (四)时间序列 (五)统计指数 (六)相关与回归 整体来看,可以分成两大块,前三章主要讲统计数据,这是统计的基础;后三章更进一步,讲到了序列、指数、相关与回归关系。时间序列就是把某一统计指标在各个不同时间上的数值按时间先后顺序编制形成的序列,指数单从形式上看就是两个数值对比形成的相对数;相关与回归也是衡量数据之间的联系。总之,后三章实际上是一种对数据的高级处理方法,基础还是数据。 第一章 统计与统计数据,主要是对统计数据所做的概述,包括统计数据的计量尺度、类型、来源及质量。统计数据的计量尺度是2005年新加的一节,不可忽视,但内容比较简单;重点是掌握数据的类型,定量数据,由定距和定比尺度形成,就指数值型数据;定性数据包括分类数据和顺序数据,由定类尺度和定序尺度形成。还有一点是掌握时期指标和时点指标之间的区分。 第二章 统计数据的整理与显示,分别讲述对定性数据和定量数据的整理,对定性数据,主要是频数分布表的编制;对定量数据,主要掌握数据分组方法。 第三章 数据特征的测度,包括集中趋势和离散程度两个相反的方面。要概括地描述一组数据,也就是描述清楚它的集中趋势和离散程度。 第四章 时间序列,对时间序列的分析包括水平分析和速度分析两方面。水平分析包括发展水平与平均发展水平、增长量与平均增长量;速度分析包括发展速度与增长速度、平均发展速度与平均增长速度、增长1%的绝对值这样三个知识点。需要掌握各自的定义及计算。 第五章 统计指数,需要清楚是根据基期加权还是根据报告期加权,重点是指数体系的分析。 第六章 相关与回归,要能够根据相关系数判断相关关系的程度;掌握一元线性回归方程正误的判断。 本部分是容易出计算题的部分,除了搞清楚基本概念外,必须多做练习,掌握基本题型的解题步骤,提高计算的准确性。
二、主要考点 (一)统计与统计数据 1 掌握统计的含义 2 掌握统计数据的四种计量尺度 3 掌握统计数据的不同类型以及变量的含义和类型 4 掌握统计指标的分类 5 掌握不同调查方式的的特点和应用场合 (二)统计数据的整理与显示 1 掌握比例、百分比和比率的计算方法 2 掌握分类数据频数分布表的编制方法 3 掌握条形图和圆形图的作用和绘制方法 4 掌握累积频数和累计频率的计算方法 5 掌握顺序数据频数分布表和累积频数分布表的编制方法 6 掌握数据分组的方法 7 掌握组中值的作用和计算方法 8 掌握直方图和直线图的绘制方法 9 掌握统计表的基本结构和设计要求 (三)数据特征的测度 1 掌握众数的计算方法和特点 2 掌握中位数的计算方法、特点和应用场合 3 掌握简单算术平均数和加权算术平均数的计算方法、算术平均数的特点和应用场合 4 掌握几何平均数的计算方法和应用场合 5 掌握标准差和方差的计算方法和应用 6 掌握离散系数的计算方法和具体应用
三、内容讲解 (一) 统计与统计数据 1.含义 统计一词包含三种含义:统计工作;统计数据;统计学 2.统计数据的计量尺度 定类尺度、定序尺度、定距尺度、定比尺度。 定类尺度:只进行分类或分组,不反映各类的优劣、量的大小或顺序,不可以进行数学运算;例如:将人口分为男女两类。 定序尺度:可以反映各类的优劣、量的大小或顺序,不可以进行数学运算;例如:将学生成绩分成优、良、中、及格和不及格五类。 定距尺度:可以反映现象在量方面的精确差异,可以进行加、减运算;例如:某物长10米,重100千克等。 定比尺度:相对数(或平均数),可以进行加、减、乘、除等数学运算。 多选 (2004年试题):以定距尺度计量的统计数据可以进行() A,加 B,减 C,乘 D,除 E,比较大小 答案:ABE 3. 类型 类型:分类数据;顺序数据;数值型数据(通常我们处理的大多为数值型数据),其中分类数据和顺序数据是定性数据或品质数据;数值型数据是定量数据或数量数据。 对不同类型的数据应采用不同的统计方法来处理和分析。品质数据可计算各组的频数或频率,而数值型数据可以采取更多计算方法。 变量及其类型:统计中把说明现象某种特征的概念称为变量,变量的具体表现为变量值,统计数据就是统计变量的具体表现。可分为:分类变量、顺序变量、数值型变量; 数值型变量:分为离散变量和连续变量; 离散变量:可以取有限个值,取值都以整位数断开,可以一一列举; 连续变量:可以取无穷多个值,取值是连续不断的,不能一一列举。 多选(2004年试题):连续变量具有()的特点 A, 可以取无穷多个值 B, 取值连续不断 C, 只可以取有限个值 D, 其取值都以整位数断开 E, 取值不能一一列举 答案:ABE 4统计指标及其类型 分类:总量指标、相对指标和平均指标 其中,总量指标按其所反映的时间状况不同可分为时期指标和时点指标 例题:单选 某工业企业某种产品年产量100万件,其年末库存量为28万件,它们( )。 A.是时点指标 B.是时期指标 C.前者是时期指标,后者是时点指标 D.前者是时点指标,后者是时期指标 答案:C 解析:年产量反映的是在一年这一段时期内的情况,是时期指标;而年末库存量反映的是在年末这一个时点上的情况,是时点指标。 5.统计数据的来源 主要来源于两种渠道:直接来源,称第一手或直接的统计数据;间接来源,称第二手或间接的统计数据。 (1)直接来源 方式:普查、抽样调查、统计报表 普查:为某一特定目的而专门组织的一次性全面调查。 普查的特点:通常是一次性的或周期性的;一般需要规定统一的标准调查时间;数据一般比较准确,规范化程度也较高;使用范围比较狭窄 普查的适用范围:它主要用于收集处于某一时点状态上的社会经济现象的数量 抽样调查 特点:经济性;实效性强;适应面广;准确性高 应用:它是实际中应用最广泛的一种调查方式和方法 统计报表 统计报表是按照国家有关法规的规定,自上而下的统一布置、自下而上的逐级提供基本统计数据的一种调查方式。统计报表要以一定的原始数据为基础,按照统一的表式、统一的指标、统一的报送时间和报送程序进行填报。 类型:全面报表和非全面报表 (2)间接来源 主要有:公开的出版物、未公开的内部调查等。 单选(2005年试题) 从使用者角度看,从( )中取得的统计数据是第二手统计数据。 A.经济普查 B.农产量抽样调查 C.《中国人口统计年鉴》 D.固定资产投资月度统计报表 答案:C 6.统计数据的质量 误差来源主要有:登记性误差(从理论上讲可以消除)和代表性误差(通常无法消除,但可以事先进行控制或计算)。 单选(2005年试题) 抽样时,由于样本容量不足造成的误差与因为( )造成的误差,都属于代表性误差。 A.被调查者有意虚报 B.数据汇总错误 C.填报错误 D.没有遵循随机原则 答案:D |