本书是北京市高等教育精品教材立项项目,全书以统计分析的应用需求为主线,以通俗易懂的语言对SPSS中的主要统计分析方示和枋心思想进行系统的介绍,并对基在SPSS中的操作实现步骤进行详尽说胆,同时配合应用案例分析,使读者能够较快领会方法的要点,掌握方法的实现操作,明确方法的适应特点,本书克服SPSS手册类教材中只注重操作说明而忽略原理讲解的不足,同时弥补了统计专业教材中只注重原理述论而缺乏实现工具的缺憾,是一本特色鲜明、具有广泛使用价值的精品教材。
第一章 SPSS统计分析软件概述\r\n 1.1 SPSS的发展及特点\r\n 1.2 SPSS的使用基础\r\n 1.3 利用SPSS进行数据分析的基本步骤\r\n第二章 SPSS数据文件的建立和管理\r\n 2.1 SPSS数据文件\r\n 2.2 SPSS数据的结构和定义方法\r\n 2.3 SPSS结构定义的应用案例\r\n 2.4 SPSS数据的录入与编辑\r\n 2.5 SPSS数据的保存\r\n 2.6 读取其他格式的数据文件\r\n 2.7 SPSS数据文件的合并\r\n第三章 SPSS数据的预处理\r\n 3.1 数据的排序\r\n 3.2 变理计算\r\n 3.3 数据选取\r\n 3.4 计数\r\n 3.5 分类汇总\r\n 3.7 数据预处理的其他功能\r\n第四章 SPSS基本统计分析\r\n 4.1 频数分析\r\n 4.2 计算基本描述统计量\r\n 4.3 交叉分组下的频数分析\r\n 4.4 多选项分析\r\n 4.5 比率分析\r\n第五章 SPSS的参数检验\r\n……\r\n第六章 SPSS的方差分析\r\n第七章 SPSS的非参数检验\r\n第八章 SPSS的相关分析和线性回归分析\r\n第九章 SPSS的聚类分析\r\n第十章 SPSS的因子分析\r\n第十一章 SPSS的对应分析\r\n第十二章 SPSS的信度分析\r\n第十三章 SPSS的对数线性模型\r\n第十四章 SPSS的时间序列分析\r\n参考文献
一、统计应用的特点
在计算机技术迅猛发展的今天,政府和企业的统计应用已逐渐呈现以下特征:
第一,数据量和数据关系复杂性快速膨胀数据量和数据关系复杂性快速膨胀是目前统计应用中遇到的主要问题。通常,一般规模的统计分析项目中,数据量可达到百万条甚至近千万条。统计应用也不再以统计年鉴和统计报表的纸面方式获得数据,而要求直接从电子化多媒体化的基础业务系统、管理信息系统和决策支持系统的数据库(数据仓库)中提取数据。利用计算机和网络进行有效的数据组织和数据管理已经成为统计应用的基本环节和基础方式。第二,数据分析方法日益丰富在数据处理和数据分析中,以坚实的数学理论为基础的统计分析方法已获得广泛应用。近年来以计算机技术为动力的数据挖掘技术也为数据分析增添了新的方法和思路。机器学习、神经网络和生物遗传算法等已成为处理海量数据,探索数据内在规律性,提取数据中未知知识的重要手段。这些数据分析方法的成果不断地体现在统计分析软件和数据挖掘软件体系中,并通过强大的计算机处理能力和网络分布处理能力进行模型的高速计算。
第三,统计应用需要具有可操作性的整体解决方案传统的统计业务处理流程是报表上报、人工汇总、撰写分析报告,最终实现为有关管理决策部门提供信息监督和咨询服务的目标。统计应用的科研长期以来也沿用了这种套路,即由统计业务方提供数据,由统计方法专家进行数据分析、撰写分析报告和提供咨询建议。这样的应用方式存在两个主要问题:首先,许多企事业单位统计应用起点较低,基础较薄弱,无法提供完善的报表支持,出现或资料不完整或没有电子化的数据来源等问题,使得统计分析常常成为无米之炊;其次,不定期的统计报告方式难以满足统计业务的长期发展需要。目前,越来越多的统计应用要求研究人员提供能够与统计业务绑定的、可长期运行的、具有可操作性的统计应用整体解决方案。这个整体方案将统计业务处理功能、统计数据、统计分析方法完整地集成起来。因此,如果没有一个符合企事业单位统计业务自身特点的统计信息系统,统计分析方法的应用将很难实现健康的、落地生根的、滚动式的发展。
总之,如果说数学是统计方法的首要工具,那么,统计应用软件已经成为统计应用的首要工具。
二、统计应用软件的分类
长期以来,统计无论在国内外政府和企业都有着广泛的应用,但统计应用软件在企事业信息化建设中的认可度却相对较低。产生这个矛盾的一个重要原因就是统计应用软件概念混淆,分类不清。目前,人们在提及统计应用软件时会涉及统计分析软件、统计信息系统、统计数据库系统等方面。规范统计应用软件分类标准对统计应用软件发展和统计信息化建设有着深远的和现实的意义。我们经过对国内外大量资料的分析研究,结合自身统计应用软件开发应用的经验,提出了统计应用软件分类标准,希望能抛砖引玉,引起大家对统计应用软件的关注和研究。
首先,统计应用软件是应用软件的一种分类,是应用软件从应用领域或应用行业划分出的一个分支。其次,根据应用性质,统计应用软件可划分为统计分析软件、统计数据库管理系统和统计数据库系统、统计信息系统三大类。
统计分析软件是依据统计分析方法开发的支持数据分析的工具型软件,比如SPSS和SAS等。统计数据库管理系统是根据统计处理对象(统计数据)的特征和一般处理功能而研制的数据库管理系统(DBMS),统计数据库系统则是基于统计数据库管理系统而建立的包含统计数据资源的数据库系统。
统计信息系统是采用软件开发平台,结合统计数据库管理系统和统计分析软件等核心技术开发的服务于统计业务处理和统计数据分析的信息系统。根据统计业务的不同处理层次和服务对象,统计信息系统一般又可以分为统计基础业务系统、统计经营管理系统和统计决策支持系统。统计基础业务系统主要用于统计数据的采集处理和统计报表的采集处理,包括统计专项调查与普查处理系统等;统计经营管理系统主要用于统计数据和报表的汇总、查询、传输、基本分析和信息发布等;统计决策支持系统主要用于统计数据综合分析预测和深入的数据挖掘处理等。
因此,本书将重点讨论的SPSS软件是一种专业的统计分析软件,用于数据的各种分析,进而最终为企事业的科学决策服务。
三、关于本书
“数据”是科学决策的重要依据。“让数据说话”是科学决策的正确途径,掌握数据分析方法和数据分析软件工具是科学决策的有效手段。本书旨在通过对SPSS统计分析方法、软件及应用案例的介绍分析,使读者由浅入深地了解和掌握统计分析方法,快速掌握SPSS软件的使用,并灵活运用于数据分析和科学决策中。
以统计分析过程为主线介绍SPSS目前,关于SPSS软件的书籍比较多,也受到广大读者的普遍青睐。
作者参考分析了这些书籍,并在多年教学经验和实践的基础上,总结形成了一套独特的SPSS软件教学方式。
由于SPSS软件是一种专业性较强的统计分析软件,因此作者以为该软件的介绍方法应有别于其他非专业性的、大众化的计算机软件。对于大众化软件,一般可以按照软件中菜单的顺序来依次讲解;而对SPSS这样的专业软件来说,该种方法则存在许多不利于快速掌握和应用SPSS的问题。
很多已经具备本专业领域知识的读者学习SPSS软件过程中遇到的问题是:首先,拿到一批数据后不知道如何用SPSS组织它们,不知道如何利用SPSS对它们进行基本加工和整理;其次,不知道应从何处入手分析,应采用SPSS中的哪些分析方法和功能实现对各类数据的由浅入深的分析,不知道如何理解和合理解释分析结果等。
因此,作者以为,对SPSS软件的学习介绍应从实际应用出发,以统计分析的实践过程为主线,从SPSS基础和数据管理功能的说明入手,按照针对不同数据类型、分析需求由浅至深、分析方法从易到难的思路展开,而非软件菜单的逐一介绍。这样,能使读者在非常短的时间内掌握SPSS的核心功能和分析方法,并可很快运用于实际工作中。另外,随着对软件使用的不断娴熟和分析需求的不断深入,读者可继续学习和应用SPSS的一些高级分析方法,进而逐步实现对SPSS功能的全面掌握和应用。
统计分析方法、SPSS操作及案例分析的有机结合目前,虽然介绍SPSS软件的书籍比较多,但将统计分析方法、SPSS操作及应用案例分析有机结合的书籍并不十分多见。有些书籍比较侧重对SPSS操作的手册性介绍,对数据分析方法讲解很少,给大量有统计分析需求、但又不很了解统计分析方法的读者带来诸多学习上的困难;有些书籍则比较侧重统计分析方法的论述,但却缺乏对SPSS操作实现的必要说明,这样又会给方法的实际运用带来障碍。从快速掌握和应用SPSS的角度看,作者以为,较为合理的方法是将上述两方面有机结合,并配合大量的多领域的分析案例,使读者一方面可以了解分析方法的核心思想,掌握方法的正确应用范围,不至于滥用误用方法,另一方面也使读者能够快速熟悉和掌握SPSS,并在理解分析方法的基础上给分析结果以正确合理的解释。
通俗的统计分析方法讲解,详尽的SPSS操作过程说明针对读者群的特点,本书力求以最通俗的方式对统计分析方法的核心思想、适用范围进行讲解,避免大量的数学公式和数学证明,目的是使读者能够快速而轻松地了解方法的本质,正确运用方法。同时,方法的介绍是紧紧围绕SPSS的输出结果展开的,目的是希望读者真正理解SPSS为什么要输出这些统计量及它们对分析结论的重要性,进而会正确、合理和完整地引用分析结果。另外,本书对SPSS的操作过程也给出了较为详尽的说明,但并非是对菜单功能的简单罗列,而是将其穿插于分析案例的实现过程中。因此,读者通过案例的学习,能够获得了解方法、掌握SPSS操作步骤、合理解释分析结果的多方面收获。
本书适合于从事统计分析和决策的社会各领域各相关专业的读者,尤其适合于从事社会科学研究、经济管理、商业决策、人文教育、金融保险等行业的中高层管理人员。同时,也可作为高等院校财经类专业研究生和本科生掌握SPSS统计分析方法和软件使用的教材。 本书共包括14章。其中,第1章至第13章由薛薇执笔,第14章由李晓明执笔,全书最后由薛薇审核定稿。另外,书中附配套案例数据光盘供读者学习和练习,也可到www.tlsoft.com下载。由于水平所限,书中的问题与错误,请读者批评指正。
编者
于中国人民大学统计学院
2004年5月