SPSS数据统计分析师认证培训 - michen6/personal GitHub Wiki

课程介绍

经济30年快速发展,正在使我们渐渐窥探到数据时代的特征,随着企业级数据的积累,相应的使现代统计软件分析过程也发生变化,由传统基本的数据挖掘技术,渐渐趋向于数据库技术应用。与此同时各家软件相应推出应对策略,像SAS、STATA、SPSS三大统计软件,相序推出多线程、分布式等数据处理技术,这对于企业日益庞大的数据现状来说,无疑在一定程度上缓解了大数据处理的压力。

SPSS技术与岗位需求零距离,使学员能够快速有效的了解和处理企业数据要求。

数据管理

企业的数据收集主要涉及3个方面:原始数据录入、数据文件读入和数据库的访问,这些我们将在前三节具体介绍,这里以实际企业要求为背景,强调学员的上机动手实践能力。

  • 数据获取
    • 企业需求:数据库访问、外部数据文件读入
    • 案例分析: 使用产品信息文件演示spss的数据读入共能。
  • 数据管理。
    • 企业需求:对大型数据进行编码、清理、转换。
    • 案例分析: 使用银行信用违约信息文件spss相应过程。
      1. 数据的选择、合并与拆分、检查异常值。
      2. 新变量生成,SPSS函数。
      3. 使用SPSS变换数据结构——转置和重组。
      4. 常用的描述性统计分析功能。频率过程、描述过程、探索过程。
  • 数据探索和报表呈现。
    • 企业需求:对企业级数据进行探索,主要涉及图形的使用。spss报表输出。
    • 案例分析: 企业绩效文件,如何生成美观清晰的报告。
      1. 制作报表前对变量的检查
      2. 制作报表的中对不同类型的数据处理
      3. 报表生成功能与其他选项的区别

数据处理

  • 相关与差异分析。
    • 企业需求:企业往往需要探索影响企业效率的因素间的相关关系,这是最基础的过程,并在此基础上了解存在的差异。
    • 案例分析: 产品合格率的相关与差异分析。
  • 线性预测。
    • 企业需求: 探索影响企业效率的因素,并进一步预测企业效率。
    • 案例分析: 产品合格率的影响因素及其预测分析。
  • 因子分析。
    • 企业需求: 需要抽取影响企业效率的主要因素,进行重点投资。
    • 案例分析: 客户购买力信息研究
  • 聚类分析。
    • 企业需求: 需要了解购买产品的客户信息
    • 案例分析: 客户购买力信息研究
  • bootstrap。
    • 企业需求: 针对某新产品的调研活动。收集的信息有时可能会因抽样偏差或样本小,会导致结果有偏,这里使用bootstrap。
    • 案例分析: bootstrap抽样。

SPSS代码

  • SPSS代码应用
    • 企业需求:企业数据分析要求中,存在大量重复性质的工作,这样就需要使用SPSS代码,来减轻分析人员的工作量。
    • 案例分析:演示数据分析的整个流程。