如何用spss进行判别分析预测

2024-05-07 00:44

1. 如何用spss进行判别分析预测

spss进行判别分析步骤   

1.Discriminant Analysis判别分析主对话框    如图 1-1 所示 



图 1-1    Discriminant Analysis 主对话框

(1)选择分类变量及其范围

在主对话框中左面的矩形框中选择表明已知的观测量所属类别的变量(一定是离散变量), 
按上面的一个向右的箭头按钮,使该变量名移到右面的Grouping Variable 框中。
此时矩形框下面的Define Range 按钮加亮,按该按钮屏幕显示一个小对话框如图1-2 所示,供指定该分类变量的数值范围。


图 1-2   Define Range 对话框
在Minimum 框中输入该分类变量的最小值在Maximum 框中输入该分类变量的最大值。按Continue 按钮返回主对话框。


(2)指定判别分析的自变量


图 1-3    展开 Selection Variable 对话框的主对话框

在主对话框的左面的变量表中选择表明观测量特征的变量,按下面一个箭头按钮。
把选中的变量移到Independents 矩形框中,作为参与判别分析的变量。

(3) 选择观测量


图 1-4    Set Value 子对话框

如果希望使用一部分观测量进行判别函数的推导而且有一个变量的某个值可以作为这些观测量的标识,
则用Select 功能进行选择,操作方法是单击Select 按钮展开Selection Variable。选择框如图1-3 所示。
并从变量列表框中选择变量移入该框中再单击Selection Variable 选择框右侧的Value按钮,
展开Set Value(子对话框)对话框,如图1-4 所示,键入标识参与分析的观测量所具有的该变量值,
一般均使用数据文件中的所有合法观测量此步骤可以省略。

(4) 选择分析方法


在主对话框中自变量矩形框下面有两个选择项,被选中的方法前面的圆圈中加有黑点。这两个选择项是用于选择判别分析方法的
l      Enter independent together 选项,当认为所有自变量都能对观测量特性提供丰富的信息时,使用该选择项。选择该项将不加选择地使用所有自变量进行判别分析,建立全模型,不需要进一步进行选择。
l      Use stepwise method 选项,当不认为所有自变量都能对观测量特性提供丰富的信息时,使用该选择项。因此需要判别贡献的大小,再进行选择当鼠标单击该项时Method 按钮加亮,可以进一步选择判别分析方法。



2.Method对话框 如图 1-5 所示:  

图 1-5    Stepwise Method 对话框

单击“Method”按钮展开Stepwise Method对话框。

(1)Method 栏选择进行逐步判别分析的方法

可供选择的判别分析方法有:
l   Wilks'lambda 选项,每步都是Wilk 的概计量最小的进入判别函数
l   Unexplained variance 选项,每步都是使各类不可解释的方差和最小的变量进入判别函数。
l   Mahalanobis’distance 选项,每步都使靠得最近的两类间的Mahalanobis 距离最大的变量进入判别函数
l   Smallest F ratio 选项,每步都使任何两类间的最小的F 值最大的变量进入判刑函数
l   Rao’s V 选项,每步都会使Rao V 统计量产生最大增量的变量进入判别函数。可以对一个要加入到模型中的变量的V 值指定一个最小增量。选择此种方法后,应该在该项下面的V-to-enter 后的矩形框中输入这个增量的指定值。当某变量导致的V值增量大于指定值的变量后进入判别函数。

(2) Criteria 栏选择逐步判别停止的判据

可供选择的判据有:
l    Use F value 选项,使用F值,是系统默认的判据当加人一个变量(或剔除一个变量)后,对在判别函数中的变量进行方差分析。当计算的F值大于指定的Entry 值时,该变量保留在函数中。默认值是Entry为3.84:当该变量使计算的F值小于指定的Removal 值时,该变量从函数中剔除。默认值是Removal为2.71。即当被加入的变量F 值为3.84 时才把该变量加入到模型中,否则变量不能进入模型;或者,当要从模型中移出的变量F值<2.71时,该变量才被移出模型,否则模型中的变量不会被移出.设置这两个值时应该注意Entry值〉Removal 值。
l    Use Probability of F选项,用F检验的概率决定变量是否加入函数或被剔除而不是用F值。加入变量的F值概率的默认值是0.05(5%);移出变量的F 值概率是0.10(10%)。Removal值(移出变量的F值概率) >Entry值(加入变量的F值概率)。

(3) Display栏显示选择的内容

对于逐步选择变量的过程和最后结果的显示可以通过Display 栏中的两项进行选择:
l    Summary of steps 复选项,要求在逐步选择变量过程中的每一步之后显示每个变量的统计量。
l    F for Pairwise distances 复选项,要求显示两两类之间的两两F 值矩阵。



3.Statistics对话框 指定输出的统计量如图1-6 所示:

图 1-6    Statistics 对话框

可以选择的输出统计量分为以下3 类:

(l) 描述统计量
在 Descriptives 栏中选择对原始数据的描述统计量的输出:
l  Means 复选项,可以输出各类中各自变量的均值MEAN、标准差std Dev 和各自变量总样本的均值和标准差。
l  Univariate ANOV 复选项,对各类中同一自变量均值都相等的假设进行检验,输出单变量的方差分析结果。
l  Box’s M 复选项,对各类的协方差矩阵相等的假设进行检验。如果样本足够大,表明差异不显著的p 值表明矩阵差异不明显。

(2) Function coefficients 栏:选择判别函数系数的输出形式
l  Fisherh’s 复选项,可以直接用于对新样本进行判别分类的费雪系数。对每一类给出一组系数。并给出该组中判别分数最大的观测量。
l  Unstandardized 复选项,未经标准化处理的判别系数。

(3) Matrices 栏:选择自变量的系数矩阵
l  Within-groups correlation matrix复选项,即类内相关矩阵,
它是根据在计算相关矩阵之前将各组(类)协方差矩阵平均后计算类内相关矩阵。
l   Within-groups covariance matrix复选项,即计算并显示合并类内协方差矩阵,
是将各组(类)协方差矩阵平均后计算的。区别于总协方差阵。
l   Separate-groups covariance matrices复选项,对每类输出显示一个协方差矩阵。
l   Total covariance matrix复选项,计算并显示总样本的协方差矩阵。



4.Classification 对话框指定分类参数和判别结果 如图1-7 所示

 
图 1-7    Classification 对话框

5.Save对话框,指定生成并保存在数据文件中的新变量。如图1-8 所示:

图 1-8    Save 对话框

6.选择好各选择项之后,点击“OK”按钮,提交运行Discriminant过程。

如何用spss进行判别分析预测

2. 如何使用SPSS进行一般判别分析

作为一款专业的数据分析软件,IBM SPSS Statistics可以为金融、市场、医学等多个领域的数据分析提供巨大的帮助,是数理统计中较为常用的一个工具。
  
 这篇文章将介绍如何进行 SPSS一般判别分析 。
  
  概述 
  
 判别分析是在已知分辨数目的情况下,根据已知数据的分类指标和所属类别,对未知部分数据进行类别判断的分析方法。
                                          
 图1:数据样本
  
 上图是我们这里选择的一个数据样本,是某公司的员工基础信息,将雇佣类别简单分为管理和非管理后,有表中所示的分类,数据一共有474个个案,前四百个有明确的分类结果(即是否管理人员),后74个没有分类数据。
  
 在这种一部分数据缺失的情况下,我们就可以利用SPSS的判别分析来对缺失数据进行分析补充,也就是这里提到的一般判别分析。
  
  二、分析操作 
  
  1.功能位置 
                                          
 图2:判别分析位置
  
 在“分析”——“分类”中选择“判别式”,就可以打开判别分析的对话框。
  
  2.变量设置 
                                          
 图3:变量设置
  
 将待分析的变量“雇佣类别(是否管理)”移入“分组变量”窗口,在下面的“自变量”窗口中移入分组依据。
  
 在本数据中,员工是否是管理职位与其他几个变量均有一定关系,所以在“自变量”窗口中移入剩余变量类型作为目标变量。
  
 如果要对数据集中的一个子集进行分析,可以使用“选择变量”窗口。
                                          
 图4:定义范围
  
 分组变量还需要进行范围设置,本数据中这是一个二分数据,为了避免0数据导致的缺失值,所以用2代替0,表示不是管理人员,1表示是管理人员,在范围中设置最小值为1,最大值为2即可。
  
  3.输出统计 
                                          
 图5:输出统计设置
  
 单击“统计”,可以设置在分析结果中数据的统计结果,包括描述性统计数据、函数系数和矩阵,各个数据均有一定的统计意义,我们这里设置输出样本的均值。
  
  4.分类设置 
                                          
 图6:分类设置
  
 分类对话框中设置的是先验概率和显示内容,将先验概率选择为“所有组相等”,我们没有使用协方差矩阵,这个设置不用管,设置输出图形为领域图。
  
  5.保存设置 
                                          
 图7:保存设置
  
 在保存对话框中可以设置判别分析的类型,选择“预测组成员”,如果有需要,也可以将模型信息导出到XML文件。
  
  6.分析完成 
                                          
 图8:结果输出
  
 设置完成后点击确定,就可以在输出日志窗口中看到判别分析的结果了。
  
 除了工作日志里的分析结果,在数据页内,还会出现一个新的分组,如下图所示。
                                          
 图9:判别结果
  
 这个新的分组就是IBM SPSS Statistics完成判别分析的成果,可以看到,没有分类结果的部分数据已经被补充完整,本次分析就结束啦。
  
  三、小结 
  
 以上就是我整理的关于如何使用 IBM SPSS Statistics 对数据分类进行判别分析、补充缺失的特定数据的具体方法和案例参考了,希望可以对大家有所帮助!
  
 更多软件资讯和案例分享欢迎进入IBM SPSS Statistics中文网站查看。

3. 想要一个用SPSS软件分析的典型相关分析的实例,有具体的解释

实例内容

    道琼斯工业平均指数(DJIA)和标准普尔指数500(S&P 500)都被用做股市全面动态的测度。DJIA是基于30种股票的价格动态;S&P500是由500种股票组成的指数。有人说S&P 500是股票市场功能的一种更好的测度,因为它基于更多的股票。表7-2显示了DJIA和S&P 500在1997年10周内的收盘价。请计算它们之间的样本相关系数。不仅如此,样本相关系数告诉我们DJIA和S&P 500之间的关系是怎样的?
表给出了道琼斯工业平均指数和标准普尔指数在同一时间点的数值。由于这些数值都是连续型变量,同时根据两个股票指数的散点图,可见它们呈显著的线性相关,因此可以采用Pearson相关系数来测度它们之间的相关性。但为了比较,我们也计算了这两组变量的Kendall和Spearman相关系数。

1)描述性统计分析表

执行完上面的操作后,首先给出的是当前样本进行描述性统计的结果,如表7-3所示。可以看到样本容量都等于10,道琼斯工业平均指数和标准普尔指数的平均均值分别为7743.60和945.10,两者差距显著。同时,两者的方差差距也很明显。

(2)Pearson相关系数表

     接着SPSS列出了道琼斯工业平均指数和标准普尔指数的Pearson相关系数表7-4。可以看到,两种指数的Pearson系数值高达0.995,非常接近1;同时相伴概率P值明显小于显著性水平0.01,这也进一步说明两者高度正线性相关。

想要一个用SPSS软件分析的典型相关分析的实例,有具体的解释

4. SPSS软件进行数据分析时,如何选择检验方法?

  方法/步骤
  1、首先,打开或者是新建一组数据,这里是打开一组案例分析中的数据进行分析。


  2、在浏览窗口中找到需要分析的数据。


  3、选择分析,描述统计中的比率,单击打开。


  4、弹出一个设置窗口,我们再这里设置比率的分子和分母还有分组变量。
  分子和分母分别表示比率变量中的分子和分母变量。
  分组变量一般是叙事变量,使用数值代码或者是字符串对分组变量进行编码。


  5、这是根据数据中的变量设置的三个分值。


  6、下面是对统计量进行设置分析。
  打开统计量窗口,里面有四大块,根据数据统计分析自定义设置,设置完成之后确定即可。

  7、下面是根据数据分析设置的显示结果,如下图所示:



5. 34. 在SPSS中,判别分析的实现有两种不同的思路,分 别是什么?并简述这两种判别方法是如何进行

因子分析、主成分分析、对应分析与上面两种分析方法有很大的不同。主成分分析是通过已给的变量或者样品找到少于其变量个数或者样品个数的几个公共因子,这些公共因子所能代表的含义能够最大限度的解释所有的变量或样品。其实可以【摘要】
34. 在SPSS中,判别分析的实现有两种不同的思路,分 别是什么?并简述这两种判别方法是如何进行判别的【提问】
因子分析、主成分分析、对应分析与上面两种分析方法有很大的不同。主成分分析是通过已给的变量或者样品找到少于其变量个数或者样品个数的几个公共因子,这些公共因子所能代表的含义能够最大限度的解释所有的变量或样品。其实可以【回答】
您能补充下吗,我有点不太理解【提问】
根据资料的性质,分为定性资料的判别分析和定量资料的判别分析;采用不同的判别准则,又有费歇、贝叶斯、距离等判别方法。 费歇(FISHER)判别思想是投影,使多维问题简化为一维问题来处理。选择一个适当的投影轴,使所有的样品点都投影到这个轴【回答】

34. 在SPSS中,判别分析的实现有两种不同的思路,分 别是什么?并简述这两种判别方法是如何进行

6. 34. 在SPSS中,判别分析的实现有两种不同的思路,分 别是什么?并简述这两种判别方法是如何进行

因子分析、主成分分析、对应分析与上面两种分析方法有很大的不同。主成分分析是通过已给的变量或者样品找到少于其变量个数或者样品个数的几个公共因子,这些公共因子所能代表的含义能够最大限度的解释所有的变量或样品。其实可以【摘要】
34. 在SPSS中,判别分析的实现有两种不同的思路,分 别是什么?并简述这两种判别方法是如何进行判别的【提问】
因子分析、主成分分析、对应分析与上面两种分析方法有很大的不同。主成分分析是通过已给的变量或者样品找到少于其变量个数或者样品个数的几个公共因子,这些公共因子所能代表的含义能够最大限度的解释所有的变量或样品。其实可以【回答】
我还是有些不太明白,回答能否再详细些?【提问】
根据资料的性质,分为定性资料的判别分析和定量资料的判别分析;采用不同的判别准则,又有费歇、贝叶斯、距离等判别方法。 费歇(FISHER)判别思想是投影,使多维问题简化为一维问题来处理。选择一个适当的投影轴,使所有的样品点都投影到这个轴【回答】

7. 现在想用spss分析,应该用什么检测方法

 现在想用spss分析,应该用什么检测方法  你的资料不适合使用卡方检验。卡方检验用于2个变数都属于分类变数(例如性别、婚姻状态等,属于定性资料)时的资料分析,例如要分析性别与色盲之间(色盲一般分为“有”和“无”2个分类,属于定性变数)的关系,就可以使用卡方检验。你的资料一个变数是组别(分为对照组和A租),而另一个变数(你的测定值)基本上可以说是定量资料(定量变数,例如身高、体重等都属于这一类),这种情况首先考虑使用成组t检验。
  这个问题用SPSS的哪种检测方法分析:  两个变数必须至少都是有等级的(就是有先后秩序的,或者有大小区分的)才能做统计意义上的相关分析。而版面型别不是等级变数或者等距变数,而是分类变数,就像性别一样。所以这个问题可以从另外一个角度来问:读这三种版面的顾客来这家餐厅的可能性有没有明显的差异?  如果是这样的话,你需要做方差分析,因为你的自变数(版面)有三个水平。先检验总体的差异(即主效应),再检验俩俩差异(即post hoc,事后检验)。如果存在显著性差异,你就能通过它们的平均数来判断哪一类版面更有作用了。
  食盐用什么检测方法  如何鉴别小包装食盐的真假呢?有4个方法:看包装袋有没有折痕。真盐包装袋两侧平滑无折痕,假盐包装袋两侧折痕;看编号是否重号,如果发现有两包或以上的小包装盐编号重号,即为假盐;看防伪标识,这些标识都是放在固定贴在包装膜夹层的一个位置。可拿几包盐对比,如发现防伪标识有偏差,即为假盐;看封口,小包装的封口处压纹线条清晰,用手指触控有明显的凸凹感的是正品,否则为假盐.  性质上,食用盐性质较稳定,水溶液呈中性;外观上,食用盐含碘,质白,呈细沙状,水分极少,用手揉捏时不会有凝结感;工业用盐不含碘,色泽灰暗,外形多为颗粒状,水分含量大;味道上,食用盐咸味较重。
  检测溶液的浓度用什么 检测方法  1、稳定的固体溶液,可以用蒸发法  2、酸或者碱可以用中和滴定的方法  3、能形成沉淀的,可以用沉淀法  4、密度法等。。。
  乙酸分析检测方法有哪些  酸碱滴定  导电率测定
   
  急 异丙醇的分析检测方法  异丙醇GB7814-87  羰基化合物含量测定法  按GB6324.5-86《有机化工产品中羰基化合物的测定 容量法》进行测定。  为使滴定终点易于观察,须将中和盐酸羟胺时加的指示剂由5ml改为0.5ml;中和异丙醇时加的指示剂由1.25ml改为2~3滴,溶液由黄色转变到黄绿色为滴定终点。  精密度:两次平行测定结果之差不应大于0.003%。  取两次平行测定结果的算术平均值作为测定结果。  GB6324.5-86《有机化工产品中羰基化合物的测定 容量法》见资料中心
  涂装厚度用什么检测方法进行检测  膜厚(膜厚仪)、附着力(百格刀、冲击)、光泽(光泽仪)、色差(色差仪)、盐雾试验(盐雾试验箱)、耐溶剂性(酒精或丙酮等溶剂) 1.膜厚 粉末涂装的厚度一般都在100um以上,具体看要求,+-10 2.百格+3M467 不能见底材
  哪种基音检测方法中利用了线性预测分析?这种基音检测方法的基本思想是什么  期检测演算法,以实现语音的基音周期检测。基音周期的估计称谓基音检测,基音检测的最终目的是为了找出和声带振动频率完全一致或尽可能相吻合的轨迹曲线
  锅炉用什么水?有什么检测方法,  锅炉通常用“去离子水”。简单的用电导法检测。
  频谱分析仪的检测方法  频谱分析仪的检测方法,成都虹威科技为您介绍一二:  频谱分析仪是研究电讯号频谱结构的仪器,用于讯号失真度、调制度、谱纯度、频率稳定度和交调失真等讯号引数的测量,可用以测量放大器和滤波器等电路系统的某些引数,是一种多用途的电子测量仪器。  频谱分析仪它又可称为频域示波器、跟踪示波器、分析示波器、谐波分析器、频率特性分析仪或傅立叶分析仪等。现代频谱分析仪能以模拟方式或数字方式显示分析结果,能分析1赫以下的甚低频到亚毫米波段的全部无线电频段的电讯号。仪器内部若采用数位电路和微处理器,具有储存和运算功能;配置标准介面,就容易构成自动测试系统。  传统的频谱分析仪的前端电路是一定频宽内可调谐的接收机,输入讯号经变频器变频后由低通滤器输出,滤波输出作为垂直分量,频率作为水平分量,在示波器萤幕上绘出座标图,就是输入讯号的频谱图。由于变频器可  频谱分析仪  以达到很宽的频率,例如30Hz-30GHz,与外部混频器配合,可扩充套件到100GHz以上,频谱分析仪是频率覆盖最宽的测量仪器之一。无论测量连续讯号或调制讯号,频谱分析仪都是很理想的测量工具。但是,传统的频谱分析仪也有明显的缺点,它只能测量频率的幅度,缺少相位资讯,因此属于标量仪器而不是向量仪器。
   

现在想用spss分析,应该用什么检测方法

8. SPSS与判别分析

 判别分析的特点是根据已掌握的、历史上每个类别的若干样本的数据信息,总结出客观事物分类的规律性,建立判别公式和判别准则。
   判别分析和聚类分析都是要求对样本进行分类,但两者的分析内容和要求是不一样的。 聚类分析 是给定数量的样品,但样品应划分出怎样的类别还不清楚,需要聚类分析来判别。 判别分析 是已知样品应分为怎样的类别,判断每一个样品应属于怎样的类别。
                                           距离判别是以给定样品与各总体之间的距离的计算值为准则进行类别判断的一种方法。由于马氏距离不受量纲的影响,因此,在距离判别法中,也采用马氏距离作为类别判断的依据。
   (1)若ω(x)>0  则x属于G₁   (2)若ω(x)<0  则x属于G₂   (3)若ω(x)=0  则待判   其中,ω(x)为x的线性函数:(推导过程略)
             故常称ω(x)为线性判别函数
   协方差阵相同时:   判别函数为:
             相应的判别规则为:
                                           协方差阵不同时:   判别函数为:
             相应的判别规则为:
                                           该法是按照类内方差尽量小,类间方差尽量大的准则来要求判别函数。组与组的分开借用了方差分析的思想。
   从两个总体中抽取p个指标的样品观测数据,根据方差分析的思想构造一个判别函数:
             其中系数确定的原则是使两组间的区别最大,而使每个组内部的离差最小。
   有了判别式以后,对于一个新的样品,将它的p个指标带入判别函数中求出y值。然后与判别临界值进行比较,就可以判断它属于哪一个总体。
    分析过程: 
   设有k个总体G₁,G₂,…,Gk,从中抽取的样品数为n₁,n₂,…,nk,令n=n₁+n₂+…+nk。设判别函数为:
             其中,
             在多总体情况下继续选取系数向量c即可。    注:一般来说,对经验样品回判率大于80%就可以使用Fisher判别。 
   贝叶斯判别的基本思想是认为所有G个类别都是空间中 互斥 的子域,每个观测都是空间中的一个点。
   在考虑先验概率的前提下,利用Bayes公式按照一定的准则构建一个判别函数,分别计算该样品落入各个子域的概率,所有概率中最大的一类就被认为是样品所属的类别。
    Bayes判别的数学推导略,其数学模型的建立可参考:[百度文库](https://wenku.baidu.com/view/37949474a8114431b80dd803.html),P5-P14 
   但在Bayes判断规则之前,设
             有必要进行统计检验H₀₁:μ₁=μ₂=…=μk。当H₀₁被接受,说明k个总体是一样的,也就没有必要建立判别函数;
   若H₀₁被拒绝,就需要检验每两个总体之间差异的显著性,重复操作。
   逐步判别的思想类似于逐步回归。变量按照其重要性逐步引入,已经引入的变量也可能因为新的变量而被剔除。每次引入或剔除变量都进行相应的统计检验。
   利用 威尔克斯统计量 对变量的重要性进行区分:
             其中Λ(X ,Xj)表示X 与Xj的威尔克斯检验统计量,Λ=组内离差平方和/样本点总离差平方和。
   步骤:分析->分类->判别,选入变量,如下图:
                                           定义分组变量范围,如下图:
                                           点击 Statistics 按钮,选择如下图:
                                           单击 分类 按钮,如下图:
                                           单击 Save 按钮,选项如下图:
                                           主要输出结果:
                                           右图是贝叶斯判别函数系数表,将样品的各参数带入2个贝叶斯判别函数,比较得出的函数值,哪个函数值较大就将该样品归于哪一类。
   以及最后的样品判别结果见下表:
                                           可以直接读出预测组的分类为第2类。