[关闭]
@su 2014-05-26T15:05:01.000000Z 字数 431 阅读 2132

数据分析与统计软件


第五章 判别分析

信计12 苏泽明
学号:2110902035

1. 距离判别:
对于习题4.5中的1991 年我国各个省、区、镇居民8 个月消费指标数据(见表 4.9 ),设前 20 个省份为第一类 G1,21-27 号省份(即福建...北京)为第二类 G2 ,最后三个省份(西藏,上海,广东)待判.
(1)进行距离判别,给出线性及二次判别函数,并计算误判率的会带估计和交叉确认估计;
(2)设两总体服从正态分布,先验概率按比例分配且误判损失相同,分别就两总体的协方差矩阵相等和不等,进行 Bayes 判别分析,并计算误判率的会带估计和交叉确认估计;
(3) 在上述的各情况下,试判别西藏,上海,广东各属哪一类;

解答:
首先将数据导入sas数据集:

  1. data chapter5;
  2. infile 'G:\数据分析方法梅长林\各章习题数据\exercise5_3.txt';
  3. input city $ class $ x1-x8;
  4. run;

然后使用proc discrim 过程进行分析;
代码如下:

添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注