相关性分析处理变量之间的关系。 相关系数是两个变量之间的线性关联的度量。相关系数的值总是在-1和+1之间。 SAS提供过程PROC CORR以找到数据集中的一对变量之间的相关系数。
语法
在SAS中应用PROC CORR的基本语法是:
- PROC CORR DATA = dataset options;
- VAR variable;
以下是使用的参数的描述:
- Dataset是数据集的名称。
- 选项是附加选项,其中包括绘制矩阵等过程。
- 变量是用于查找相关性的数据集的变量名称。
例
数据集中可用的一对变量之间的相关系数可以通过在VAR语句中使用它们的名称来获得。 在下面的例子中,我们使用数据集CARS1并得到显示马力和重量之间的相关系数的结果。
- PROC SQL;
- create table CARS1 as
- SELECT invoice,horsepower,length,weight
- FROM
- SASHELP.CARS
- WHERE make in ('Audi','BMW')
- ;
- RUN;
- proc corr data=cars1 ;
- VAR horsepower weight ;
- BY make;
- run;
当执行上面的代码中,我们得到以下结果:

所有变量之间的相关性
通过简单地应用具有数据集名称的过程,可以获得数据集中可用的所有变量之间的相关系数。
例
在下面的例子中,我们使用数据集CARS1并获得显示每对变量之间的相关系数的结果。
- proc corr data=cars1 ;
- run;
当执行上面的代码中,我们得到以下结果:

相关矩阵
我们可以通过在PROC语句中选择绘制矩阵的选项来获得变量之间的散点图矩阵。
例
在下面的例子中,我们得到马力和重量之间的矩阵。
- proc corr data=cars1 plots=matrix ;
- VAR horsepower weight ;
- run;
当执行上面的代码中,我们得到以下结果:

转载本站内容时,请务必注明来自W3xue,违者必究。