Proc univariate

La proc univariate  è la principale procedura per l'analisi di statistiche descrittive per variabili quantitative. Le altre procedure statistiche di tipo univariato sono un sottoinsieme di questa.

La procedura permette il calcolo di numerose statistiche univariate e la produzione di grafici (ad alta risoluzione) di tipo esplorativo ( istogrammi, qqplot, pplot). I suoi comandi principali sono: 

proc univariate data=   opzioni; 
by variabili;                 /*per il calcolo di statistiche all'interno dei gruppi della variabile by*/
class variabili;             /*specifica variabili di classe per la costruzione di istogrammi comparativi */
histogram variabili;    /*produce istogramma delle variabili specificate*/
output out=        ;        /*crea data-set che contiene le informazioni/statistiche della procedura*/
probplot variabili;      /*produce pplot delle variabili specificate*/
qqplot variabili;         /*produce qqqplot delle variabili specificate*/
var variabili;              /*variabili del data-set da utilizzare nell'analisi*/


 

Vediamo ora alcuni esempi.

data anoressia;
infile "J:\Laboratorio\dati\anorexia1.txt" firstobs=2 dlm="09"x;
input tratt $ pre post;
proc univariate data=anoressia alpha=0.1; /*inizia la procedura univariate per gli intervalli di confidenza voglia alpha=0.1*/
var pre;                                                    /*voglio l'analisi sulla variabile pre*/
run;

Qui possiamo vedere tutte le statistiche prodotte dalla procedura univariate:

 

Nel seguente esempio si producono le stesse statistiche univariate ma all'interno dei gruppi definiti dal trattamento

proc sort data=anoressia out=anoressia1;          /*ordino prima i dati in base al trattamento*/
by tratt;                 
proc univariate data=anoressia1;
by tratt;                                                                 /*le statistiche vengono calcolate per ogni tipo di trattamento*/
var pre;
run;

 

Nel seguente esempio vediamo invece la generazione di un istogramma

proc univariate data=anoressia ;
var pre;
histogram pre /midpoints=70 to 100 by 1.5 normal; /*istogramma di pre: specifico il passo tra i punti centrali della classe dell'istogramma inoltre voglio una stima delle curva di densità tipo  normale da sovrapporre*/
run;

Qui si trova il grafico prodotto dalla procedura

 

Qui invece vediamo la generazione di + istogrammi per la variabile pre, all'interno delle classi di tratt

proc univariate data=anoressia ;
var pre;
class tratt;
histogram pre /midpoints=70 to 100 by 1.5 normal;
run;

Qui trovate tutto l'output della procedura statistiche e grafici compresi.

 

Nel seguente esempio generiamo qq-plot e pp-plot della variabile pre. Nelle opzioni si può specificare di utilizzare una distribuzione di confronto diversa dalla normale. Se non specifico niente (come nell'esempio) Sas utilizza la distribuzione normale

proc univariate data=anoressia ;
var pre;
qqplot pre;
probplot pre; 
run;

Qui si possono trovare i 2 grafici