La proc univariate è la principale procedura per l'analisi di statistiche descrittive per variabili quantitative. Le altre procedure statistiche di tipo univariato sono un sottoinsieme di questa.
La procedura permette il calcolo di numerose statistiche univariate e la produzione di grafici (ad alta risoluzione) di tipo esplorativo ( istogrammi, qqplot, pplot). I suoi comandi principali sono:
proc univariate
data= opzioni;
by variabili; /*per il
calcolo di statistiche all'interno dei gruppi della variabile by*/
class variabili; /*specifica variabili di classe per la costruzione di istogrammi
comparativi */
histogram
variabili; /*produce istogramma delle variabili
specificate*/
output out=
; /*crea data-set che contiene le
informazioni/statistiche della procedura*/
probplot
variabili; /*produce pplot delle variabili
specificate*/
qqplot
variabili;
/*produce qqqplot delle variabili specificate*/
var variabili;
/*variabili del data-set da utilizzare nell'analisi*/
Vediamo ora alcuni esempi.
data anoressia;
infile "J:\Laboratorio\dati\anorexia1.txt" firstobs=2
dlm="09"x;
input tratt $ pre post;
proc univariate data=anoressia
alpha=0.1; /*inizia la procedura univariate per gli intervalli di confidenza
voglia alpha=0.1*/
var
pre;
/*voglio l'analisi sulla variabile pre*/
run;
Qui possiamo vedere tutte le statistiche prodotte dalla procedura univariate:
Nel seguente esempio si producono le stesse statistiche univariate ma all'interno dei gruppi definiti dal trattamento
proc sort data=anoressia
out=anoressia1; /*ordino
prima i dati in base al trattamento*/
by
tratt;
proc univariate data=anoressia1;
by
tratt;
/*le statistiche vengono calcolate per ogni tipo di trattamento*/
var
pre;
run;
Nel seguente esempio vediamo invece la generazione di un istogramma
proc univariate data=anoressia ;
var pre;
histogram pre /midpoints=70
to 100 by 1.5 normal; /*istogramma di pre: specifico il passo tra i punti
centrali della classe dell'istogramma inoltre voglio una stima delle
curva di densità tipo normale da sovrapporre*/
run;
Qui si trova il grafico prodotto dalla procedura
Qui invece vediamo la generazione di + istogrammi per la variabile pre, all'interno delle classi di tratt
proc univariate
data=anoressia ;
var pre;
class tratt;
histogram pre /midpoints=70 to
100 by 1.5 normal;
run;
Qui trovate tutto l'output della procedura statistiche e grafici compresi.
Nel seguente esempio generiamo qq-plot e pp-plot della variabile pre. Nelle opzioni si può specificare di utilizzare una distribuzione di confronto diversa dalla normale. Se non specifico niente (come nell'esempio) Sas utilizza la distribuzione normale
proc univariate
data=anoressia ;
var pre;
qqplot pre;
probplot
pre;
run;
Qui si possono trovare i 2 grafici