La proc reg esegue analisi di regressione su una o + variabili. Il comando + importante è model, in cui specifichiamo il modello di regressione e molte altre opzioni. Nelle opzioni di questo comando è possibile specificare (tra le altre cose) il metodo di selezione dei predittori e le statistiche che devono essere prodotte.
Il comando plot produce inoltre grafici a 2 dimensioni per "vedere" i dati e per eventuali operazioni di diagnostica (in questo senso ci vengo in aiuto le parole chiave della procedura come predicted. e residual. variabili che contengono i valori previsti e i residui del modello).
Informazioni sul modello (residui , valori previsti ecc..) possono essere salvare su un nuovo data-set per successive analisi.
Vediamo un semplice esempio:
data car;
infile "c:\c_sas\dati\spesa.txt" firstobs=2;
input y x1 x2 x3
x4 x5 x6 x7 $;
run;
proc reg data= car corr
;
/*inizo procedura reg specifico inoltre che voglio la matrice di
correlazione dei predittori*/
model y=x1 x2 x3 x4 x5 / selection=
stepwise clm; /* scelgo selezionestepwise inoltre stampo i valori
previsti dal modello e gli intervalli di confidenza per tali valori
previsti*/
print
anova;
/* tabella di analisi della varianza
*/
symbol v=dot
c=blue;
/*stili grafici*/
plot y*x1 y*x3
;
/* plotto le 2 variabili + interessanti*/
plot
predicted.*residual.;
/*diagnostica sul modello: verifico se è rispettata l'assunzione di normalità
utilizzando parole chiave della proc reg*/
run;
L'output si può torvare qui