Unire data-set (set e merge)
 

Unire (accodare) data-set simili con l'opzione set

In alcune occasioni abbiamo a disposizione più data-set e il nostro obbietivo è quello di unirli per avere un unico data-set su cui svolgere le nostre analisi. 

Un caso tipico è quello in cui importiamo da fonti diverse 2 o più data-set "simili" (nel senso che hanno le stesse variabili). In questo caso importiamo i data-set e li uniamo con il comando set. Indispensabile è che i nomi delle variabili siano gli stessi per tutti i data set!. Se per esempio abbiamo importato i data-set prova1 e prova2 allora possiamo unirli in unico data-set, chiamato prova,con il seguente codice:

data prova;
set prova1 prova2;
 

Nell'ipotesi volessimo che il nuovo data-set  fosse ordinato in base ad una certa variabile, basterà far seguire al codice precendente l'istruzione:
by variabile;

Unire data-set con una variabile in comune

In altri casi dobbiamo unire due data-set che presentano una sola variabile in comune. Ad esempio vogliamo unire due data-set che hanno la variabile "codice" in comune. Dopo aver importato i due data-set (come prova1 e prova2 ad esempio), li ordiniamo (secondo la variabile comune) e  quindi procediamo con i seguente comandi:.

data prova;
merge prova1 prova2;
by codice;

Con questa operazione nel data-set prova saranno presenti dei valori nulli che corrispondo a quei valori della variabile comune che sono presenti solo in un data set.