In alcune occasioni abbiamo a disposizione più data-set e il nostro obbietivo è quello di unirli per avere un unico data-set su cui svolgere le nostre analisi.
Un caso tipico è quello in cui importiamo da fonti diverse 2 o più data-set "simili" (nel senso che hanno le stesse variabili). In questo caso importiamo i data-set e li uniamo con il comando set. Indispensabile è che i nomi delle variabili siano gli stessi per tutti i data set!. Se per esempio abbiamo importato i data-set prova1 e prova2 allora possiamo unirli in unico data-set, chiamato prova,con il seguente codice:
data prova;
set prova1 prova2;
Nell'ipotesi volessimo che il nuovo data-set fosse ordinato
in base ad una certa variabile, basterà far seguire al codice precendente
l'istruzione:
by variabile;
In altri casi dobbiamo unire due data-set che presentano una sola variabile in comune. Ad esempio vogliamo unire due data-set che hanno la variabile "codice" in comune. Dopo aver importato i due data-set (come prova1 e prova2 ad esempio), li ordiniamo (secondo la variabile comune) e quindi procediamo con i seguente comandi:.
data prova;
merge prova1 prova2;
by codice;
Con questa operazione nel data-set prova saranno presenti dei valori nulli che corrispondo a quei valori della variabile comune che sono presenti solo in un data set.