 |
da PC Magazine
SPSS 10
Nuovi modelli e tecniche di analisi
e rappresentazione dei dati, anche su base geografica, dimostrano
la capacità di aggiornamento di un programma ormai storico
Nel particolare settore dell'informatica che si occupa
di statistica, l'azienda SPSS è da anni tra le più importanti a livello
mondiale, grazie soprattutto all'omonimo pacchetto informatico per
uso professionale. Il fatto stesso che stiamo analizzando la versione
10 di SPSS è una conferma del consolidato successo di questo prodotto,
sono pochi i prodotti software professionali che possono vantare l'uscita
di una versione a "doppia cifra", riuscendo ancora a suscitare così tanto
interesse tra gli utenti nonché a far parlare ancora così tanto di
sé a ogni nuova versione. La scelta di SPSS, sin dalla prima versione
per Windows, è stata quella di strutturare il suo pacchetto di punta
a moduli. Ciascun modulo aggiuntivo mette a disposizione del suo acquirente
una serie di strumenti, per lo più di analisi, che vanno a integrarsi
a quelli offerti dal modulo denominato Base.
SPSS
Base
Il
modulo Base, nucleo centrale dell'intero pacchetto, è il programma
vero e proprio, perfettamente funzionante in autonomia, e risulta dotato
di operazioni più che sufficienti per una statistica generale e/o propedeutiche
per ogni tipo di indagine statistica di livello più avanzato. Le funzioni
statistiche offerte dal modulo Base del software SPSS 10.0 sono veramente
numerose, interessano varie tipologie d'analisi: sono presenti le funzioni
descrittive come media, varianza e frequenze, di correlazione bivariata,
parziale e altre, la regressione lineare, la riduzione dei dati, l'analisi
della varianza (Anova), i test non parametrici nonché la cluster analysis.
Il modulo Regression Models integra al sistema alcune statistiche che
potremmo definire "professionali", per esempio regressione logistica,
regressione non lineare, probit analysis e così via, in quanto introducono
procedure comprensibili con la semplice consultazione dei dati analizzati.
Il modulo Avanced Models aggiunge al pacchetto Base statistiche avanzate
come modello lineare generalizzato (Glm), tecniche di Manova, regressione
di Cox e altre ancora. Le potenzialità di SPSS non si limitano alle
procedure prettamente statistiche; gli altri sette moduli, infatti,
riservano sorprese non indifferenti. Con Tables è possibile creare
accattivanti presentazioni e report in tabella, con Exact Test migliorare
le prestazioni dei test parametrici, attraverso Categories eseguire
la nuova analisi delle corrispondenze principali usando il metodo Proxscal,
con Trends eseguire l'analisi delle serie storiche, con Conjoint abbiamo
a disposizione un'intera collezione di strumenti di marketing e infine
con Missing Value Analysis un ottimo strumento per la procedura di
riassegnazione dei valori mancanti.
Arriva
il Modulo Maps
L'ultimo
dei sette moduli aggiuntivi è Maps, una innovazione significativa integrata
molto bene sia col modulo Base, sia con gli altri moduli aggiuntivi.
Le molteplici procedure fornite dagli strumenti del modulo Maps ci
consentono di migliorare l'analisi e la presentazione di qualsiasi
serie di dati demografici, attraverso rappresentazioni geografiche.
Creare una mappa, personalizzata secondo i propri gusti (colori, stili,
etichette) è veramente semplice e sicuramente divertente. Una vasta
disponibilità di dataset gratuiti, la possibilità di importare mappe
aggiuntive per scopi specifici e un'apposita sintassi SPSS permettono
la creazione di altre, nuove mappe a soddisfazione di ogni nostro desiderio.
Ma
c'è qualcosa di nuovo?
SPSS
10.0 non presenta difficoltà di sorta nella sua installazione e, inoltre,
non sembra pretenzioso in fatto di risorse di sistema: anche utilizzando
un Pentium non velocissimo è possibile ottenere ottimi risultati. In
realtà, i 32 Mbyte di Ram indicati dalla software house in presenza
di una grossa mole di dati da elaborare. A proposito di mole di dati,
a questo punto è possibile anticipare la prima grande novità del pacchetto
in esame: SPSS 10.0, contrariamente alle precedenti versioni, può analizzare
grandi set di dati senza alcuna limitazione nella dimensione del file
dati. Inoltre, la versione Server del software di cui stiamo trattando,
commercializzata come SPSS Statistics Server 10.0, permette di ottimizzare le
prestazioni, lasciando al server il pesante compito di effettuare tutto
il lavoro di calcolo; in tal modo è possibile analizzare imponenti
set di dati con più rapidità di quanta ne consentivano le precedenti
versioni. In pratica avviene che, con la gestione dei dati tutta a
carico del server, si ottiene un sensibile aumento della velocità di
calcolo nonché una notevole diminuzione del traffico della rete. Un'altra
piacevole novità della recente versione di SPSS 10.0 è quella relativa
ai file temporanei creati continuamente dal programma, che occupano
spazio del nostro hard disk: le "creazioni" temporanee da parte di
SPSS 10.0 sono, fortunatamente, molto più piccole e maneggevoli di
quelle che venivano create dalle precedenti edizioni del programma.
Numerose e provvidenziali altre novità, introdotte con la versione
10, riguardano l'accesso ai dati, che avviene ora senza alcuna preventiva
conversione o copia. Gli utenti abituati a conservare i propri dati
su database, come Access, o su fogli elettronici come Excel, apprezzeranno
senz'altro la possibilità di utilizzare i propri archivi senza dover
passare attraverso una lunga serie di conversioni. Infatti ora è possibile
aprire direttamente file Excel o Access senza alcun pericolo di perdere
dati. E' ora anche possibile lavorare con sessioni multiple, rimanendo
così "produttivi" anche durante l'esecuzione di procedure complesse
e lunghe. Un'altra caratteristica peculiare di SPSS 10.0 è che i grafici
interattivi possono finalmente essere incollati in altre applicazioni,
ed è possibile anche trattarli come file Wmf, così da rendere migliore
il ridimensionamento senza dover combattere con strani fenomeni di
segmentazione di bordi e linee. SPSS 10.0 risulta essere molto più funzionale
non solo di qualunque versione precedente (non poteva che essere così)
ma anche di molti software concorrenti, soprattutto nella fase della
gestione dei dati.
Come
lavorare al meglio
Il
nuovo editor permette di inserire i nostri dati direttamente sulla
griglia e consente -attraverso l'utilizzo del solo tasto Ctrl - anche
di compiere selezioni di righe e/o colonne non contigue. Con la nuova
versione abbiamo a disposizione sempre la solita griglia, che ci viene
mostrata all'avvio del programma, ma ci troveremo davanti a due "fogli",
del tutto simili ai fogli di lavoro di Excel, denominati: Visualizzazione
dati e Visualizzazione variabili. Nel primo foglio, Visualizzazione
variabili, dovremo inserire le variabili con tutte le loro caratteristiche,
per esempio tipo di dati, etichette e lunghezza. Visualizzazione variabili è composto
da tante righe quante sono le variabili e da ben nove colonne. Oltre
al nome della variabile, semplicemente selezionando i comandi da comodi
menu a tendina, impostare il tipo di dati della variabile come testo,
numero o data, la lunghezza della stessa, il numero di decimali da
considerare, l'etichetta da visualizzare, le etichette dei valori (per
esempio "M" per maschio, "F" per femmina) i valori da attribuire ai
dati mancanti, il numero di colonne da accettare, la giustificazione
a video e, importantissima, il tipo di misura da utilizzare fra le
tre possibili: scala, ordinale e nominale. Questa nuova interfaccia
si rivela subito molto comoda. Aggiungere, rinominare, modificare o
eliminare una variabile non è mai stato così facile. Nel secondo foglio,
Visualizzazione dati, sono invece visualizzati tutti in nostri dati.
Le righe, ovviamente, saranno tante quante sono i record, cioè la dimensione
della nostra popolazione di studio, mentre le colonne saranno tante
quante sono le righe del primo foglio, ovvero il numero delle variabili.
Aprendo un nuovo file, SPSS 10.0 si disporrà automaticamente sul foglio
Visualizzazione variabili. Dopo aver inserito le variabili e almeno
una unità, SPSS 10.0 si posizionerà invece sul foglio Visualizzazione
dati. L'inserimento di nuove variabili non presenta alcun problema: è possibile
agire sia da Visualizzazione variabili, aggiungendo una nuova riga,
sia da Visualizzazione dati, inserendo una nuova colonna. Anche l'inserimento
di variabili calcolate non risulta affatto difficile. La visualizzazione
in contemporanea dei dati originari e di quelli via via prodotti dalle
elaborazioni è stata sempre una delle caratteristiche peculiari di
SPSS. In pratica, possiamo applicare qualunque formula matematica a
una o più variabili per generarne, in un attimo, una nuova.
Ora
tocca allo statistico
Una
volta generate tutte le variabili di cui abbiamo bisogno, possiamo
cominciare a utilizzare SPSS 10.0 per le nostre analisi statistiche.
E' impossibile, in questo contesto, ricordare tutte le statistiche
che SPSS 10.0 ci mette a disposizione, in quanto sono incredibilmente
numerose e varie. Oltre a tutte le statistiche descrittive come frequenze,
media e varianza, sono presenti tutte le tecniche di regressione lineare
più utilizzate, per esempio backward elimination, metodo stepwise,
R^2, matrice di correlazione e delle covarianze e metodo
Durbin-Watson. I modelli Anova a una via e fattoriali, la correlazione
bivariata e parziale, i testi non parametrici (chi quadro, binominale,
due o più campioni in relazione), l'analisi delle risposte multiple,
i sette metodi di data reduction maggiormente utilizzati, l'analisi
dei cluster e l'analisi discriminante sono tutti compresi nel modulo
Base. Con l'aggiunta degli altri moduli, si vengono ad aggiungere altre
importanti funzionalità specifiche. Una critica che si può fare a SPSS
10.0 è quella di continuare a essere poco versatile di fronte alle
tecniche geometriche come l'analisi in Corrispondenze e l'analisi in
Componenti principali, per le quali si ostina ad adottare una metodologia
che ci porta troppo distante dalle necessità pratiche dell'analisi,
per esempio, la rappresentazione grafica delle analisi geometriche è ancora
di livello deludente. Inoltre più di una volta lo statistico, soprattutto
se ancora inesperto, potrebbe trovarsi costretto a muoversi per tentativi,
non esistendo uno strumento che sia in grado di suggerirci quali tecniche
applicare o preferire alle altre. Tra le novità statistiche della versione
10, accenniamo alla nuova analisi denominata Roc utilizzabile per identificare
quale test, tra tutti i possibili nel caso in questione, sia da considerarsi
quello migliore. Questa tecnica è abbastanza innovativa e non mancherà di
attirare l'attenzione di chiunque abbia familiarità con i test statistici.
Nel modulo Categories, invece, è stata migliorata significativamente
l'Analisi delle Componenti Principali (non lineare, di scuola francese)
denominata Catpca. Infine, sono state introdotte alcune nuove analisi
tipiche del Data Mining. Nel modulo Categories, in particolare, la
funzionalità Proxscal ci aiuta a far risaltare la struttura nascosta
nei dati, attribuendo alle osservazioni posizioni specifiche nello
spazio concettuale. Queste tecniche di Data Mining sembrano ormai essere
diventate una vera moda da seguire per molte società di marketing e,
conseguentemente, per SPSS. Noi non possiamo che essere felici per
questa scelta davvero al passo con i tempi. Un potente strumento da
data mining sono i cubi OLAP (Online Analytical Processing, la più diffusa
tecnica di elaborazione analitica sui dati) in grado di fornire informazioni
complesse con un procedimento semplice e intuitivo. Dopo aver creato
tabelle, grafici e cubi di report, sarà possibile scambiare righe,
colonne, e strati dei cubi per ottenere delle nuove visualizzazioni,
e per interpretare gli stessi in modo differente. Anche i tipi di grafici
disponibili sono ampiamente sufficienti a soddisfare ogni nostra esigenza.
I grafici possono essere anche interattivi. Su un grafico interattivo è possibile
compiere operazioni che permettono di ottenere viste diverse dello
stesso oggetto grafico. I grafici che si realizzano sono facilmente
esportabili in altri software, in quanto è possibile salvarli anche
in formato Bmp, Jpg, Tiff e Wmf. Un'altra piacevole novità di SPSS
10.0 è che, con un semplice accorgimento, è possibile esportare i modelli
in formato Xml. Ciò, insieme alle nuove possibilità in fase di importazione
di dati Excel, garantisce una migliore integrazione di questo software
con gli altri pacchetti software e, perché no, con i sistemi di pubblicazione
Web basati a loro volta su Xml.
Conclusioni
Anche
questa volta SPSS ha fatto le cose in maniera corretta. Affrontiamo
ogni nuova uscita di questo prodotto con il dubbio di cosa potrebbe
essere ancora aggiunto o migliorato e ogni volta veniamo puntualmente
smentiti. Il modulo Maps, la possibilità di leggere file di Excel,
e soprattutto il nuovo editor di dati posizionano SPSS 10.0 almeno
un gradino sopra tutti i suoi concorrenti.
(Andrea Gennari)
tratto da PC Magazine Ottobre 2000 (sez.Test Software)
|
|
|