SPSS_IBM_LOGO  
Worldwide Offices Contatti Job SPSS.com  
 
 
  •  
     


    da PC Magazine

    SPSS 10

    Nuovi modelli e tecniche di analisi e rappresentazione dei dati, anche su base geografica, dimostrano la capacità di aggiornamento di un programma ormai storico

    Nel particolare settore dell'informatica che si occupa di statistica, l'azienda SPSS è da anni tra le più importanti a livello mondiale, grazie soprattutto all'omonimo pacchetto informatico per uso professionale. Il fatto stesso che stiamo analizzando la versione 10 di SPSS è una conferma del consolidato successo di questo prodotto, sono pochi i prodotti software professionali che possono vantare l'uscita di una versione a "doppia cifra", riuscendo ancora a suscitare così tanto interesse tra gli utenti nonché a far parlare ancora così tanto di sé a ogni nuova versione. La scelta di SPSS, sin dalla prima versione per Windows, è stata quella di strutturare il suo pacchetto di punta a moduli. Ciascun modulo aggiuntivo mette a disposizione del suo acquirente una serie di strumenti, per lo più di analisi, che vanno a integrarsi a quelli offerti dal modulo denominato Base.

    SPSS Base

    Il modulo Base, nucleo centrale dell'intero pacchetto, è il programma vero e proprio, perfettamente funzionante in autonomia, e risulta dotato di operazioni più che sufficienti per una statistica generale e/o propedeutiche per ogni tipo di indagine statistica di livello più avanzato. Le funzioni statistiche offerte dal modulo Base del software SPSS 10.0 sono veramente numerose, interessano varie tipologie d'analisi: sono presenti le funzioni descrittive come media, varianza e frequenze, di correlazione bivariata, parziale e altre, la regressione lineare, la riduzione dei dati, l'analisi della varianza (Anova), i test non parametrici nonché la cluster analysis. Il modulo Regression Models integra al sistema alcune statistiche che potremmo definire "professionali", per esempio regressione logistica, regressione non lineare, probit analysis e così via, in quanto introducono procedure comprensibili con la semplice consultazione dei dati analizzati. Il modulo Avanced Models aggiunge al pacchetto Base statistiche avanzate come modello lineare generalizzato (Glm), tecniche di Manova, regressione di Cox e altre ancora. Le potenzialità di SPSS non si limitano alle procedure prettamente statistiche; gli altri sette moduli, infatti, riservano sorprese non indifferenti. Con Tables è possibile creare accattivanti presentazioni e report in tabella, con Exact Test migliorare le prestazioni dei test parametrici, attraverso Categories eseguire la nuova analisi delle corrispondenze principali usando il metodo Proxscal, con Trends eseguire l'analisi delle serie storiche, con Conjoint abbiamo a disposizione un'intera collezione di strumenti di marketing e infine con Missing Value Analysis un ottimo strumento per la procedura di riassegnazione dei valori mancanti.

    Arriva il Modulo Maps

    L'ultimo dei sette moduli aggiuntivi è Maps, una innovazione significativa integrata molto bene sia col modulo Base, sia con gli altri moduli aggiuntivi. Le molteplici procedure fornite dagli strumenti del modulo Maps ci consentono di migliorare l'analisi e la presentazione di qualsiasi serie di dati demografici, attraverso rappresentazioni geografiche. Creare una mappa, personalizzata secondo i propri gusti (colori, stili, etichette) è veramente semplice e sicuramente divertente. Una vasta disponibilità di dataset gratuiti, la possibilità di importare mappe aggiuntive per scopi specifici e un'apposita sintassi SPSS permettono la creazione di altre, nuove mappe a soddisfazione di ogni nostro desiderio.

    Ma c'è qualcosa di nuovo?

    SPSS 10.0 non presenta difficoltà di sorta nella sua installazione e, inoltre, non sembra pretenzioso in fatto di risorse di sistema: anche utilizzando un Pentium non velocissimo è possibile ottenere ottimi risultati. In realtà, i 32 Mbyte di Ram indicati dalla software house in presenza di una grossa mole di dati da elaborare. A proposito di mole di dati, a questo punto è possibile anticipare la prima grande novità del pacchetto in esame: SPSS 10.0, contrariamente alle precedenti versioni, può analizzare grandi set di dati senza alcuna limitazione nella dimensione del file dati. Inoltre, la versione Server del software di cui stiamo trattando, commercializzata come SPSS Statistics Server 10.0, permette di ottimizzare le prestazioni, lasciando al server il pesante compito di effettuare tutto il lavoro di calcolo; in tal modo è possibile analizzare imponenti set di dati con più rapidità di quanta ne consentivano le precedenti versioni. In pratica avviene che, con la gestione dei dati tutta a carico del server, si ottiene un sensibile aumento della velocità di calcolo nonché una notevole diminuzione del traffico della rete. Un'altra piacevole novità della recente versione di SPSS 10.0 è quella relativa ai file temporanei creati continuamente dal programma, che occupano spazio del nostro hard disk: le "creazioni" temporanee da parte di SPSS 10.0 sono, fortunatamente, molto più piccole e maneggevoli di quelle che venivano create dalle precedenti edizioni del programma. Numerose e provvidenziali altre novità, introdotte con la versione 10, riguardano l'accesso ai dati, che avviene ora senza alcuna preventiva conversione o copia. Gli utenti abituati a conservare i propri dati su database, come Access, o su fogli elettronici come Excel, apprezzeranno senz'altro la possibilità di utilizzare i propri archivi senza dover passare attraverso una lunga serie di conversioni. Infatti ora è possibile aprire direttamente file Excel o Access senza alcun pericolo di perdere dati. E' ora anche possibile lavorare con sessioni multiple, rimanendo così "produttivi" anche durante l'esecuzione di procedure complesse e lunghe. Un'altra caratteristica peculiare di SPSS 10.0 è che i grafici interattivi possono finalmente essere incollati in altre applicazioni, ed è possibile anche trattarli come file Wmf, così da rendere migliore il ridimensionamento senza dover combattere con strani fenomeni di segmentazione di bordi e linee. SPSS 10.0 risulta essere molto più funzionale non solo di qualunque versione precedente (non poteva che essere così) ma anche di molti software concorrenti, soprattutto nella fase della gestione dei dati.

    Come lavorare al meglio

    Il nuovo editor permette di inserire i nostri dati direttamente sulla griglia e consente -attraverso l'utilizzo del solo tasto Ctrl - anche di compiere selezioni di righe e/o colonne non contigue. Con la nuova versione abbiamo a disposizione sempre la solita griglia, che ci viene mostrata all'avvio del programma, ma ci troveremo davanti a due "fogli", del tutto simili ai fogli di lavoro di Excel, denominati: Visualizzazione dati e Visualizzazione variabili. Nel primo foglio, Visualizzazione variabili, dovremo inserire le variabili con tutte le loro caratteristiche, per esempio tipo di dati, etichette e lunghezza. Visualizzazione variabili è composto da tante righe quante sono le variabili e da ben nove colonne. Oltre al nome della variabile, semplicemente selezionando i comandi da comodi menu a tendina, impostare il tipo di dati della variabile come testo, numero o data, la lunghezza della stessa, il numero di decimali da considerare, l'etichetta da visualizzare, le etichette dei valori (per esempio "M" per maschio, "F" per femmina) i valori da attribuire ai dati mancanti, il numero di colonne da accettare, la giustificazione a video e, importantissima, il tipo di misura da utilizzare fra le tre possibili: scala, ordinale e nominale. Questa nuova interfaccia si rivela subito molto comoda. Aggiungere, rinominare, modificare o eliminare una variabile non è mai stato così facile. Nel secondo foglio, Visualizzazione dati, sono invece visualizzati tutti in nostri dati. Le righe, ovviamente, saranno tante quante sono i record, cioè la dimensione della nostra popolazione di studio, mentre le colonne saranno tante quante sono le righe del primo foglio, ovvero il numero delle variabili. Aprendo un nuovo file, SPSS 10.0 si disporrà automaticamente sul foglio Visualizzazione variabili. Dopo aver inserito le variabili e almeno una unità, SPSS 10.0 si posizionerà invece sul foglio Visualizzazione dati. L'inserimento di nuove variabili non presenta alcun problema: è possibile agire sia da Visualizzazione variabili, aggiungendo una nuova riga, sia da Visualizzazione dati, inserendo una nuova colonna. Anche l'inserimento di variabili calcolate non risulta affatto difficile. La visualizzazione in contemporanea dei dati originari e di quelli via via prodotti dalle elaborazioni è stata sempre una delle caratteristiche peculiari di SPSS. In pratica, possiamo applicare qualunque formula matematica a una o più variabili per generarne, in un attimo, una nuova.

    Ora tocca allo statistico

    Una volta generate tutte le variabili di cui abbiamo bisogno, possiamo cominciare a utilizzare SPSS 10.0 per le nostre analisi statistiche. E' impossibile, in questo contesto, ricordare tutte le statistiche che SPSS 10.0 ci mette a disposizione, in quanto sono incredibilmente numerose e varie. Oltre a tutte le statistiche descrittive come frequenze, media e varianza, sono presenti tutte le tecniche di regressione lineare più utilizzate, per esempio backward elimination, metodo stepwise, R^2, matrice di correlazione e delle covarianze e metodo Durbin-Watson. I modelli Anova a una via e fattoriali, la correlazione bivariata e parziale, i testi non parametrici (chi quadro, binominale, due o più campioni in relazione), l'analisi delle risposte multiple, i sette metodi di data reduction maggiormente utilizzati, l'analisi dei cluster e l'analisi discriminante sono tutti compresi nel modulo Base. Con l'aggiunta degli altri moduli, si vengono ad aggiungere altre importanti funzionalità specifiche. Una critica che si può fare a SPSS 10.0 è quella di continuare a essere poco versatile di fronte alle tecniche geometriche come l'analisi in Corrispondenze e l'analisi in Componenti principali, per le quali si ostina ad adottare una metodologia che ci porta troppo distante dalle necessità pratiche dell'analisi, per esempio, la rappresentazione grafica delle analisi geometriche è ancora di livello deludente. Inoltre più di una volta lo statistico, soprattutto se ancora inesperto, potrebbe trovarsi costretto a muoversi per tentativi, non esistendo uno strumento che sia in grado di suggerirci quali tecniche applicare o preferire alle altre. Tra le novità statistiche della versione 10, accenniamo alla nuova analisi denominata Roc utilizzabile per identificare quale test, tra tutti i possibili nel caso in questione, sia da considerarsi quello migliore. Questa tecnica è abbastanza innovativa e non mancherà di attirare l'attenzione di chiunque abbia familiarità con i test statistici. Nel modulo Categories, invece, è stata migliorata significativamente l'Analisi delle Componenti Principali (non lineare, di scuola francese) denominata Catpca. Infine, sono state introdotte alcune nuove analisi tipiche del Data Mining. Nel modulo Categories, in particolare, la funzionalità Proxscal ci aiuta a far risaltare la struttura nascosta nei dati, attribuendo alle osservazioni posizioni specifiche nello spazio concettuale. Queste tecniche di Data Mining sembrano ormai essere diventate una vera moda da seguire per molte società di marketing e, conseguentemente, per SPSS. Noi non possiamo che essere felici per questa scelta davvero al passo con i tempi. Un potente strumento da data mining sono i cubi OLAP (Online Analytical Processing, la più diffusa tecnica di elaborazione analitica sui dati) in grado di fornire informazioni complesse con un procedimento semplice e intuitivo. Dopo aver creato tabelle, grafici e cubi di report, sarà possibile scambiare righe, colonne, e strati dei cubi per ottenere delle nuove visualizzazioni, e per interpretare gli stessi in modo differente. Anche i tipi di grafici disponibili sono ampiamente sufficienti a soddisfare ogni nostra esigenza. I grafici possono essere anche interattivi. Su un grafico interattivo è possibile compiere operazioni che permettono di ottenere viste diverse dello stesso oggetto grafico. I grafici che si realizzano sono facilmente esportabili in altri software, in quanto è possibile salvarli anche in formato Bmp, Jpg, Tiff e Wmf. Un'altra piacevole novità di SPSS 10.0 è che, con un semplice accorgimento, è possibile esportare i modelli in formato Xml. Ciò, insieme alle nuove possibilità in fase di importazione di dati Excel, garantisce una migliore integrazione di questo software con gli altri pacchetti software e, perché no, con i sistemi di pubblicazione Web basati a loro volta su Xml.

    Conclusioni

    Anche questa volta SPSS ha fatto le cose in maniera corretta. Affrontiamo ogni nuova uscita di questo prodotto con il dubbio di cosa potrebbe essere ancora aggiunto o migliorato e ogni volta veniamo puntualmente smentiti. Il modulo Maps, la possibilità di leggere file di Excel, e soprattutto il nuovo editor di dati posizionano SPSS 10.0 almeno un gradino sopra tutti i suoi concorrenti.

    (Andrea Gennari)

    tratto da PC Magazine Ottobre 2000 (sez.Test Software)

     
    Documento senza titolo
    iso9001
    Accredia