Corso Base Modeler
​
Obiettivi:
Nozioni introduttive all’uso di SPSS Modeler.
​
Tecniche presentate:
Introduzione alla qualità dei dati e introduzione alla manipolazione dei dati e data preparation, panoramica dei nodi grafici, tematiche avanzate di trattamento dati quali campionamento, gestione dei dati mancanti, manipolazione di file.
​
Prerequisiti:
E’ richiesta minima familiarità con il PC, con Windows e con i più diffusi strumenti di office automation.
Introduzione
-
Introduzione a Modeler
-
Cenni metodologici e CRISP-DM
-
Utilizzo della GUI e dello help
-
Modeler Client e Server
-
File di lavoro, salvataggio e organizzazione in progetti
Utilizzo dei nodi e analisi
-
Lettura di file dati da diverse fonti (db, testo, excel, e altri formati proprietari)
-
Diverse tipologie di campi, lettura automatica e impostazione manuale del tipo
-
Introduzione alla qualità dei dati:
-
Riconoscimento e trattamento dei nulli
-
Strumenti diagnostici per riconoscere outliers e/o altre anomalie dei dati
-
-
Introduzione alla manipolazione dei dati e data preparation
-
Oprazioni di base su record e campi
-
Ordinamenti di campi e record
-
Generazione nuovi campi
-
Utilizzo del linguaggio CLEM e generatore di espressioni
-
Modalità multipla di creazione di campi
-
-
Panoramica dei nodi grafici e loro utilizzo di analisi/esplorazione dati e modalità interattiva
-
Studio delle distribuzioni uni variate e relazioni bivariate tra i dati
Tematiche avanzate di trattamento dati
-
Utilizzo contemporaneo di più fonti dati
-
Aggregazioni
-
Unioni di fonti dati
-
Accomodamenti
-
-
L'utilizzo di super nodi
-
Campionamento
-
Tecniche base di campionamento
-
Campionamento per l'efficientamento delle esecuzioni
-
Separazione di fonti dati in base a campioni
-
Caching dei dati
-
Partizionamento dei dati
-
-
Gestione dei dati mancanti
-
Impostazione dei valori blank
-
Utilizzo dei valori globali per sostituzioni
-
Controllo automatico di valori nulli e fuori range
-
Consigli sulla gestione dei nulli
-
-
Lavorare con le date
-
Opzioni generali di formato e date a due cifre
-
Letture e trasformazioni di dati
-
Applicazione di formule a campi molteplici
-
-
Lavorare con dati stringa
-
Esempi avanzati di manipolazione di stringhe
-
-
Lavorare con dati sequenziali
-
Conteggi e stato
-
Le funzioni di dati sequenziali in Modeler
-
-
Manipolazione di file
-
Utilizzo dell'aggregazione
-
Trasposizioni pure e condizionali dei file
-
Creazioni di campi flag/ funzioni indicatrici da dati categoriali
-
-
Cenni sulle tipologie di join e ottimizzazione SQL
Introduzione al modeling
-
Panoramica delle tecniche di modeling
-
Reti neurali
-
Alberi decisionali
-
Modelli di previsione (predizione) statistici
-
Regressioni lineari e logistica
-
Tecniche di clustering
-
Tecniche di riduzuione della dimensionalità (analisi componenti principali)
-
Regole di associazione
-
-
Utilizzo di una rete neurale
-
Comprensione delle logiche delle reti neurali
-
Utilizzo di alberi decisionali in modalità base e interattiva
-
Combinazione e comparazione di modelli diversi
-
Esempio di clustering
-
Esempi di utilizzo di regole di associazione