top of page
Statistics_stamp-03.png
Training MOD

Corso Base Modeler

​

Obiettivi: 

Nozioni introduttive all’uso di SPSS Modeler.

​

Tecniche presentate

Introduzione alla qualità dei dati e introduzione alla manipolazione dei dati e data preparation, panoramica dei nodi grafici, tematiche avanzate di trattamento dati quali campionamento, gestione dei dati mancanti, manipolazione di file.

​

Prerequisiti

E’ richiesta minima familiarità con il PC, con Windows e con i più diffusi strumenti di office automation.

 

Introduzione

  • Introduzione a Modeler

  • Cenni metodologici e CRISP-DM

  • Utilizzo della GUI e dello help

  • Modeler Client e Server

  • File di lavoro, salvataggio e organizzazione in progetti

 

Utilizzo dei nodi e analisi

  • Lettura di file dati da diverse fonti (db, testo, excel, e altri formati proprietari)

  • Diverse tipologie di campi, lettura automatica e impostazione manuale del tipo

  • Introduzione alla qualità dei dati:

    • Riconoscimento e trattamento dei nulli

    • Strumenti diagnostici per riconoscere outliers e/o altre anomalie dei dati

  • Introduzione alla manipolazione dei dati e data preparation

    • Oprazioni di base su record e campi

    • Ordinamenti di campi e record

    • Generazione nuovi campi

    • Utilizzo del linguaggio CLEM e generatore di espressioni

    • Modalità multipla di creazione di campi

  • Panoramica dei nodi grafici e loro utilizzo di analisi/esplorazione dati e modalità interattiva

  • Studio delle distribuzioni uni variate e relazioni bivariate tra i dati

 

Tematiche avanzate di trattamento dati

  • Utilizzo contemporaneo di più fonti dati

    • Aggregazioni

    • Unioni di fonti dati

    • Accomodamenti

  • L'utilizzo di super nodi

  • Campionamento

    • Tecniche base di campionamento

    • Campionamento per l'efficientamento delle esecuzioni

    • Separazione di fonti dati in base a campioni

    • Caching dei dati

    • Partizionamento dei dati

  • Gestione dei dati mancanti

    • Impostazione dei valori blank

    • Utilizzo dei valori globali per sostituzioni

    • Controllo automatico di valori nulli e fuori range

    • Consigli sulla gestione dei nulli

  • Lavorare con le date

    • Opzioni generali di formato e date a due cifre

    • Letture e trasformazioni di dati

    • Applicazione di formule a campi molteplici

  • Lavorare con dati stringa

    • Esempi avanzati di manipolazione di stringhe

  • Lavorare con dati sequenziali

    • Conteggi e stato

    • Le funzioni di dati sequenziali in Modeler

  • Manipolazione di file

    • Utilizzo dell'aggregazione

    • Trasposizioni pure e condizionali dei file

    • Creazioni di campi flag/ funzioni indicatrici da dati categoriali

  • Cenni sulle tipologie di join e ottimizzazione SQL

 

Introduzione al modeling

  • Panoramica delle tecniche di modeling

    • Reti neurali

    • Alberi decisionali

    • Modelli di previsione (predizione) statistici

    • Regressioni lineari e logistica

    • Tecniche di clustering

    • Tecniche di riduzuione della dimensionalità (analisi componenti principali)

    • Regole di associazione

  • Utilizzo di una rete neurale

  • Comprensione delle logiche delle reti neurali

  • Utilizzo di alberi decisionali in modalità base e interattiva

  • Combinazione e comparazione di modelli diversi

  • Esempio di clustering

  • Esempi di utilizzo di regole di associazione

Logo IBM gold_partner
bottom of page