|
Le Tecniche del
Data Mining
La maggior parte delle aziende utilizza strumenti
OLAP (On Line Analytic Processing) per eseguire interrogazioni specifiche
sui database aziendali. Questi strumenti realizzano report riassuntivi
molto interessanti, come ad esempio le vendite ripartite per area
geografica.
Il data mining consente agli utenti di strumenti OLAP
di andare oltre i report riassuntivi. Il data mining dice perché un
certo fenomeno sta succedendo, mentre l'OLAP si limita a dire cosa sta
succedendo. Le relazioni fra i dati e le linee di tendenza sono spesso
nascosti nei report riassuntivi. Il data mining aiuta le aziende a
scoprire queste preziose informazioni.
Per esempio, il data mining può scoprire gruppi
di clienti o di prodotti che condividono caratteristiche simili. Per
capire cosa significa, diamo uno sguardo ai dati giornalieri di acquisizione
di clienti di una banca.

Risultati dell'OLAP
Il risultato dello strumento OLAP è un grafico
che fornisce un'informazione molto chiara: l'acquisizione di clienti
sta seguendo un trend positivo nonostante abbia avuto una flessione
nei mesi centrali dell'anno. Se però si procede con ulteriori
analisi e si affiancano alle tecniche di OLAP le tecniche di data mining
emergono delle informazioni diverse. Procedendo ad una segmentazione
dei clienti acquisiti tramite una cluster analysis si osserva la distribuzione
della clientela rappresentata nel grafico.

Risultati del Data Mining
Il grafico mostra che l'acquisizione sta aumentando
fra i clienti di "Breve termine", è sostanzialmente stabile
fra i clienti definiti "Generici" e sta calando fra quelli di "Lungo
termine". Dal momento che i clienti di "Lungo termine" sono i più interessanti
per la banca, questa tendenza rappresenta un problema. Disponendo di
questa ripartizione è stato innanzitutto possibile rilevare
il problema, e sarà possibile studiare azioni specifiche di
marketing dirette a invertire la tendenza.
E' quindi evidente che gli strumenti OLAP rappresentano
una base di partenza, ma non sono in grado di fornire lo stesso contributo
informativo delle tecniche di data mining.
La rapida crescita nell'uso delle tecniche avanzate
di data mining deriva dal valore aggiunto fornito dalla combinazione
di questi tre elementi:
- uso di tecniche analitiche
più sofisticate
per fornire informazioni di qualità
- distribuzione delle informazioni in una forma comprensibile
e facilmente interpretabile
- ottenimento di risultati operativi in tempo reale

L'utilizzo delle tecniche avanzate viene anche detto modeling e
può essere rappresentato tramite questo diagramma:
Gli strumenti del Data Mining si dividono in due gruppi:
entrambi necessari per progetti completi di data mining.
Strumenti di indagine
La maggior parte degli strumenti
di indagine fu sviluppata nell'ambito della ricerca sull'intelligenza
artificiale. Questi strumenti
identificano relazioni e tendenze nei dati, aiutando a scoprire fenomeni
di mercato e, di conseguenza, a consolidare le conoscenze di base sul
proprio business. Le nuove conoscenze possono essere usate per aumentare
i propri margini di competitività o il proprio giro d'affari.
SPSS offre diversi strumenti di indagine:
- Indagine esplorativa
- Alberi
decisionali
- Cluster analysis
- Analisi fattoriale
- Association rules
- Rule induction
Strumenti di verifica
Comunque, pur offrendo strumenti
di indagine innovativi, SPSS pensa che la verifica svolga un ruolo
determinante nel data mining,
ed è questo il motivo per cui SPSS ha continuato e continuerà ad
espandere la propria offerta "classica" di strumenti di analisi statistica.
Se gli strumenti di indagine possono portare a interessanti scoperte
sulla propria attività, non possono spiegare perché e
nemmeno se, queste scoperte sono valide e utili. La maggior parte degli
strumenti di indagine esegue test per analizzare le differenze tra
gruppi. Spesso questi test portano a conclusioni sbagliate, per via
della loro natura probabilistica. Gli strumenti di verifica servono
a convalidare le scoperte fatte in sede di indagine, per garantire
decisioni corrette. Ecco alcuni degli strumenti di verifica offerti
da SPSS:
- Correlazioni
- T-test
- ANOVA
- Regressione lineare
- Regressione logistica
- Analisi discriminante
- Previsioni
|