Data mining
Il data mining è un insieme di metodologie e tecniche che consentono di estrapolare le informazioni utili da una grande quantità di dati. Il termine data mining è traducibile letteralmente in "estrazione di dati". Le tecniche di data mining rappresentano un settore tra l'informatica e il marketing. Le principali finalità delle attività di data mining sono le seguenti:
- Estrazione dati utili. Lo scopo principale del data mining è l'estrapolazione di informazioni utili da grandi quantità di dati. Si tratta di informazioni nascoste e a valore aggiunto altrimenti non facilmente ottenibili dalle comuni tecniche di ricerca. Ad esempio, una comune tecnica di ricerca può cercare un numero di telefono in un archivio dati. Il data mining, invece, consente di individuare delle informazioni aggiuntive come, ad esempio, la concentrazione territoriale dei clienti di un particolare prodotto, ecc.
- Analisi dei dati. Il data mining consente anche di analizzare i dati alla ricerca di uno schema significativo ( patterne ) e di correlazioni tra i dati. Ogni ente, azienda o organizzazione possiede una notevole quantità di dati storici inutilizzati. L'analisi del data storage consente di individuare nuove informazioni e relazioni causali tra eventi, fenomeni e decisioni passate.
Le tecniche di data mining possono essere automatiche o semiautomatiche. Il processo automatico è generalmente effettuato mediante specifici software di esplorazione ed estrazione dati. La fase di interpretazione dei risultati è, invece, affidata a tecnici ed esperti in materia. Le principali fasi del processo di datamining sono l'associazione, l'analisi delle sequenze e degli eventi interconnessi, la classificazione, il clustering e la previsione.
Organizzazione dei dati. Le aziende e le organizzazioni hanno una moltitudine di informazioni inutilizzate a causa di un'inefficiente organizzazione dei dati. Le informazioni sono sparse in diversi sistemi di archiviazione. Ad esempio, molte informazioni del passato sono archiviate sotto forma di file fisici, altre sono invece archiviate su database diversi senza seguire uno stesso criterio logico. La mancata consapevolezza del valore strategico di queste informazioni da parte del management è uno dei principali ostacoli al processo di razionalizzazione dell'organizzazione dei dati e delle tecniche di data mining.