2 Introduzione
L’obiettivo della prima parte di questo libro è quello di farvi prendere velocità con gli strumenti di base dell’ esplorazione dei dati il più velocemente possibile. L’esplorazione dei dati è l’arte di guardare i vostri dati, generare rapidamente delle ipotesi, testarle rapidamente e poi ripetere ancora e ancora e ancora. L’obiettivo dell’esplorazione dei dati è quello di generare molte piste promettenti che si possono poi esplorare più in profondità.
In questa parte del libro imparerai alcuni strumenti utili che hanno un ritorno immediato:
La visualizzazione è un ottimo punto di partenza per la programmazione in R, perché il guadagno è palese: si possono fare grafici eleganti e informativi che aiutano a capire i dati. In visualizzazione vi immergerete nella visualizzazione, imparando la struttura di base di una trama ggplot2, e potenti tecniche per trasformare i dati in grafici.
La sola visualizzazione di solito non è sufficiente, quindi in trasformazione imparerete i verbi chiave che vi permettono di selezionare le variabili importanti, filtrare le osservazioni chiave, creare nuove variabili e calcolare le sintesi.
Infine, in analisi esplorativa, combinerai la visualizzazione e la trasformazione con la tua curiosità e il tuo scetticismo per chiedere e rispondere domande interessanti sui dati.
La modellazione è una parte importante del processo esplorativo, ma non hai ancora le competenze per impararla o applicarla efficacemente. Ci torneremo in modelling, una volta che sarete meglio equipaggiati con più strumenti di programmazione e gestione dei dati.
Nascosti tra questi tre capitoli che vi insegnano gli strumenti di esplorazione ci sono tre capitoli che si concentrano sul vostro flusso di lavoro in R. In workflow: basi, workflow: script, e workflow: progetti imparerete le buone pratiche per scrivere e organizzare il vostro codice R. Queste vi porteranno al successo nel lungo periodo, dato che vi daranno gli strumenti per rimanere organizzati quando affronterete i progetti reali.