Formazione online gratuita

Data Science: Wrangling

Descrizione

In questo corso, parte del nostro programma di certificazione professionale in Data Science, copriamo diversi passaggi standard del processo di data wrangling come importazione di dati in R, riordino dei dati, elaborazione di stringhe, analisi HTML, utilizzo di date e ore ed estrazione di testo. Raramente tutti questi passaggi di discussione sono necessari in una singola analisi, ma un data scientist probabilmente li affronterà tutti a un certo punto. Molto raramente i dati sono facilmente accessibili in un progetto di data science. È più probabile che i dati si trovino in un file, in un database o siano estratti da documenti come pagine web, tweet o PDF. In questi casi, il primo passo è importare i dati in R e riordinare i dati, utilizzando il pacchetto tidyverse. I passaggi che convertono i dati dalla loro forma grezza a quella ordinata sono chiamati data wrangling. Questo processo è un passaggio fondamentale per qualsiasi data scientist. Sapere come trattare e pulire i dati ti consentirà di ottenere intuizioni critiche che altrimenti sarebbero nascoste.

Prezzo: GRATUITO per l'audit!

Data Science: Wrangling through edX, una piattaforma per l'educazione fondata da Harvard e dal MIT.

Data Science: Wrangling -