Descrizione
Questo corso introdurrà lo studente alle basi del mining e della manipolazione del testo. Il corso inizia con una comprensione di come il testo viene gestito da Python, la struttura del testo sia per la macchina che per gli umani e una panoramica del framework nltk per la manipolazione del testo. La seconda settimana si concentra sulle esigenze di manipolazione comuni, tra cui espressioni regolari (ricerca di testo), pulizia del testo e preparazione del testo per l'uso da parte dei processi di apprendimento automatico. La terza settimana applicherà i metodi di elaborazione del linguaggio naturale di base al testo e dimostrerà come viene raggiunta la classificazione del testo. L'ultima settimana esplorerà metodi più avanzati per rilevare gli argomenti nei documenti e raggrupparli per somiglianza (modellazione degli argomenti).
Questo corso dovrebbe essere seguito dopo: Introduzione alla scienza dei dati in Python, Tracciamento applicato, Creazione di grafici e rappresentazione dei dati in Python e Applied Machine Learning in Python.
Prezzo: Iscriviti gratuitamente!
Lingua: Inglese
Sottotitoli: Inglese, coreano
Estrazione di testo applicata in Python - Università del Michigan
TUN aiuta gli studenti!
Borse di studio
Comunita'
Diritto d'autore, 2024 – TUN, Inc