National Research University Higher School of Economics Istruzione online gratuita

Come vincere un concorso di scienza dei dati: impara dai migliori Kagglers

Descrizione

Se vuoi entrare nella scienza dei dati competitiva, questo corso fa per te! Partecipare a concorsi di modellazione predittiva può aiutarti ad acquisire esperienza pratica, migliorare e sfruttare le tue abilità di modellizzazione dei dati in vari settori come credito, assicurazioni, marketing, elaborazione del linguaggio naturale, previsioni di vendita e visione artificiale per citarne alcuni. Allo stesso tempo, puoi farlo in un contesto competitivo contro migliaia di partecipanti in cui ognuno cerca di creare l'algoritmo più predittivo. Spingere l'un l'altro al limite può comportare prestazioni migliori e errori di previsione più piccoli. Essere in grado di raggiungere costantemente alti livelli può aiutarti ad accelerare la tua carriera nella scienza dei dati.

In questo corso, imparerai ad analizzare e risolvere in modo competitivo tali attività di modellazione predittiva.

Al termine di questa lezione, dovrai:

- Comprendere come risolvere le competizioni di modellazione predittiva in modo efficiente e apprendere quali delle abilità ottenute possono essere applicabili alle attività del mondo reale.
- Scopri come preelaborare i dati e generare nuove funzionalità da varie fonti come testo e immagini.
- Impara tecniche avanzate di ingegneria delle caratteristiche come la generazione di codifiche medie, l'utilizzo di misure statistiche aggregate o l'individuazione dei vicini più vicini come mezzo per migliorare le tue previsioni.
- Essere in grado di formare metodologie di convalida incrociata affidabili che ti aiutino a confrontare le tue soluzioni ed evitare overfitting o underfitting quando testate con dati non osservati (test).
- Acquisire esperienza nell'analisi e interpretazione dei dati. Diventerai consapevole di incongruenze, livelli di rumore elevati, errori e altri problemi relativi ai dati come le perdite e imparerai come superarli.
- Acquisisci la conoscenza di diversi algoritmi e impara a regolare in modo efficiente i loro iperparametri e ottenere le massime prestazioni.
- Padroneggia l'arte di combinare diversi modelli di apprendimento automatico e impara a creare un insieme.
- Esponi a soluzioni e codici passati (vincenti) e impara a leggerli.

Disclaimer: questo non è un corso di apprendimento automatico in senso generale. Questo corso ti insegnerà come ottenere soluzioni di alto livello contro migliaia di concorrenti concentrandoti sull'uso pratico dei metodi di apprendimento automatico piuttosto che sulle basi teoriche dietro di loro.

Prerequisiti:
- Python: lavora con DataFrame nei panda, traccia figure in matplotlib, importa e addestra modelli da scikit-learn, XGBoost, LightGBM.
- Machine Learning: comprensione di base di modelli lineari, K-NN, foresta casuale, aumento del gradiente e reti neurali.

Hai problemi tecnici? Scrivici: coursera@hse.ru

Prezzo: Iscriviti gratuitamente!

Lingua: Inglese

Sottotitoli: Inglese, coreano

Come vincere un concorso di scienza dei dati: impara dai migliori Kagglers - Scuola superiore di economia della National Research University