Cloudera Formazione online gratuita

Gestione dei big data in cluster e cloud storage

Descrizione

In questo corso imparerai come gestire grandi set di dati, come caricarli in cluster e cloud storage e come applicare la struttura ai dati in modo da poter eseguire query su di essi utilizzando motori SQL distribuiti come Apache Hive e Apache Impala . Imparerai come scegliere i giusti tipi di dati, sistemi di archiviazione e formati di file in base agli strumenti che utilizzerai e alle prestazioni di cui hai bisogno.

Entro la fine del corso, sarai in grado di farlo
• utilizzare diversi strumenti per sfogliare i database e le tabelle esistenti nei sistemi di big data;
• utilizzare diversi strumenti per esplorare i file nei filesystem di big data distribuiti e nel cloud storage;
• creare e gestire database e tabelle di big data utilizzando Apache Hive e Apache Impala; e
• descrivere e scegliere tra diversi tipi di dati e formati di file per i sistemi di big data.

Per utilizzare l'ambiente pratico per questo corso, è necessario scaricare e installare una macchina virtuale e il software su cui eseguirlo. Prima di continuare, assicurati di avere accesso a un computer che soddisfi i seguenti requisiti hardware e software:
• Sistema operativo Windows, macOS o Linux (iPad e tablet Android non funzioneranno)
• Sistema operativo a 64 bit (i sistemi operativi a 32 bit non funzioneranno)
• 8 GB di RAM o più
• 25 GB di spazio libero su disco o più
• Supporto della virtualizzazione Intel VT-x o AMD-V abilitato (su computer Mac con processori Intel, questo è sempre abilitato;
su computer Windows e Linux, potrebbe essere necessario abilitarlo nel BIOS)
• Solo per computer Windows XP: è necessario disporre di un'utilità di decompressione come 7-Zip o WinZip installata (l'utilità di decompressione integrata di Windows XP non funzionerà)

Prezzo: Iscriviti gratuitamente!

Lingua: Inglese

Sottotitoli: Inglese

Gestione dei big data in cluster e cloud storage - Cloudera