Apprendimento pratico di rinforzo La rete universitaria

Descrizione

Benvenuti al corso di apprendimento per rinforzo.

Qui scoprirai:

- fondamenti dei metodi RL: iterazione valore / politica, q-learning, gradiente politico, ecc.
- con matematica e batterie incluse

- utilizzo di reti neurali profonde per attività RL
- noto anche come "the hype train"

- algoritmi RL all'avanguardia
- e come applicare loro del nastro adesivo per problemi pratici.

- e, naturalmente, insegnando alla tua rete neurale a giocare
- perché questo è ciò di cui tutti pensano che RL sia. Lo useremo anche per seq2seq e banditi contestuali.

Salta dentro. Sarà divertente!

Hai problemi tecnici? Scrivici: coursera@hse.ru

Prezzo: Iscriviti gratuitamente!

Visualizza classe

Lingua: Inglese

Sottotitoli: Inglese, coreano

Apprendimento pratico di rinforzo - Scuola superiore di economia della National Research University

TUN aiuta gli studenti!

Gestione Contenuti

Risorse per gli studenti

Ricerca scolastica

TUNTV

TUNAI

Borse di studio

Ricerca di borse di studio

Inizia una borsa di studio

Comunita'

Al liceo

College

Diritto d'autore, 2024 – TUN, Inc

Privacy

WRI

Strumenti per studenti

Corsi online gratuiti

sconti per studenti

Eseguire a scuola

Stage