National Research University Higher School of Economics Istruzione online gratuita

Apprendimento pratico di rinforzo

Descrizione

Benvenuti al corso di apprendimento per rinforzo.

Qui scoprirai:

- fondamenti dei metodi RL: iterazione valore / politica, q-learning, gradiente politico, ecc.
- con matematica e batterie incluse

- utilizzo di reti neurali profonde per attività RL
- noto anche come "the hype train"

- algoritmi RL all'avanguardia
- e come applicare loro del nastro adesivo per problemi pratici.

- e, naturalmente, insegnando alla tua rete neurale a giocare
- perché questo è ciò di cui tutti pensano che RL sia. Lo useremo anche per seq2seq e banditi contestuali.

Salta dentro. Sarà divertente!

Hai problemi tecnici? Scrivici: coursera@hse.ru

Prezzo: Iscriviti gratuitamente!

Lingua: Inglese

Sottotitoli: Inglese, coreano

Apprendimento pratico di rinforzo - Scuola superiore di economia della National Research University