Descrizione
Benvenuti al corso di apprendimento per rinforzo.
Qui scoprirai:
- fondamenti dei metodi RL: iterazione valore / politica, q-learning, gradiente politico, ecc.
- con matematica e batterie incluse
- utilizzo di reti neurali profonde per attività RL
- noto anche come "the hype train"
- algoritmi RL all'avanguardia
- e come applicare loro del nastro adesivo per problemi pratici.
- e, naturalmente, insegnando alla tua rete neurale a giocare
- perché questo è ciò di cui tutti pensano che RL sia. Lo useremo anche per seq2seq e banditi contestuali.
Salta dentro. Sarà divertente!
Hai problemi tecnici? Scrivici: coursera@hse.ru
Prezzo: Iscriviti gratuitamente!
Lingua: Inglese
Sottotitoli: Inglese, coreano
Apprendimento pratico di rinforzo - Scuola superiore di economia della National Research University
TUN aiuta gli studenti!
Borse di studio
Comunita'
Diritto d'autore, 2024 – TUN, Inc