Šī grāmata — detalizēts ceļvedis jaunākajiem dziļās mācīšanās ar pastiprinājumu rīkiem un to ierobežojumiem. Mēs īstenosim un pārbaudīsim praksē krusts-entrropijas un vērtību iterācijas (Q-mācīšanās) metodes, kā arī stratēģiju gradientus. Eksperimentiem tiks izmantotas visdažādākās pastiprināšanas mācīšanās (RL) vides, sākot no klasiskajiem... CartPole un GridWorld un beidzot ar Atari emulatoriem un nepārtrauktas vadības vidēm (balstoties uz PyBullet un RoboSchool). Daudzi piemēri balstīti uz nestandarta vidēm, kurās mēs no nulles izstrādāsim apkārtni. Šajā grāmatā - Jūs uzzināsiet, kādu vietu dziļās mācīšanās kontekstā ieņem RL metodes, īstenosiet sarežģītas dziļās mācīšanās modeļus. - Izpētīsiet RL pamatus: Markova lēmumu pieņemšanas procesus. - Apskatīsiet RL metožu īstenošanas piemērus: krusts-entrropijas metode, DQN, A3C, TRPO, PPO, DDPG, D4PG un citas. - Uzzināsiet, kā strādāt ar diskretām un nepārtrauktām darbību telpām dažādās vidēs. - Redzēsiet, kā izstrādāt sistēmu, kas mācās spēlēt Atari spēles, izmantojot pastiprināšanas mācīšanos. - Izveidosiet savu vidi pēc OpenAI Gym modeļa, lai apmācītu biržas aģentu. - Īstenosiet AlphaGo Zero metodi spēlē Connect4. - Iepazīsieties ar RL pielietojumu runas apstrādē: uzzināsiet, kā apmācīt dialoga robotu, izmantojot frāzes no filmām.
Autors: Maksim Lapan
Izdevniecība: piter
Sērija: Dlja professionalov
Vecuma ierobežojumi: 16+
Izdošanas gads: 2020
ISBN: 9785446110797
Lappušu skaits: 496
Izmērs: 233x164x22 mm
Vāka tips: мягкая
Svars: 634 g
ID: 861751
Piegādes veidi
Izvēlieties piemērotu piegādes metodi
Izņemt no veikala
0.00 €
Piegāde pakomātā
Piegāde ar kurjeru