Artwork

A tartalmat a Lucas Dixon and People + AI Research biztosítja. Az összes podcast-tartalmat, beleértve az epizódokat, grafikákat és podcast-leírásokat, közvetlenül a Lucas Dixon and People + AI Research vagy a podcast platform partnere tölti fel és biztosítja. Ha úgy gondolja, hogy valaki az Ön engedélye nélkül használja fel a szerzői joggal védett művét, kövesse az itt leírt folyamatot https://hu.player.fm/legal.
Player FM - Podcast alkalmazás
Lépjen offline állapotba az Player FM alkalmazással!

Give that model a treat! : Reinforcement learning explained

26:04
 
Megosztás
 

Manage episode 268430160 series 2770146
A tartalmat a Lucas Dixon and People + AI Research biztosítja. Az összes podcast-tartalmat, beleértve az epizódokat, grafikákat és podcast-leírásokat, közvetlenül a Lucas Dixon and People + AI Research vagy a podcast platform partnere tölti fel és biztosítja. Ha úgy gondolja, hogy valaki az Ön engedélye nélkül használja fel a szerzői joggal védett művét, kövesse az itt leírt folyamatot https://hu.player.fm/legal.

Switching gears, we focus on how Yannick’s been training his model using reinforcement learning. He explains the differences from David’s supervised learning approach. We find out how his system performs against a player that makes random tic-tac-toe moves.

Resources:

Deep Learning for JavaScript book

Playing Atari with Deep Reinforcement Learning

Two Minute Papers episode on Atari DQN

For more information about the show, check out pair.withgoogle.com/thehardway/.

You can reach out to the hosts on Twitter: @dweinberger and @tafsiri.

  continue reading

10 epizódok

Artwork
iconMegosztás
 
Manage episode 268430160 series 2770146
A tartalmat a Lucas Dixon and People + AI Research biztosítja. Az összes podcast-tartalmat, beleértve az epizódokat, grafikákat és podcast-leírásokat, közvetlenül a Lucas Dixon and People + AI Research vagy a podcast platform partnere tölti fel és biztosítja. Ha úgy gondolja, hogy valaki az Ön engedélye nélkül használja fel a szerzői joggal védett művét, kövesse az itt leírt folyamatot https://hu.player.fm/legal.

Switching gears, we focus on how Yannick’s been training his model using reinforcement learning. He explains the differences from David’s supervised learning approach. We find out how his system performs against a player that makes random tic-tac-toe moves.

Resources:

Deep Learning for JavaScript book

Playing Atari with Deep Reinforcement Learning

Two Minute Papers episode on Atari DQN

For more information about the show, check out pair.withgoogle.com/thehardway/.

You can reach out to the hosts on Twitter: @dweinberger and @tafsiri.

  continue reading

10 epizódok

Minden epizód

×
 
Loading …

Üdvözlünk a Player FM-nél!

A Player FM lejátszó az internetet böngészi a kiváló minőségű podcastok után, hogy ön élvezhesse azokat. Ez a legjobb podcast-alkalmazás, Androidon, iPhone-on és a weben is működik. Jelentkezzen be az feliratkozások szinkronizálásához az eszközök között.

 

Gyors referencia kézikönyv

Hallgassa ezt a műsort, miközben felfedezi
Lejátszás