Artwork

A tartalmat a Whitehat SEO and Whitehat Inbound Marketing Agency biztosítja. Az összes podcast-tartalmat, beleértve az epizódokat, grafikákat és podcast-leírásokat, közvetlenül a Whitehat SEO and Whitehat Inbound Marketing Agency vagy a podcast platform partnere tölti fel és biztosítja. Ha úgy gondolja, hogy valaki az Ön engedélye nélkül használja fel a szerzői joggal védett művét, kövesse az itt leírt folyamatot https://hu.player.fm/legal.
Player FM - Podcast alkalmazás
Lépjen offline állapotba az Player FM alkalmazással!

Unpacking OpenAI's Latest Reasoning Models

11:32
 
Megosztás
 

Manage episode 442461526 series 2330470
A tartalmat a Whitehat SEO and Whitehat Inbound Marketing Agency biztosítja. Az összes podcast-tartalmat, beleértve az epizódokat, grafikákat és podcast-leírásokat, közvetlenül a Whitehat SEO and Whitehat Inbound Marketing Agency vagy a podcast platform partnere tölti fel és biztosítja. Ha úgy gondolja, hogy valaki az Ön engedélye nélkül használja fel a szerzői joggal védett művét, kövesse az itt leírt folyamatot https://hu.player.fm/legal.
Comparing the reasoning capabilities of two new OpenAI models, o1-mini and o1-preview, through a series of tests. The first test involved a classic children's game, the Tower of London, which assesses the ability to plan and reason about future states. Both models struggled with the game's rules, suggesting they still lack fundamental reasoning skills. The second test involved a hypothetical business scenario, where the models were tasked with analyzing risks, opportunities, and strategic paths forward based on provided information. The models performed poorly, often simply regurgitating information without providing valuable insights or critical analysis. Finally, the video concluded that, despite the initial hype surrounding the models, they don’t represent a significant leap in reasoning capabilities compared to older models like GPT-3. Although the authors acknowledge that the models are still under development, they express disappointment that they are not yet able to perform complex reasoning tasks in a way that would be useful for real-world applications.
  continue reading

96 epizódok

Artwork
iconMegosztás
 
Manage episode 442461526 series 2330470
A tartalmat a Whitehat SEO and Whitehat Inbound Marketing Agency biztosítja. Az összes podcast-tartalmat, beleértve az epizódokat, grafikákat és podcast-leírásokat, közvetlenül a Whitehat SEO and Whitehat Inbound Marketing Agency vagy a podcast platform partnere tölti fel és biztosítja. Ha úgy gondolja, hogy valaki az Ön engedélye nélkül használja fel a szerzői joggal védett művét, kövesse az itt leírt folyamatot https://hu.player.fm/legal.
Comparing the reasoning capabilities of two new OpenAI models, o1-mini and o1-preview, through a series of tests. The first test involved a classic children's game, the Tower of London, which assesses the ability to plan and reason about future states. Both models struggled with the game's rules, suggesting they still lack fundamental reasoning skills. The second test involved a hypothetical business scenario, where the models were tasked with analyzing risks, opportunities, and strategic paths forward based on provided information. The models performed poorly, often simply regurgitating information without providing valuable insights or critical analysis. Finally, the video concluded that, despite the initial hype surrounding the models, they don’t represent a significant leap in reasoning capabilities compared to older models like GPT-3. Although the authors acknowledge that the models are still under development, they express disappointment that they are not yet able to perform complex reasoning tasks in a way that would be useful for real-world applications.
  continue reading

96 epizódok

همه قسمت ها

×
 
Loading …

Üdvözlünk a Player FM-nél!

A Player FM lejátszó az internetet böngészi a kiváló minőségű podcastok után, hogy ön élvezhesse azokat. Ez a legjobb podcast-alkalmazás, Androidon, iPhone-on és a weben is működik. Jelentkezzen be az feliratkozások szinkronizálásához az eszközök között.

 

Gyors referencia kézikönyv

Hallgassa ezt a műsort, miközben felfedezi
Lejátszás