Artwork

A tartalmat a David Such biztosítja. Az összes podcast-tartalmat, beleértve az epizódokat, grafikákat és podcast-leírásokat, közvetlenül a David Such vagy a podcast platform partnere tölti fel és biztosítja. Ha úgy gondolja, hogy valaki az Ön engedélye nélkül használja fel a szerzői joggal védett művét, kövesse az itt leírt folyamatot https://hu.player.fm/legal.
Player FM - Podcast alkalmazás
Lépjen offline állapotba az Player FM alkalmazással!

Deterministic LLMs: Claims and Challenges

23:03
 
Megosztás
 

Manage episode 507521914 series 3620285
A tartalmat a David Such biztosítja. Az összes podcast-tartalmat, beleértve az epizódokat, grafikákat és podcast-leírásokat, közvetlenül a David Such vagy a podcast platform partnere tölti fel és biztosítja. Ha úgy gondolja, hogy valaki az Ön engedélye nélkül használja fel a szerzői joggal védett művét, kövesse az itt leírt folyamatot https://hu.player.fm/legal.

Send us a text

In this episode, we investigate the growing conversation around deterministic large language models (LLMs), models designed to always return the same output for the same input. We contrast this with the more common stochastic LLMs that rely on random sampling and parallel computation, making their outputs variable even with identical prompts.

We explore the engineering efforts aimed at reducing this variability, including recent claims by Thinking Machines about “batch invariance.” While it’s a step forward, some analysts argue it’s overstated as a singular breakthrough. The episode dives into the multiple causes of non-determinism, from floating-point arithmetic and system-level batching to architectural features like Mixture-of-Experts.

We also weigh the pros and cons of determinism. On the plus side: improved debugging, reproducible benchmarks, and greater trust in high-stakes applications like finance or medicine. On the downside: reduced creative output, increased computational overhead, and significant engineering complexity.

Ultimately, we ask: Is true end-to-end determinism a worthwhile goal—or just an ideal that forces too many trade-offs?

Support the show

If you are interested in learning more then please subscribe to the podcast or head over to https://medium.com/@reefwing, where there is lots more content on AI, IoT, robotics, drones, and development. To support us in bringing you this material, you can buy me a coffee or just provide feedback. We love feedback!

  continue reading

50 epizódok

Artwork
iconMegosztás
 
Manage episode 507521914 series 3620285
A tartalmat a David Such biztosítja. Az összes podcast-tartalmat, beleértve az epizódokat, grafikákat és podcast-leírásokat, közvetlenül a David Such vagy a podcast platform partnere tölti fel és biztosítja. Ha úgy gondolja, hogy valaki az Ön engedélye nélkül használja fel a szerzői joggal védett művét, kövesse az itt leírt folyamatot https://hu.player.fm/legal.

Send us a text

In this episode, we investigate the growing conversation around deterministic large language models (LLMs), models designed to always return the same output for the same input. We contrast this with the more common stochastic LLMs that rely on random sampling and parallel computation, making their outputs variable even with identical prompts.

We explore the engineering efforts aimed at reducing this variability, including recent claims by Thinking Machines about “batch invariance.” While it’s a step forward, some analysts argue it’s overstated as a singular breakthrough. The episode dives into the multiple causes of non-determinism, from floating-point arithmetic and system-level batching to architectural features like Mixture-of-Experts.

We also weigh the pros and cons of determinism. On the plus side: improved debugging, reproducible benchmarks, and greater trust in high-stakes applications like finance or medicine. On the downside: reduced creative output, increased computational overhead, and significant engineering complexity.

Ultimately, we ask: Is true end-to-end determinism a worthwhile goal—or just an ideal that forces too many trade-offs?

Support the show

If you are interested in learning more then please subscribe to the podcast or head over to https://medium.com/@reefwing, where there is lots more content on AI, IoT, robotics, drones, and development. To support us in bringing you this material, you can buy me a coffee or just provide feedback. We love feedback!

  continue reading

50 epizódok

All episodes

×
 
Loading …

Üdvözlünk a Player FM-nél!

A Player FM lejátszó az internetet böngészi a kiváló minőségű podcastok után, hogy ön élvezhesse azokat. Ez a legjobb podcast-alkalmazás, Androidon, iPhone-on és a weben is működik. Jelentkezzen be az feliratkozások szinkronizálásához az eszközök között.

 

Gyors referencia kézikönyv

Hallgassa ezt a műsort, miközben felfedezi
Lejátszás