Lépjen offline állapotba az Player FM alkalmazással!
DeepSeek R1
Fetch error
Hmmm there seems to be a problem fetching this series right now. Last successful fetch was on August 29, 2025 07:37 ()
What now? This series will be checked again in the next day. If you believe it should be working, please verify the publisher's feed link below is valid and includes actual episode links. You can contact support to request the feed be immediately fetched.
Manage episode 465086680 series 1998876
DeepSeek R1 sorgte im Januar für Aufsehen: Ein chinesisches KI-Modell, das mit offenen Gewichten und ausgefeiltem Chain-of-Thought Reasoning die etablierten US-amerikanischen Modelle wie o1 herausfordert – und das zu einem Bruchteil der bisher als notwendig erachteten Kosten. Die Ankündigung ließ sogar die Aktienkurse namhafter Chiphersteller einbrechen. Wie gelang DeepSeek dieser Durchbruch? Welche innovativen Engineering-Ansätze ermöglichten den Sprung vom klassischen Foundation Model zum leistungsstarken Reasoning-Modell? Ole und Robert nehmen die Evolution von DeepSeek R1 unter die Lupe und analysieren die mehrschichtigen technischen Innovationen, die hinter diesem Erfolg stehen. Sie diskutieren außerdem die konkreten Auswirkungen dieser Entwicklung auf den deutschen Unternehmenssektor.
Shownotes:
- Buch: "Thinking, Fast and Slow"
- Chain of Thought Prompting
- How cheap, outsourced labour in Africa is shaping AI English (RLHF)
- AlphaGo: The Movie
- Group Relative Policy Optimization (GRPO)
- Running DeepSeek V3 671B on M4 Mac Mini Cluster
- DeepSeek FAQ von Ben Thompson auf Stratecherry
- Gewinner und Verlierer nach dem KI-Erdbeben: Analyse von Marcel Weiß für FAZ (Paywall)
- DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning (das Paper zur Veröffentlichung von R1)
- DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models
- ARC Prize: ARC-AGI Benchmark
175 epizódok
Fetch error
Hmmm there seems to be a problem fetching this series right now. Last successful fetch was on August 29, 2025 07:37 ()
What now? This series will be checked again in the next day. If you believe it should be working, please verify the publisher's feed link below is valid and includes actual episode links. You can contact support to request the feed be immediately fetched.
Manage episode 465086680 series 1998876
DeepSeek R1 sorgte im Januar für Aufsehen: Ein chinesisches KI-Modell, das mit offenen Gewichten und ausgefeiltem Chain-of-Thought Reasoning die etablierten US-amerikanischen Modelle wie o1 herausfordert – und das zu einem Bruchteil der bisher als notwendig erachteten Kosten. Die Ankündigung ließ sogar die Aktienkurse namhafter Chiphersteller einbrechen. Wie gelang DeepSeek dieser Durchbruch? Welche innovativen Engineering-Ansätze ermöglichten den Sprung vom klassischen Foundation Model zum leistungsstarken Reasoning-Modell? Ole und Robert nehmen die Evolution von DeepSeek R1 unter die Lupe und analysieren die mehrschichtigen technischen Innovationen, die hinter diesem Erfolg stehen. Sie diskutieren außerdem die konkreten Auswirkungen dieser Entwicklung auf den deutschen Unternehmenssektor.
Shownotes:
- Buch: "Thinking, Fast and Slow"
- Chain of Thought Prompting
- How cheap, outsourced labour in Africa is shaping AI English (RLHF)
- AlphaGo: The Movie
- Group Relative Policy Optimization (GRPO)
- Running DeepSeek V3 671B on M4 Mac Mini Cluster
- DeepSeek FAQ von Ben Thompson auf Stratecherry
- Gewinner und Verlierer nach dem KI-Erdbeben: Analyse von Marcel Weiß für FAZ (Paywall)
- DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning (das Paper zur Veröffentlichung von R1)
- DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models
- ARC Prize: ARC-AGI Benchmark
175 epizódok
All episodes
×Üdvözlünk a Player FM-nél!
A Player FM lejátszó az internetet böngészi a kiváló minőségű podcastok után, hogy ön élvezhesse azokat. Ez a legjobb podcast-alkalmazás, Androidon, iPhone-on és a weben is működik. Jelentkezzen be az feliratkozások szinkronizálásához az eszközök között.