Siri mit Vision-LLM und eigenem AI-Runtime auf Apple-Hardware

9. June 20269. June 2026
AI Models, Claude Code

Apple nutzt Vision-LLMs für Siri-Integration ohne Änderungen in bestehenden Apps und stellt Core AI PyTorch Extensions bereit, um Entwicklern eigene Modelle auf Apple-Hardware auszuführen.

Share on:

Socratic-SWE: Selbstlernende KI-Agenten für Code-Reparaturen

8. June 20268. June 2026
AI Models, Claude Code

Ein selbstlernender Rahmen für Code-Reparatur-Agenten nutzt deren Lösungsspuren direkt zur gezielten Generierung von Trainingsaufgaben und erreicht damit höhere Genauigkeit als bisherige Ansätze.

Share on:

Wie Reinforcement-Learning-Umgebungen Trainingsqualität zerstören – praktische Lösungen

5. June 20265. June 2026
AI Models, Claude Code

RL-Umgebungen mit Softwarefehlern (Stale Cache, Reward Hacks, falsche State-Übergänge) erzeugen giftige Trainingsdaten, die Agenten-Training sabotieren – systematische Qualitätsprüfung ist notwendig.

Share on:

Claude Code, Codex und Cursor im Praxistest: Drei KI-Coding-Agenten im direkten Vergleich

5. June 20265. June 2026
Claude AI, Claude Code

Grüne CI/CD-Checks sind kein zuverlässiger Indikator dafür, dass ein KI-generierter Pull Request produktionsreif ist.

Share on:

Dream.exe: Video-Generierungsmodelle auf praktische Robotik-Fähigkeiten testen

5. June 20265. June 2026
AI Models, Claude Code

Während Video-Generierungsmodelle visuell überzeugende Bewegungen erzeugen, korreliert visuelle Qualität nicht mit der praktischen Ausführbarkeit durch Roboter — ein Evaluierungskriterium, das Standard-Metriken übersehen.

Share on:

Google Gemma 4 12B: Multimodales Modell für lokale Ausführung

5. June 20265. June 2026
AI Models, Google, Google Gemini

Google veröffentlicht Gemma 4 12B als Apache-2.0-lizenziertes Multimodal-Modell mit vereinheitlichter Architektur, das mit 16 GB VRAM lokal auf Laptops läuft und Text, Bild, Audio und Reasoning kombiniert.

Share on:

OPRD: Representation Distillation mit versteckten Zuständen schlägt Output-Only-Methode

5. June 20265. June 2026
AI Models, Claude Code

Hidden-State-Alignment reduziert Sampling-Varianz, schließt die Schüler-Lehrer-Lücke besser und trainiert mit weniger Speicher und Rechenzeit als Output-Only-Distillation.

Share on:

STRIDE: Trainingsdateneinfluss in LLMs via Sparse Recovery nachverfolgen

4. June 20264. June 2026
AI Models, Claude Code

STRIDE formalisiert Trainingsdatenzuordnung als Sparse-Recovery-Problem im Aktivierungsraum und erreicht dabei eine Größenordnung schneller Ergebnisse als gradientbasierte Verfahren.

Share on:

StreamMA: Streaming-Protokoll reduziert Latenz in Multi-Agent-Reasoning-Systemen

4. June 20264. June 2026
AI Models, Claude Cowork

Streaming-basiertes Multi-Agent-Reasoning reduziert Latenz durch Pipelinisierung und verbessert gleichzeitig Genauigkeit, weil frühe zuverlässigere Reasoning-Schritte vor fehlerhaften späteren Schritten schützen.

Share on:

KVarN: Varianzbasierte KV-Cache-Quantisierung reduziert Fehlerakkumulation

3. June 20263. June 2026
AI Models, Claude Code

KVarN reduziert durch verbesserte Token-Scale-Normalisierung die Fehlerakkumulation beim Quantisieren von KV-Caches auf 2-Bit-Genauigkeit und erreicht State-of-the-Art-Ergebnisse auf MATH500, AIME24 und HumanEval.

Share on:

Gemma 4 12B läuft jetzt auf Standard-Laptops mit lokaler KI-Verarbeitung

3. June 20263. June 2026
AI Models, Google, Google AI Studio

Gemma 4 12B läuft auf Standard-Laptops mit 16 GB RAM und ermöglicht über die LiteRT-LM CLI lokale API-Endpunkte für agentengesteuerte Workflows ohne Cloud-Abhängigkeit.

Share on:

Präzision bei Tool-Aufrufen: SFT und DPO für Language Models auf SageMaker

3. June 20263. June 2026
AI Models, Claude Code, Google

Mit SFT und DPO lässt sich die Werkzeugwahl von Language Models zielgerichtet trainieren, ohne dass eigene Trainingsinfrastruktur verwaltet werden muss.

Share on:

« Previous
1
…
3
4
5
6
7
…
38
Next »

Siri mit Vision-LLM und eigenem AI-Runtime auf Apple-Hardware

Socratic-SWE: Selbstlernende KI-Agenten für Code-Reparaturen

Wie Reinforcement-Learning-Umgebungen Trainingsqualität zerstören – praktische Lösungen

Claude Code, Codex und Cursor im Praxistest: Drei KI-Coding-Agenten im direkten Vergleich

Dream.exe: Video-Generierungsmodelle auf praktische Robotik-Fähigkeiten testen

Google Gemma 4 12B: Multimodales Modell für lokale Ausführung

OPRD: Representation Distillation mit versteckten Zuständen schlägt Output-Only-Methode

STRIDE: Trainingsdateneinfluss in LLMs via Sparse Recovery nachverfolgen

StreamMA: Streaming-Protokoll reduziert Latenz in Multi-Agent-Reasoning-Systemen

KVarN: Varianzbasierte KV-Cache-Quantisierung reduziert Fehlerakkumulation

Gemma 4 12B läuft jetzt auf Standard-Laptops mit lokaler KI-Verarbeitung

Präzision bei Tool-Aufrufen: SFT und DPO für Language Models auf SageMaker

Lumi AI News

Rechtliches

Themenbereiche