Sumi: Uniform-Diffusion-Sprachmodell mit 7 Milliarden Parametern aus dem Stand trainiert

18. June 202618. June 2026
AI Models

Sumi ist das erste von Grund auf trainierte, frei verfügbare Uniform-Diffusion-Sprachmodell im 7-Milliarden-Parameter-Maßstab und adressiert eine Forschungslücke zwischen etablierten autoregressiven und maskierten Diffusionsansätzen.

Share on:

ZPPO: Lehrermodelle als Prompts statt als Gradienten

17. June 202617. June 2026
AI Models, Claude AI

ZPPO integriert Lehrermodelle als Prompt-Komponenten statt als Gradienten und verbessert damit die Generalisierung beim Wissenstransfer auf kleine Modelle.

Share on:

ICALens: Interpretierbarkeitsmethode für Sprachmodelle ohne Training zusätzlicher Autoencodern

11. June 202611. June 2026
AI Models, Claude AI

ICA-basierte Analyse ermöglicht schnelle Exploration interpretierbarer Richtungen in Sprachmodellen ohne aufwendiges Training zusätzlicher Autoencodern.

Share on:

Sumi: Uniform-Diffusion-Sprachmodell mit 7 Milliarden Parametern aus dem Stand trainiert

ZPPO: Lehrermodelle als Prompts statt als Gradienten

ICALens: Interpretierbarkeitsmethode für Sprachmodelle ohne Training zusätzlicher Autoencodern

Lumi AI News

Rechtliches

Themenbereiche