iLLaDA: 8B-Sprachmodell mit bidirektionaler Diffusion trainiert

25. June 202626. June 2026
AI Models

iLLaDA zeigt, dass vollständig bidirektionales Diffusions-Training von Grund auf ein konkurrenzkräftiger Weg zu starken Sprachmodellen sein kann, auch ohne autoregressives Training.

Share on:

Sumi: Uniform-Diffusion-Sprachmodell mit 7 Milliarden Parametern aus dem Stand trainiert

18. June 202618. June 2026
AI Models

Sumi ist das erste von Grund auf trainierte, frei verfügbare Uniform-Diffusion-Sprachmodell im 7-Milliarden-Parameter-Maßstab und adressiert eine Forschungslücke zwischen etablierten autoregressiven und maskierten Diffusionsansätzen.

Share on:

iLLaDA: 8B-Sprachmodell mit bidirektionaler Diffusion trainiert

Sumi: Uniform-Diffusion-Sprachmodell mit 7 Milliarden Parametern aus dem Stand trainiert

Lumi AI News

Rechtliches

Themenbereiche