iLLaDA: 8B-Sprachmodell mit bidirektionaler Diffusion trainiert25. June 202626. June 2026AI ModelsiLLaDA zeigt, dass vollständig bidirektionales Diffusions-Training von Grund auf ein konkurrenzkräftiger Weg zu starken Sprachmodellen sein kann, auch ohne autoregressives Training. Share on: