JetSpec: Paralleles Tree Drafting löst Bottleneck in Speculative Decoding26. June 202626. June 2026AI Models, Claude AIJetSpec überwindet Skalierungsgrenzen von Speculative Decoding durch paralleles Tree Drafting mit kausaler Konditionierung und erreicht bis zu 9,64x Speedup bei LLM-Inferenz. Share on: