Anthropic wirft Alibaba vor, Claude-Outputs für das Training eigener Modelle verwendet zu haben, und bittet die US-Regierung um Unterstützung gegen derartige Nutzungsverstöße.
Anthropic wirft Alibaba vor, Claude systematisch durch Destillation kopiert zu haben, und fordert die US-Regierung zu stärkerer Regulierung chinesischer KI-Unternehmen sowie Exportrestriktionen auf.
Hidden-State-Alignment reduziert Sampling-Varianz, schließt die Schüler-Lehrer-Lücke besser und trainiert mit weniger Speicher und Rechenzeit als Output-Only-Distillation.