Zum Inhalt springen

OpenAI und Broadcom präsentieren Jalapeño-Inferenzchip für Sprachmodelle

Auf den Punkt: OpenAI und Broadcom haben mit Jalapeño einen Custom-Chip für LLM-Inferenz vorgestellt, der Leistung und Effizienz im Produktivbetrieb von Sprachmodellen verbessern soll.

OpenAI und Broadcom haben gemeinsam Jalapeño entwickelt, einen speziell für die Inferenz von Large Language Models optimierten Chip. Das Projekt zielt darauf ab, die Leistung und Energieeffizienz bei der Skalierung von KI-Systemen zu verbessern.

OpenAI und Broadcom haben gemeinsam einen speziell optimierten Inferenzchip entwickelt. Das Projekt Jalapeño ist darauf ausgerichtet, die Anforderungen des Produktivbetriebs von Large Language Models zu adressieren – insbesondere die Anforderungen an Durchsatz, Latenz und Energieverbrauch in Rechenzentren.

Custom-Chips für KI-Inferenz reduzieren abhängig von der Workload den Bedarf an generalisierten GPU-Hardware. Für die Zielrolle CTO bedeutet das eine Chance, Betriebskosten und Power-Consumption großer Sprachmodell-Infrastrukturen zu senken und gleichzeitig die Skalierbarkeit zu erhöhen.

Die Zusammenarbeit zwischen OpenAI und Broadcom folgt dem Industrie-Trend, dass Anbieter hochfrequenter KI-Workloads in spezialisierte Hardware investieren. Damit verbunden sind Entscheidungen zur Hardware-Architektur, zum Vendor-Lock-in und zur langfristigen Verfügbarkeit solcher Chips – Faktoren, die bei einer Evaluierung solcher Systeme zu berücksichtigen sind.


Quelle: openai.com · Erschienen 24. Juni 2026
Lumi AI News — KI-assistierte Kuratierung gemaess Art. 50 EU AI Act. Paraphrase und Klassifikation durch Lumi News Pipeline v1.7.1.

Share on: