System_Menu

Newsletter

Täglich um 07:00 Uhr die wichtigsten KI-News für DACH.

← ArchivTäglich kuratiert · Ausgabe 114

AI_STACK

GEMINI API: GOOGLE FUEHRT ZWEI NEUE PREISSTUFEN EIN

Core Tech|04. April 2026|

AI

AI_HARVESTER

Teilen:

Das Wichtigste

Google führt mit Flex und Priority zwei neue Inference-Stufen in der Gemini API ein, die Entwicklern erlauben, Kosten gegen Latenz und Verfügbarkeit abzuwägen.

Was ist passiert?

Google erweitert die Gemini API um zwei klar getrennte Betriebsmodi. Flex Inference ist die günstigere Option: niedrigere Kosten, aber keine Garantien auf Latenz oder sofortige Kapazität. Priority Inference sichert schnelle Antwortzeiten und höhere Verfügbarkeit, kostet entsprechend mehr.

Das Modell folgt einem Muster, das sich gerade branchenweit durchsetzt. OpenAI hat mit Codex ebenfalls flexible Preismodelle für Teams eingeführt. Der Markt bewegt sich weg von Einheitspreisen hin zu differenzierten Tiers, die unterschiedliche Workloads abbilden.

Warum ist das relevant?

Für Entwickler und Produktteams ist das eine direkte Kostenhebel. Batch-Verarbeitung, Hintergrundanalysen oder asynchrone Aufgaben laufen problemlos über Flex. Echtzeit-Anwendungen mit Nutzerkontakt brauchen Priority.

Wer bisher einen einzigen API-Key für alle Anwendungsfälle genutzt hat, zahlt entweder zu viel für unkritische Jobs oder riskiert Engpässe bei zeitkritischen Anfragen. Zwei Stufen lösen dieses Problem strukturell.

Für DACH-Unternehmen mit größeren Gemini-Deployments bedeutet das: Architekturentscheidungen müssen jetzt bewusst getroffen werden. Welche Pipelines brauchen wirklich Priority? Die Antwort darauf hat direkten Einfluss auf die monatliche Rechnung.

Take-Away

Gemini-Nutzer sollten ihre bestehenden Workloads nach Latenzanforderungen segmentieren und Flex für alle nicht-zeitkritischen Prozesse evaluieren. Die Einsparungen können erheblich sein, besonders bei hohem Volumen.

Google GeminiAPIPricingEntwicklerInfrastruktur

⚡ Weitere News des Tages

Anthropic kauft Biotech-Startup Coefficient Bio für 400 Millionen Dollar

Anthropic hat das Biotech-KI-Startup Coefficient Bio in einem 400-Millionen-Dollar-Aktiengeschäft übernommen. Das Unternehmen agierte bislang im Stealth-Modus und wurde von The Information und Eric Newcomer enthüllt.(TechCrunch)

OpenAI-Führungsumbau: COO Lightcap übernimmt neue Rolle, Simo pausiert

OpenAI strukturiert sein Führungsteam um: COO Brad Lightcap übernimmt eine neue Rolle für 'Special Projects'. Gleichzeitig tritt Fidji Simo, CEO für AGI-Deployment, für mehrere Wochen in den medizinischen Urlaub, und CMO Kate Rouch verlässt das Unternehmen vorübergehend für ihre Krebsbehandlung.(TechCrunch)

Google bringt Gemma 4 mit Apache-2.0-Lizenz: Offene KI-Modelle neu aufgestellt

Google hat die neue Gemma-4-Modellfamilie angekündigt und wechselt dabei zur Apache-2.0-Lizenz. Der Lizenzwechsel dürfte die kommerzielle Nutzung und Integration für Entwickler im DACH-Raum deutlich vereinfachen.(Ars Technica)

Sicherheitsvorfall bei Mercor: Meta stoppt Zusammenarbeit, KI-Trainingsdaten gefährdet

Ein Datenschutzvorfall beim KI-Datendienstleister Mercor hat mehrere große KI-Labore alarmiert. Meta hat die Zusammenarbeit mit Mercor pausiert, da sensible Informationen über das Training von KI-Modellen möglicherweise kompromittiert wurden.(Wired)

Google Vids jetzt kostenlos: KI-Videogenerierung mit Veo 3.1 und Lyria 3

Google erweitert seinen Videodienst Google Vids mit neuen KI-Funktionen, die auf den Modellen Veo 3.1 und Lyria 3 basieren. Hochwertige KI-Videogenerierung ist damit künftig ohne zusätzliche Kosten verfügbar.(Google AI Blog)

Tägliches Briefing

Die wichtigsten AI-News direkt in dein Postfach.

Vorherige Ausgaben

7.500 DOLLAR PRO KOPF: WAS KI-INTENSIVE FIRMEN WIRKLICH AUSGEBEN

WIE NEXTDOOR MIT CODEX SCHNELLER BAUT ALS JE ZUVOR

OPENAI REICHT VERTRAULICHEN BÖRSENPROSPEKT BEI DER SEC EIN