KI-Nutzungs-Limits & Fair-Use

Warum es Limits gibt

Jede KI-Anfrage verursacht Kosten — bei den Modell-Anbietern und auf unserer Infrastruktur. Damit alle Nutzer:innen einer Organisation gleichermaßen schnellen Zugriff auf die besten Modelle haben und der Preis pro Lizenz stabil bleibt, gibt es ein monatliches Kontingent. Wir verzichten bewusst auf zusätzliche kostenpflichtige Module oder versteckte Add-ons — alle Plattform-Funktionen sind im Tarif enthalten.

Statt einer harten Abrechnung pro Token bekommen Sie eine planbare Flatrate mit einem fairen Nutzungsrahmen. Wer mehr braucht, wechselt entweder in einen höheren Tarif oder rechnet zusätzliche Nutzung über Pay-as-you-go transparent nach Verbrauch ab. Im Enterprise-Tarif kann zusätzlich automatisch auf günstigere Modelle umgeschaltet werden, sobald das Kontingent aufgebraucht ist.

Ihr monatliches Kontingent

Jeder Tarif enthält ein monatliches KI-Budget. Die Höhe richtet sich nach dem gewählten Plan:

Pro: Standard-Kontingent für den alltäglichen Einsatz aller führenden Modelle.
Pro 5×: Fünffaches Kontingent für Power-User mit hohem Anfrage-Volumen.
Business: Standard-Kontingent für Organisationen mit zentraler Verwaltung und gemeinsamem Budget.
Business 5×: Fünffaches Kontingent für Teams mit hoher KI-Auslastung.

Das Kontingent setzt sich zu Beginn jedes Abrechnungszeitraums automatisch zurück.

Nicht jede Anfrage verbraucht gleich viel. Größere und leistungsstärkere Modelle (z. B. GPT-5.5, Claude Opus) sind in der Verarbeitung teurer und reduzieren Ihr Kontingent schneller als leichtgewichtige Modelle (z. B. GPT-5.4-Mini, Claude Haiku, Gemini Flash). Auch lange Chats, große Datei-Anhänge oder Recherche- und Workflow-Läufe mit vielen Schritten verbrauchen mehr.

Was passiert bei erreichtem Limit

Auch wenn Sie Ihr monatliches Budget aufgebraucht haben, wird nichts abgeschaltet. Sie haben zwei Optionen:

Pay-as-you-go: Premium-Modelle weiternutzen und zusätzliche Nutzung transparent nach tatsächlichem Verbrauch abrechnen — keine versteckten Pakete, keine Mindestabnahme.
Automatischer Wechsel zu Budget-Modellen (nur Enterprise): Im Enterprise-Tarif kann konfiguriert werden, dass nach Erreichen des Kontingents automatisch auf günstigere Modelle (z. B. Gemini 2.5 Flash, GPT-5.4-Mini, Claude Haiku 4.5) umgeschaltet wird — unbegrenzte Weiterarbeit ohne zusätzliche Kosten.

KI-Nutzung in der Plattform einsehen

Ihre aktuelle KI-Nutzung sehen Sie jederzeit in der Plattform unter Einstellungen → Benutzerkonto → KI-Nutzung. Dort sehen Sie auf einen Blick, wie viel Prozent Ihres monatlichen Budgets bereits verbraucht sind — und den Hinweis, dass Sie bei erreichtem Limit mit den Budget-Modellen unbegrenzt weiterchatten können.

So holen Sie mehr aus Ihrem Budget heraus

Mit ein paar kleinen Anpassungen reicht Ihr monatliches Budget deutlich weiter:

Nutzen Sie den Auto-Modus in der Modellauswahl — wir wählen automatisch das günstigste Modell, das Ihre Aufgabe bewältigen kann.
Wählen Sie für alltägliche Fragen ein leichtgewichtiges Modell (z. B. Gemini 2.5 Flash, GPT-5.4-Mini, Claude Haiku 4.5) und greifen Sie nur für komplexe Aufgaben zu größeren Modellen.
Starten Sie bei einem Themenwechsel einen neuen Chat — lange Chats senden den gesamten Verlauf bei jeder Nachricht erneut und verbrauchen so mehr Tokens.
Hängen Sie nur Dateien und Kontext an, die Sie wirklich brauchen; kürzen Sie lange PDFs oder eingefügten Text auf die relevanten Abschnitte.

KI-Nutzungs-Limits & Fair-Use

Warum es Limits gibt

Ihr monatliches Kontingent

Was passiert bei erreichtem Limit

KI-Nutzung in der Plattform einsehen

So holen Sie mehr aus Ihrem Budget heraus

Plattform

Unternehmen

Rechtliches

In Ihren Tools

Vergleiche

Lösungen

KI-Modelle

Ressourcen