KI-Nutzungs-Limits & Fair-Use
Warum es Limits gibt
Jede KI-Anfrage verursacht Kosten — bei den Modell-Anbietern und auf unserer Infrastruktur. Damit alle Nutzer:innen einer Organisation gleichermaßen schnellen Zugriff auf die besten Modelle haben und der Preis pro Lizenz stabil bleibt, gibt es ein monatliches Kontingent. Wir verzichten bewusst auf zusätzliche kostenpflichtige Module oder versteckte Add-ons — alle Plattform-Funktionen sind im Tarif enthalten.
Statt einer harten Abrechnung pro Token bekommen Sie eine planbare Flatrate mit einem fairen Nutzungsrahmen. Wer mehr braucht, wechselt entweder in einen höheren Tarif oder rechnet zusätzliche Nutzung über Pay-as-you-go transparent nach Verbrauch ab. Im Enterprise-Tarif kann zusätzlich automatisch auf günstigere Modelle umgeschaltet werden, sobald das Kontingent aufgebraucht ist.
Ihr monatliches Kontingent
Jeder Tarif enthält ein monatliches KI-Budget. Die Höhe richtet sich nach dem gewählten Plan:
- Pro: Standard-Kontingent für den alltäglichen Einsatz aller führenden Modelle.
- Pro 5×: Fünffaches Kontingent für Power-User mit hohem Anfrage-Volumen.
- Business: Standard-Kontingent für Organisationen mit zentraler Verwaltung und gemeinsamem Budget.
- Business 5×: Fünffaches Kontingent für Teams mit hoher KI-Auslastung.
Das Kontingent setzt sich zu Beginn jedes Abrechnungszeitraums automatisch zurück.
Nicht jede Anfrage verbraucht gleich viel. Größere und leistungsstärkere Modelle (z. B. GPT-5.5, Claude Opus) sind in der Verarbeitung teurer und reduzieren Ihr Kontingent schneller als leichtgewichtige Modelle (z. B. GPT-5.4-Mini, Claude Haiku, Gemini Flash). Auch lange Chats, große Datei-Anhänge oder Recherche- und Workflow-Läufe mit vielen Schritten verbrauchen mehr.
Was passiert bei erreichtem Limit
Auch wenn Sie Ihr monatliches Budget aufgebraucht haben, wird nichts abgeschaltet. Sie haben zwei Optionen:
- Pay-as-you-go: Premium-Modelle weiternutzen und zusätzliche Nutzung transparent nach tatsächlichem Verbrauch abrechnen — keine versteckten Pakete, keine Mindestabnahme.
- Automatischer Wechsel zu Budget-Modellen (nur Enterprise): Im Enterprise-Tarif kann konfiguriert werden, dass nach Erreichen des Kontingents automatisch auf günstigere Modelle (z. B. Gemini 2.5 Flash, GPT-5.4-Mini, Claude Haiku 4.5) umgeschaltet wird — unbegrenzte Weiterarbeit ohne zusätzliche Kosten.
KI-Nutzung in der Plattform einsehen
Ihre aktuelle KI-Nutzung sehen Sie jederzeit in der Plattform unter Einstellungen → Benutzerkonto → KI-Nutzung. Dort sehen Sie auf einen Blick, wie viel Prozent Ihres monatlichen Budgets bereits verbraucht sind — und den Hinweis, dass Sie bei erreichtem Limit mit den Budget-Modellen unbegrenzt weiterchatten können.
So holen Sie mehr aus Ihrem Budget heraus
Mit ein paar kleinen Anpassungen reicht Ihr monatliches Budget deutlich weiter:
- Nutzen Sie den Auto-Modus in der Modellauswahl — wir wählen automatisch das günstigste Modell, das Ihre Aufgabe bewältigen kann.
- Wählen Sie für alltägliche Fragen ein leichtgewichtiges Modell (z. B. Gemini 2.5 Flash, GPT-5.4-Mini, Claude Haiku 4.5) und greifen Sie nur für komplexe Aufgaben zu größeren Modellen.
- Starten Sie bei einem Themenwechsel einen neuen Chat — lange Chats senden den gesamten Verlauf bei jeder Nachricht erneut und verbrauchen so mehr Tokens.
- Hängen Sie nur Dateien und Kontext an, die Sie wirklich brauchen; kürzen Sie lange PDFs oder eingefügten Text auf die relevanten Abschnitte.