Claude Haiku 4.5
Claude Haiku 4.5 ist ein auf Geschwindigkeit und Kosteneffizienz optimiertes KI-Sprachmodell von Anthropic. Es bietet bei volumenintensiven Aufgaben wie Klassifikation, Kundensupport oder einfachen Coding-Tasks eine vergleichbare Leistung wie frühere Spitzenmodelle zum Bruchteil der Kosten.
Ausführliche Erklärung
Claude Haiku 4.5 wurde im Oktober 2025 veröffentlicht und positioniert sich als schnellstes und kostengünstigstes Modell in der Claude-Familie von Anthropic. Das Modell verarbeitet bis zu 200.000 Token Kontext und kann bis zu 64.000 Token ausgeben. Anders als seine Vorgänger unterstützt Haiku 4.5 erstmals erweiterte Funktionen wie Extended Thinking, Computer Use und Context Awareness. Die Preisgestaltung liegt bei 1 US-Dollar pro Million Input-Tokens und 5 US-Dollar pro Million Output-Tokens.
Für KMU ist das Modell vor allem dann relevant, wenn hohe Volumen an gleichartigen Aufgaben zu bewältigen sind. Typische Einsatzgebiete sind das Kategorisieren eingehender E-Mails, das Routing von Support-Anfragen, die automatische Erstellung kurzer Zusammenfassungen oder die Extraktion strukturierter Daten aus Dokumenten. Das Modell erreicht nach Angaben von Anthropic etwa 90 Prozent der Leistung des deutlich teureren Modells Sonnet 4.5, ist dabei aber mehr als doppelt so schnell und kostet nur rund ein Drittel.
Die Stärken des Modells liegen in der niedrigen Latenz und der Fähigkeit, auch bei komplexeren Aufgaben wie Code-Reviews oder agentenbasierter Workflow-Orchestrierung zu überzeugen. Im SWE-bench Verified Benchmark erreicht Haiku 4.5 eine Trefferquote von 73,3 Prozent und zählt damit zu den leistungsstärksten Coding-Modellen seiner Klasse. Anders als frühere Haiku-Versionen eignet sich das Modell nicht nur für reine Klassifikationsaufgaben, sondern kann in Multi-Agenten-Systemen als schneller Sub-Agent eingesetzt werden, der Teilaufgaben parallel abarbeitet.
Die Verfügbarkeit erfolgt über die Claude API, über Cloud-Plattformen wie Amazon Bedrock, Google Cloud Vertex AI und Microsoft Azure AI Foundry sowie direkt in der Chat-Oberfläche auf claude.ai. Für Unternehmen mit Compliance-Anforderungen steht das Modell in den Team- und Enterprise-Plänen mit Auftragsverarbeitungsvertrag zur Verfügung.
Praxisbeispiel
Ein IT-Dienstleister mit 35 Mitarbeitenden nutzt Claude Haiku 4.5 im Kundensupport. Eingehende Tickets werden automatisch in fünf Kategorien sortiert: Störung, Rechnungsfrage, Vertragsfrage, Produktanfrage, Sonstiges. Anschließend erstellt das Modell eine Kurzfassung jedes Tickets. Dadurch sinkt die durchschnittliche Bearbeitungszeit pro Anfrage um etwa 30 Prozent, die API-Kosten liegen bei etwa 15 Euro monatlich.
Code-Beispiel
import anthropic
client = anthropic.Anthropic(
api_key="IHR_API_KEY"
)
message = client.messages.create(
model="claude-haiku-4-5",
max_tokens=1024,
messages=[
{"role": "user", "content": "Kategorisiere diese E-Mail: Sehr geehrte Damen und Herren, meine Rechnung vom 15.03. enthält eine Position, die ich nicht nachvollziehen kann. Bitte um Rückruf."}
]
)
print(message.content[0].text)