2024 war das Jahr, in dem viele Schweizer KMU einen Chatbot ausprobiert haben. 2025 das Jahr, in dem die Hälfte davon wieder abgeschaltet wurde. 2026 ist das Jahr, in dem die richtigen Architekturen sich durchsetzen. Hier ist was wir aus 30+ Chatbot-Projekten gelernt haben.
Warum die meisten Bots scheitern
Die ersten Welle Chatbots war regelbasiert — Entscheidungsbäume mit fixen Fragen. Frustrierend für Nutzer, weil sie nie sagen konnten was sie wirklich meinten. Die zweite Welle war GPT-3.5 ohne Wissensbasis — fluently aber halluzinierend, mit erfundenen Preisen und falschen Öffnungszeiten.
Die dritte Welle (das was 2026 funktioniert) kombiniert GPT-4o oder Claude 3.5 mit RAG (Retrieval-Augmented Generation) auf Ihre eigenen Inhalte. Das Modell sieht bei jeder Frage Ihre relevanten Dokumente — und antwortet ausschliesslich auf dieser Basis.
Welche Modelle wir nutzen und warum
GPT-4o für Standard-Use-Cases
Schnell, günstig (etwa 0.15 USD pro Million Input-Tokens), sehr gut auf Deutsch, fliessend in Konversationen. Für 80 % der Anwendungen das richtige Modell.
Claude 3.5 Sonnet für sensible Inhalte
Etwas teurer (3 USD pro Million Input-Tokens), dafür merklich vorsichtiger bei sensiblen Themen — Gesundheit, Recht, Finanzen. Bei Anwaltskanzleien und Praxen unsere Standardwahl.
Lokale Modelle (Llama 3.3, Mistral) für Hochsicherheits-Use-Cases
Wenn Daten die Schweiz nicht verlassen dürfen, hosten wir lokale Modelle auf Schweizer Infrastruktur. Qualität ist 10–15 % unter GPT-4o, aber für interne Tools (HR, Compliance) absolut ausreichend.
Die richtige Architektur
Ein guter Chatbot hat drei Schichten:
1. Wissensbasis (RAG)
Ihre Inhalte (FAQ, Preisliste, Service-Beschreibungen, Prozess-Dokumentation) werden in Chunks zerlegt, embeddings erzeugt und in einer Vektor-Datenbank (z. B. Supabase pgvector) gespeichert. Bei jeder Frage werden die relevantesten Chunks geholt und dem Modell als Kontext gegeben.
2. Tool-Use (Actions)
Der Bot kann nicht nur reden, sondern Aktionen ausführen: Termine im Google Calendar buchen, Leads in HubSpot legen, Dokumente per Mail versenden, an Menschen übergeben. Definiert als Functions, die das Modell bei Bedarf aufruft.
3. Memory + Handoff
Konversationen werden in Supabase gespeichert. Bei Mensch-Übergabe bekommen Sie den vollen Gesprächs-Kontext per Email oder WhatsApp. Bei wiederkehrenden Besuchern erkennt der Bot den Nutzer wieder (cookie-basiert oder per Email-Identifikation).
Was Chatbots gut können — und was nicht
ROI realistisch eingeschätzt
Unser Durchschnittskunde bekommt durch den Bot 15–40 zusätzliche qualifizierte Anfragen pro Monat — meist aus der Zeit ausserhalb der Bürozeiten. Bei einem durchschnittlichen Mandats-Wert von CHF 500–2'000 amortisiert sich der Bot (CHF 89/Monat laufend) in Wochen, nicht Monaten.
Die wirkliche Frage ist nicht «Lohnt sich ein Bot?», sondern «Welche Anfragen verliere ich gerade, weil ich nicht 24/7 erreichbar bin?». Beobachten Sie eine Woche, wann Anfragen typischerweise eingehen. Wenn ein relevanter Teil ausserhalb der Bürozeiten kommt, ist ein Bot fast garantiert profitabel.
Mehr Details auf der KI-Chatbot-Seite. Oder direkt einen unverbindlichen Demo-Call buchen — wir zeigen Ihnen einen Live-Bot in Ihrem Wording.