Auf dem MUUUH!nwalk, unserem hauseigenen Event für Entscheider:innen und Expert:innen aus dem Kundenservice, sprechen wir nicht nur über aktuelle technologische Trends – wir setzen sie auch um. Für das Event im November 2024 haben wir daher einen WhatsApp-Bot entwickelt, der den Teilnehmer:innen alle relevanten Fragen rund um die Veranstaltung beantwortet. Dafür wollten wir eine möglichst einfache, aber effektive Lösung nutzen, die ohne kompliziertes Training oder Setup auskommt. Stattdessen setzten wir auf gezieltes Prompt Engineering mit einem Large Language Model (LLM), konkret GPT-4o-mini über Azure OpenAI.
Prompt Engineering als Schlüssel zum Erfolg
Der zentrale Bestandteil unseres Bots war ein sorgfältig gestalteter Prompt, der alle relevanten Informationen enthielt: den Zeitplan des Events, Details zu Speaker:innen, Anreiseinfos, Informationen zu MUUUH! und eine definierte Persona für den Bot. Wir haben den Prompt intensiv getestet und kontinuierlich optimiert. Um beispielsweise Fragen zum Timetable besser beantworten zu können, wurde jeder Anfrage die aktuelle Uhrzeit mitgegeben.
Technische Umsetzung
Eingehende Nachrichten wurden über WhatsApp empfangen und über die WhatsApp Business Plattform an unser eigenes Backend weitergeleitet. Dort wurde zunächst überprüft, um welchen Nachrichtentyp es sich handelt. Falls der Bot die Nachricht nicht verarbeiten konnte (z. B. Bilder oder Videos), erhielt der Nutzer eine generische Fehlermeldung. Sprachnachrichten wurden mithilfe von Azure Speech-to-Text in Text umgewandelt.
Anschließend wurde der Text (sei es das Transkript oder eine empfangene Textnachricht) an das LLM weitergeleitet. Ein interessantes Detail: Wir erzielten bereits mit dem kostengünstigen Modell GPT-4o-mini sehr gute Ergebnisse. Zur Verwaltung der Konversationen nutzten wir Azure OpenAI Assistants, die automatisch Gesprächsverläufe anlegten und verwalteten. Jede Konversation erhielt eine eigene Conversation-ID, sodass der Bot den Kontext vorheriger Nachrichten berücksichtigen konnte. Wir speicherten Telefonnummern in Verbindung mit den Conversation-IDs, um die jeweiligen Chats korrekt zuzuordnen. Falls eine neue Anfrage ohne vorhandene ID einging, wurde eine neue Konversation gestartet und eine initiale Nachricht gesendet.
Besondere Features und Nachbereitung
Um das Event interaktiver zu gestalten, integrierten wir einige QR-Codes als Easter Eggs. Durch das Scannen eines QR-Codes öffnete sich WhatsApp mit einer vordefinierten Nachricht. Der Bot reagierte darauf mit speziellen Antworten – beispielsweise mit Informationen zum MUUUH! Bier oder dem Elefanten im Eingangsbereich des Hagelofts. Während des Eventtages hat unser WhatsApp-Bot 241 Nachrichten verarbeitet, davon 36 Sprachnachrichten.