Sprich live mit deiner eigenen KI – ganz ohne Programmierkenntnisse. In diesem Snip zeige ich dir, wie du im Google AI Studio in wenigen Minuten deinen eigenen Voice-Bot baust, der in Echtzeit mit dir spricht, antwortet und sogar natürlich klingt.
Ergebnis:
Nach dem Snip hast du deinen ersten voll funktionsfähigen KI-Voice-Bot erstellt, kannst ihn im Browser starten, als React-App exportieren oder direkt auf Google Cloud deployen – alles kostenlos in der Basisversion.
Schritt-für-Schritt-Anleitung:
-
Google AI Studio öffnen:
Gehe auf aistudio.google.com und melde dich mit deinem Google-Konto an. -
Neues Projekt erstellen:
Wähle links im Menü Build oder Vibe Coding / GenAI-Enabled Apps. -
Prompt eingeben:
Verwende den folgenden Prompt (siehe unten). Er erzeugt eine interaktive Voice-Bot-App mit Sprach-Eingabe und -Ausgabe. -
App generieren lassen:
Klicke auf Submit – das Modell erstellt automatisch den Code für dein Voice-Interface (ca. 2–3 Minuten). -
Voice-Funktion aktivieren:
Erlaube im Browser die Nutzung des Mikrofons. Wähle Rolle und Sprache aus und starte dein Interview. -
App exportieren oder deployen:
-
Über Download als React-App sichern.
-
Oder über Deploy on Google Cloud direkt veröffentlichen (mit Projekt & Billing).
-
-
Kosten prüfen:
-
Text-Nutzung: bis ca. 1 Mio Token kostenlos
-
Audio-Input: ca. 3 USD pro 1 Mio Token
-
Audio-Output: ca. 20 USD pro 1 Mio Token
-
-
Test & Weiterentwicklung:
Teste verschiedene Rollen, Sprachen und Interview-Stile – oder erweitere deinen Bot um Bildgenerierung oder visuelle Ausgaben.
- Verstehen, wie man Google AI Studio nutzt, um Sprachdialoge zu erstellen.
- Erlernen der Erstellung eines Voiceboards mit Echtzeit-Spracherkennung und Sprachausgabe.
- Entwicklung von einfachen, funktionalen Sprachinteraktionen für spezifische Anwendungsfälle.
- Integration von KI-Sprachtools in eigene Projekte und Plattformen.
- Optimierung und Testen von Voiceboards für verbesserte Nutzererfahrung.
- Kundensupport-Chatbots mit Sprachschnittstellen für direkte Hilfe am Telefon oder Webseite.
- Interaktive Marketingkampagnen, die Nutzer per Sprache ansprechen und Feedback verarbeiten.
- User Experience Tests, bei denen Sprachfeedback direkt ausgewertet und analysiert wird.
- Virtuelle Assistenten für Terminplanung oder Informationsabruf per Sprachsteuerung.
- Training von Mitarbeitern mittels sprachaktivierter Lernmodule und Übungen.
Kerstin Gude-Benderoth
Oktober 19, 2025Hallo, wie schätzt ihr den Unterschied zwischen dem Voice-Bot mit Google AI Studio und den Eleven Labs Voice Agent ein?
Mein Eindruck: Die Erstellung bei Eleven Labs ist fast einfacher und die Stimmen klingen noch einmal um einiges natürlicher.
Auch Erweiterungen wie Terminplanung und ähnliche Funktionen sind dort auch möglich. Welches Modell favorisiert Ihr? LG Kerstin