Voicebox ist eine Open-Source-App, die deinen Mac in ein kleines lokales Studio für Sprachsynthese und -klonen verwandelt. Sie nutzt das Qwen3-TTS-Modell, um realistischen Ton direkt auf deinem Gerät zu erzeugen, ohne auf Cloud-Dienste, Tokens oder kostenpflichtige Abos angewiesen zu sein.
Eine Sprachklon-App für macOS
Mit Voicebox kannst du Sprachprofile aus wenigen Sekunden Referenzaudio erstellen (bis zu 30 Sekunden). Das Qwen3-TTS-Modell analysiert Tonlage, Klangfarbe und Akzent, um sie mit beachtlicher Treue zu reproduzieren. Du musst nur eine Sprachdatei hochladen oder über das Mikrofon deines Macs eine Aufnahme machen, angeben, was gesagt wurde, oder die automatische Transkription nutzen, und du hast ein Profil, um neuen Ton zu erzeugen, ohne den Prozess wiederholen zu müssen.
Audio mit benutzerdefinierten Sprachprofilen erzeugen
Sobald du ein gespeichertes Profil hast, tippst du einfach den gewünschten Text ein und Voicebox erzeugt Audio mit dieser Stimme. Das ermöglicht dir zum Beispiel, Sätze in andere Sprachen zu übersetzen und dabei deinen Ton beizubehalten, sodass du Heim-Synchros erstellen oder Stimmen für Videospielprojekte generieren kannst. Du kannst Sprachprofile auch exportieren und mit anderen Nutzern teilen, damit sie auf ihren eigenen Geräten Audio erzeugen können.
Automatische Transkription und Systemton-Aufnahme
Die App integriert Whisper, das Audio in Text umwandelt und ihn mit der erzeugten Stimme synchronisiert. Das erleichtert es, Dialoge direkt in der Timeline zu bearbeiten, Pausen anzupassen oder die Aussprache zu korrigieren, ohne die Konsistenz des Sprachprofils zu verlieren. Zusätzlich enthält sie eine Systemaudio-Aufnahme, mit der du den Ton auf deinem Mac aufnehmen kannst (zum Beispiel aus einem Spiel oder einem Anruf) und ihn als Referenz für neue Klone oder Audioszenen verwenden kannst.
Lokaler Sprachserver und API für andere Projekte
Voicebox ist mehr als nur seine grafische Oberfläche; dank seiner integrierten REST-API kann es auch als lokaler Sprachserver funktionieren. Du kannst ihn mit einem einzigen Klick aktivieren, Text aus Spielen, Apps oder KI-Agenten senden und den erzeugten Ton in einem Standardformat erhalten. Das erleichtert die Automatisierung von Erzählen, Dialogen oder Benachrichtigungen, ohne auf externe Dienste angewiesen zu sein. Die App ist mit Tauri, Rust und Python entwickelt, was sie leichter macht als viele Electron-basierte Alternativen. Trotzdem hängt die Leistung davon ab, wie leistungsstark dein Mac ist und wie das Qwen3-TTS-Modell eingerichtet ist, da die gesamte Verarbeitung lokal erfolgt.
Erzählte Geschichten mit jeder Stimme erstellen
Voicebox bietet außerdem einen Bereich zum Erzeugen erzählter Geschichten. Du musst nur angeben, was passieren soll, und die App erstellt die Inhalte mit der von dir ausgewählten Stimme. Das ist eine nützliche Funktion, um unterhaltsame Inhalte, Kindergeschichten oder Voice-Sketches zu erstellen.
Meine Erfahrung mit Voicebox auf dem Mac
Als ich Voicebox unter macOS getestet habe, war der Klonvorgang schnell und einfach: Ein paar Sekunden Audio reichten aus, um ein Profil zu erstellen und mehrere Sprachclips in der Timeline zu erzeugen. Das Erlebnis ist flüssig, auch wenn einige fortgeschrittene Optionen noch fehlen, etwa weitere Samples hinzuzufügen, um die Qualität zu verbessern, oder die geklonte Stimme feinzujustieren.
Was mir an Voicebox am besten gefiel und was verbessert werden könnte
Was mir am besten gefiel: Der gesamte Klon- und Syntheseprozess wird lokal auf deinem Mac durchgeführt, ohne von der Cloud abhängig zu sein oder für Abos zu bezahlen.
· Was ich verbessern würde: mehr Sprach-Anpassung und Unterstützung für mehrere Audiosamples, da dies zu realistischeren Ergebnissen beitragen würde. Außerdem kann die Generierungszeit je nach Leistung deines Geräts und dem gewählten Modell variieren.
Voicebox ist für dich, wenn...
✓ Du Stimmen klonen und gesprochene Audios unter macOS erzeugen willst, ohne auf Cloud-Dienste angewiesen zu sein.
✓ Du mit Podcasts, Synchronisation, Spielen oder KI-Agenten arbeitest und einen Timeline-Editor für Sprachszenen brauchst.
✓ Du eine lokale, private und Open-Source-Lösung bevorzugst, die du in andere Projekte integrieren kannst.
Lade Voicebox herunter und verwandle deinen Mac in ein vollständig lokales Studio für Sprachklonen und -synthese, das Qwen3-TTS und Whisper unterstützt.
Reviews
Es liegen noch keine Meinungen über Voicebox vor. Sei die erste Person! Kommentar