Hoe gebruik je Tekst naar Spraak op SpeechGen.io: Complete Gids
08-09-2025 , 16-09-2025
🚀 Snel Starten — Audio Maken in 4 Stappen
Stap 1: Taal Selecteren

Open de taal dropdown en kies de taal van je tekst. Ondersteunde talen: Meer dan 150 talen (AI stemmen bibliotheek).
Stap 2: Stem Kiezen

Nadat je de taal hebt gekozen, verschijnt er een lijst met stemmen. Luister naar voorbeelden en kies je favoriet
Stap 3: Tekst Plakken
Kopieer je tekst naar het tekstvak of upload een bestand (DOCX, PDF). Gebruik voor het omzetten van ondertitels naar spraak de speciale SRT naar stem pagina.
Stap 4: Klik op "Genereer Spraak" (blauwe knop)
Wacht op de verwerking en download je kant-en-klare audiobestand
Dat is alles! Je eerste voice-over is in een paar minuten klaar.
Tekst Voorbereiden
Aanbevolen:
- Gebruik platte tekst zonder onnodige symbolen
- Plaats leestekens correct (punten, komma's, uitroeptekens)
- Breek lange teksten op in alinea's
Vermijden:
- Emoji's en emoticons (kunnen audio generatie verstoren)
- Exotische symbolen: ✓, ★, ♦, ►, ♪, ©, ™, ®, ∞, •, ◦, ▪, ▫
- Speciale Unicode symbolen: 
💡 Tip: Let bij het kopiëren uit PDF-bestanden extra goed op de tekst — er kunnen onzichtbare tekens verschijnen die de audio verpesten!
Limieten en Beperkingen
- Ondersteunde talen: 150+ talen (volledige lijst).
- Upload formaten: platte tekst, DOCX, PDF, SRT.
Maximaal per generatie: 2.000.000 tekens (≈ 285.000-330.000 woorden) - dit is de indrukwekkende hoeveelheid tekst die je in één generatie naar spraak kunt omzetten, waardoor het ideaal is voor lange content zoals hele boeken of uitgebreide documentatie.
Gedetailleerde Stap-voor-Stap Instructies
Stap 1: Tekst Uploaden
- Tekst plakken: Kopieer je tekst naar het tekstvak
- Bestand uploaden: Of klik op de uploadknop en selecteer een bestand (DOCX, PDF)
- Tekst controleren: Zorg ervoor dat de tekst correct wordt weergegeven
Stap 2: Taal Selecteren
⚠️ Belangrijk: Selecteer eerst de juiste taal voor je tekst
- Open de taal dropdown lijst
- Zoek de benodigde taal (150+ talen beschikbaar)
- Voor teksten in meerdere talen, gebruik meertalige audio generatie
Stap 3: Stem Kiezen
Nadat je de taal hebt gekozen, opent er een lijst met beschikbare stemmen. Luister naar voorbeelden door op de afspeelknop voor elke stem te klikken om degene te vinden die het beste bij je past. Je ziet verschillende stemtypes beschikbaar: Reguliere stemmen bieden standaardkwaliteit, PRO stemmen bieden verbeterde kwaliteit en natuurlijkheid, en Meertalige stemmen (gemarkeerd met taalcodes zoals Ava_US, Ava_ES) stellen je in staat om stemconsistentie te behouden over verschillende talen. Neem de tijd om elke stem te beluisteren, aangezien ze aanzienlijk verschillen in toon, emotie en karakter.
Stap 4: Parameters Instellen
- Spraaksnelheid: van x0.1 (erg langzaam) tot x2.2 (erg snel)
- Stemtoonhoogte: van -20 tot +20 (stap 2)
Onder het tekstvak, boven de genereerknop, kun je de pauze-instellingen aanpassen:
- Pauzes tussen zinnen: 150ms - 30 seconden
- Pauzes tussen alinea's: 150ms - 30 seconden
Stap 5: Spraak Genereren
Klik op de knop "Genereer Spraak" onder het tekstvak om het conversieproces te starten. De verwerkingstijd hangt af van de lengte van je tekst - kortere teksten zijn binnen enkele seconden klaar, terwijl langere documenten enkele minuten kunnen duren. Zodra de generatie voltooid is, kun je het resultaat direct in de browser beluisteren om er zeker van te zijn dat het aan je verwachtingen voldoet.
Stap 6: Downloaden
Nadat de generatie is voltooid, verschijnt er een "Download" knop. Standaard kun je het bestand gewoon als MP3 downloaden. Als je echter een ander formaat nodig hebt (WAV of OPUS) of de audiokwaliteit wilt wijzigen (sample rate van 8000 tot 44000 Hz), moet je eerst deze opties selecteren uit de dropdown menu's, de spraak opnieuw genereren met je gekozen instellingen, en vervolgens het bestand downloaden met je voorkeurspecificaties.
Audio Parameter Instellingen
Spraaksnelheid
Snelheidsschaal:
- x0.1 - x0.9: Vertragen (voor complexe materie, taal leren)
- x1.0: Normale snelheid (standaard)
- x1.1 - x2.2: Versnellen (voor dynamische content)
Waarom deze schaal: Fractionele waarden kleiner dan 1 vertragen de spraak, groter dan 1 versnellen deze. Dit maakt een nauwkeurige tempo selectie voor je publiek mogelijk.
Snelheid aanbevelingen:
- Onderwijs: x0.8-x1.0 (voor beter begrip)
- Presentaties: x0.9-x1.1 (officieel tempo)
- Podcasts: x1.0-x1.2 (levendig tempo)
- YouTube: x1.1-x1.4 (aandacht vasthouden)
Stemtoonhoogte
Toonhoogte bereik: van -20 tot +20 met stap 2
Waarom stap 2: Een stap van 2 eenheden zorgt voor een merkbare maar niet scherpe toonhoogteverandering. Kleinere stappen zouden niet opvallen, grotere stappen te dramatisch.
Invloed toonhoogte:
- Negatieve waarden (-2 tot -20): Maken de stem lager, serieuzer, autoritairder
- Positieve waarden (+2 tot +20): Maken de stem hoger, vriendelijker, energieker
- 0: Neutrale toonhoogte (standaard)
Toepassingen:
- Zakelijke content: -4 tot +2
- Kindercontent: +4 tot +12
- Dramatische content: -8 tot -16
- Vriendelijke content: +2 tot +8
Werken met Pauzes
Automatische Pauzes
Pauzes tussen zinnen: 300ms (standaard)
Pauzes tussen alinea's: 400ms (standaard)
Deze instellingen kunnen worden gewijzigd in dropdown menu's van 150ms tot 30 seconden.
Handmatig Pauzes Invoegen
Via interface:
- Plaats de cursor op de gewenste plek in de tekst
- Klik op de knop "Pauze" in het menu
- Het symbool .- verschijnt in de tekst
Via tags:
Voeg de tag <break time="200ms"/> of <break time="2s"/> in op de gewenste locatie
Pauze regels:
- Maximale pauze: 30 seconden
- Meerdere pauzes achter elkaar plaatsen voor langere vertraging
- Pauzes verbruiken geen extra limieten
Wanneer pauzes gebruiken:
- Voor belangrijke uitspraken
- Na retorische vragen
- Tussen verschillende onderwerpen
- Om een dramatisch effect te creëren
Meertalige Audio
De dialoogfunctie maakt het mogelijk om verschillende stemmen in één tekst te gebruiken.
Toepassingen:
- Audioboeken: Verschillende stemmen voor personages
- Educatieve dialogen: Leraar en student
- Presentaties: Hoofdspreker en commentator
- Podcasts: Meerdere presentatoren
De meertalige dialoogfunctie opent creatieve mogelijkheden die verder gaan dan alleen stemmen van personages. Docenten vreemde talen kunnen deze functie bijvoorbeeld gebruiken om dezelfde zin op verschillende snelheden te demonstreren voor taalonderwijs, waardoor studenten de uitspraak op verschillende begripsniveaus kunnen begrijpen. Voor gedetailleerde technieken en toepassingen in de klas, zie onze gids over het gebruik van tekst-naar-spraak voor het onderwijzen van vreemde talen.
Stem Selectie
Meertalige Stemmen
Stemmen met taalcodes (bijv. Ava_US, Ava_ES, Ava_DE) zijn ontworpen om consistente stemherkenning te behouden over verschillende talen. Deze meertalige stemmen stellen je in staat om een uniforme stijl te creëren voor meertalige content, zodat hetzelfde stemkarakter meerdere talen naadloos kan spreken. Deze functie is bijzonder nuttig in de dialoogmodus, waar je kunt wisselen tussen talen terwijl je dezelfde herkenbare stem persoonlijkheid behoudt gedurende je audioproject.
Audio Segmentatie
SpeechGen stelt je in staat om je gegenereerde audio op te splitsen in meerdere segmenten binnen één syntheseproject, waardoor het perfect is voor video-editors die aparte audiobestanden nodig hebben voor verschillende scènes of hoofdstukken. Deze functie is bijzonder nuttig voor het maken van voice-overs voor YouTube-video's, online cursussen of elk project dat nauwkeurige audiosynchronisatie vereist.
Hoe Segmenten te Maken
Om je audio op te splitsen, plaats je simpelweg je cursor waar je de tekst wilt verdelen en klik je op de knipknop in het menu. Dit voegt een <cut/> tag toe op die positie. Je kunt deze tag ook handmatig typen of kopiëren en plakken door je tekst heen. Voor aangepaste bestandsnamen, gebruik dit formaat:
<cut name="jouw-bestandsnaam"/>
Deze functie helpt je segmenten te organiseren met betekenisvolle namen zoals:
<cut name="intro"/>
<cut name="hoofdstuk-1"/>
Segmenten Downloaden en Beheren
Zodra je ten minste één segment tag hebt toegevoegd, verschijnt er na de generatie een "segmenten downloaden" knop. Klik erop om alle segmenten tegelijk te downloaden, of gebruik de "meer" knop op de audiospeler om toegang te krijgen tot individuele segmenten. Elk bestand wordt automatisch benoemd met een unieke ID, volgnummer en beschrijvende titel (bijv. "7054789_1_eerste-zin"), waardoor het gemakkelijk is om je audiobestanden in je bewerkingssoftware te identificeren en te organiseren.
Segment Limieten
- Korte segmenten: Tot 1000 segmenten per generatie
- Lange segmenten: Tot 500 segmenten per generatie
Splits voor grotere projecten op in meerdere generaties. Voor uitgebreide instructies, geavanceerde technieken en videotutorials, bezoek onze complete documentatie over audio segmentatie.
Intonatie Instellen
Sommige stemmen hebben intonatie grafieken:
Intonatie grafieken zijn beschikbaar op stemmen die een instellingen icoon tonen naast de stemnaam - deze functie is te vinden op meer dan de helft van de stemmen in de bibliotheek, inclusief zowel reguliere als PRO opties
- Sleep punten op de grafiek om de intonatie te veranderen
- Verhoog punten om de toonhoogte op bepaalde woorden te verhogen
- Verlaag punten om een serieuzere toon te creëren
- Experimenteer met verschillende curves voor natuurlijkheid
Selecteer de zin waarin je de intonatie wilt aanpassen en druk op de intonatie knop. Deze interface verschijnt.
Caching Systeem en Limiet Besparing
Slimme Cache
SpeechGen. gebruikt een intelligent cachesysteem dat je limieten aanzienlijk bespaart. Het systeem werkt door elke zin (tot 100.000 tekens) 7 dagen in de cache op te slaan. Wanneer je je audio opnieuw genereert, worden alle ongewijzigde zinnen automatisch gratis uit de cache opgehaald - je betaalt alleen voor nieuwe of bewerkte zinnen. Dit betekent dat je incrementele wijzigingen in je tekst kunt aanbrengen zonder elke keer je volledige tekenlimiet te verbruiken. Projectgeschiedenis wordt 30 dagen opgeslagen en bestanden die je aan favorieten toevoegt, worden permanent bewaard.
Opslagperiodes:
- Zin cache: 7 dagen
- Projectgeschiedenis: 30 dagen
- Favoriete bestanden: Permanent opgeslagen
Problemen Oplossen
Audio Kwaliteit Problemen
Stem klinkt onnatuurlijk:
- Probeer PRO stemmen
- Verlaag de snelheid naar x0.9-x1.1
- Controleer de correctheid van de interpunctie
- Gebruik neutrale toonhoogte (0)
Onjuiste uitspraak:
- Zorg ervoor dat de juiste taal is geselecteerd
- Schrijf complexe woorden fonetisch
- Gebruik SSML-tags voor precieze controle
Onnatuurlijke pauzes:
- Controleer de interpunctie
- Configureer pauzes tussen zinnen
- Gebruik handmatige pauzes .- of <break time=""/>
- Verwijder extra spaties en regeleinden
SSML fouten:
- Controleer de correctheid van de tags
- Niet alle stemmen ondersteunen alle SSML-tags
Extra Functies
SSML (Speech Synthesis Markup Language)
Voor deskundige stemcontrole, gebruik SSML-tags:
- <break time="2s"/> — pauzes
- <emphasis level="strong"> — stem nadruk
- <prosody rate="slow" pitch="low"> — spraakkenmerken wijzigen
⚠️ Let op: Verschillende stemmen ondersteunen verschillende sets SSML-tags. Test de functionaliteit voor elke specifieke stem.
Geschiedenis en Favorieten
- Projectgeschiedenis: Automatisch opgeslagen voor 30 dagen
- Favorieten: Voeg belangrijke projecten toe voor permanente opslag
Integratie en API
API is beschikbaar voor ontwikkelaars om SpeechGen.io te integreren in hun eigen applicaties en diensten.
Mijn bestand wordt niet geüpload naar SpeechGen. Wat moet ik doen?
Controleer eerst of je bestand in een ondersteund formaat is (DOCX, PDF of TXT). Zorg ervoor dat het bestand niet beschadigd is en probeer het opnieuw te uploaden. Als het probleem aanhoudt, kopieer de tekst handmatig en plak deze direct in het tekstvak. Controleer ook of de bestandsgrootte de platformlimieten niet overschrijdt.
Hoe lang bewaart SpeechGen mijn gegenereerde audiobestanden?
Je projectgeschiedenis wordt automatisch 30 dagen bewaard. De slimme cache (voor besparingen op zinniveau) is 7 dagen geldig. Om bestanden permanent te bewaren, voeg je ze toe aan je favorieten. Dit zorgt ervoor dat je belangrijke audioprojecten nooit verloren gaan en toegankelijk blijven in je profiel.
Kan ik verschillende stemmen gebruiken voor verschillende personages in één audiobestand?
Ja! SpeechGen biedt meertalige audio generatie (dialoogmodus). Je kunt verschillende stemmen toewijzen aan verschillende tekstsecties, waardoor het perfect is voor audioboeken met meerdere personages, educatieve dialogen of podcasts met meerdere sprekers. Je kunt zelfs meertalige stemmen gebruiken om tussen talen te wisselen met behoud van karakterconsistentie.
Verbruikt het wijzigen van audio-instellingen mijn tekenlimieten?
Het hangt af van welke instellingen je wijzigt. Het aanpassen van de spraaksnelheid of toonhoogte vereist volledige regeneratie en verbruikt je tekenlimieten, aangezien deze wijzigingen de gehele stem synthese beïnvloeden. Je kunt echter vrijelijk pauzes tussen zinnen en alinea's aanpassen zonder limietverbruik. Bovendien gebruikt SpeechGen slimme caching: als je een grote tekst genereert, vervolgens slechts één zin bewerkt en opnieuw genereert, zal het systeem je alleen voor die ene gewijzigde zin belasten, niet voor de hele tekst. Dit cachesysteem bewaart je ongewijzigde zinnen 7 dagen, waardoor iteratieve bewerking zeer zuinig is.
Video
Nog Steeds Vragen?
Krijg hulp van onze community! Stel je vragen in onze Telegram chat: https://t.me/speechgen