Sådan bruger du Tekst til Tale på SpeechGen.io: Komplet Guide
07-09-2025 , 16-09-2025
🚀 Hurtig Start — Opret Lyd på 4 Trin
Trin 1: Vælg Sprog

Åbn sprogmenuen og vælg sproget for din tekst. Understøttede sprog: Over 150 sprog (AI-stemmebibliotek).
Trin 2: Vælg Stemme

Efter valg af sprog vises en liste over stemmer. Lyt til prøver og vælg din favorit
Trin 3: Indsæt Tekst
Kopiér din tekst ind i tekstfeltet eller upload en fil (DOCX, PDF). For at konvertere undertekster til tale, brug den dedikerede SRT til tale side.
Trin 4: Klik på "Generer Tale" (blå knap)
Vent på behandling og download din færdige lydfil
Det var det! Din første voiceover er klar på kun et par minutter.
Tekstforberedelse
Anbefalet:
- Brug almindelig tekst uden unødvendige symboler
- Placer tegnsætning korrekt (punktummer, kommaer, udråbstegn)
- Opdel lang tekst i afsnit
Undgå:
- Emojis og smileys (kan forstyrre lydgenerering)
- Eksotiske symboler: ✓, ★, ♦, ►, ♪, ©, ™, ®, ∞, •, ◦, ▪, ▫
- Specielle Unicode-symboler: 
💡 Tip: Når du kopierer fra PDF-filer, skal du være særligt opmærksom på teksten — usynlige tegn kan forekomme, som kan ødelægge lyden!
Grænser og Begrænsninger
- Understøttede sprog: 150+ sprog (fuld liste).
- Uploadformater: almindelig tekst, DOCX, PDF, SRT.
Maksimum pr. generering: 2.000.000 tegn (≈ 285.000-330.000 ord) - dette er den imponerende mængde tekst, du kan konvertere til tale i en enkelt generering, hvilket gør den ideel til langt indhold som hele bøger eller omfattende dokumentation.
Detaljerede Trin-for-Trin Instruktioner
Trin 1: Upload Tekst
- Indsæt tekst: Kopiér din tekst ind i tekstfeltet
- Upload fil: Eller klik på upload-knappen og vælg en fil (DOCX, PDF)
- Tjek tekst: Sørg for, at teksten vises korrekt
Trin 2: Vælg Sprog
⚠️ Vigtigt: Vælg først det korrekte sprog for din tekst
- Åbn rullemenuen for sprog
- Find det ønskede sprog (150+ sprog tilgængelige)
- For tekster på flere sprog, brug lydgenerering med flere stemmer
Trin 3: Vælg Stemme
Efter valg af sprog åbnes en liste over tilgængelige stemmer. Lyt til prøver ved at klikke på afspilningsknappen for hver stemme for at finde den, der passer bedst til dine behov. Du vil se forskellige stemmetyper tilgængelige: Regelmæssige stemmer tilbyder standardkvalitet, PRO-stemmer giver forbedret kvalitet og naturlighed, og Flersprogede stemmer (markeret med sprogkoder som Ava_US, Ava_ES) giver dig mulighed for at bevare stemmekonsistens på tværs af forskellige sprog. Brug tid på at forhåndsvise hver stemme, da de varierer betydeligt i tone, følelse og karakter.
Trin 4: Konfigurer Parametre
- Taletempo: fra x0.1 (meget langsomt) til x2.2 (meget hurtigt)
- Stemmehøjde: fra -20 til +20 (trin 2)
Under tekstfeltet, over genereringsknappen, kan du justere pauseindstillingerne:
- Pauser mellem sætninger: 150ms - 30 sekunder
- Pauser mellem afsnit: 150ms - 30 sekunder
Trin 5: Generer Tale
Klik på knappen "Generer Tale" under tekstfeltet for at starte konverteringsprocessen. Behandlingstiden afhænger af din tekstlængde - kortere tekster færdiggøres på sekunder, mens længere dokumenter kan tage et par minutter. Når genereringen er færdig, kan du lytte til resultatet direkte i browseren for at sikre, at det lever op til dine forventninger.
Trin 6: Download
Når genereringen er færdig, vises en "Download"-knap. Som standard kan du blot downloade filen som MP3. Men hvis du har brug for et andet format (WAV eller OPUS) eller ønsker at ændre lydkvaliteten (sample rate fra 8000 til 44000 Hz), skal du først vælge disse indstillinger fra rullemenuerne, regenerere talen med dine valgte indstillinger og derefter downloade filen med dine foretrukne specifikationer.
Lydparameterindstillinger
Taletempo
Hastighedsskala:
- x0.1 - x0.9: Nedsat hastighed (til komplekst materiale, sprogindlæring)
- x1.0: Normal hastighed (standard)
- x1.1 - x2.2: Øget hastighed (til dynamisk indhold)
Hvorfor denne skala: Brøkdele mindre end 1 sænker taletempoet, større end 1 øger det. Dette giver mulighed for præcis tempo-valg for dit publikum.
Hastighedsanbefalinger:
- Uddannelse: x0.8-x1.0 (for bedre forståelse)
- Præsentationer: x0.9-x1.1 (officielt tempo)
- Podcasts: x1.0-x1.2 (livligt tempo)
- YouTube: x1.1-x1.4 (fastholdelse af opmærksomhed)
Stemmehøjde
Tonehøjdeområde: fra -20 til +20 med trin på 2
Hvorfor trin 2: Et trin på 2 enheder giver en mærkbar, men ikke skarp ændring i tonehøjden. Mindre trin ville være umærkelige, større trin for dramatiske.
Tonehøjdeindflydelse:
- Negative værdier (-2 til -20): Gør stemmen lavere, mere seriøs, autoritativ
- Positive værdier (+2 til +20): Gør stemmen højere, venligere, mere energisk
- 0: Neutral tonehøjde (standard)
Anvendelser:
- Forretningsindhold: -4 til +2
- Børneindhold: +4 til +12
- Dramatisk indhold: -8 til -16
- Venligt indhold: +2 til +8
Arbejde med Pauser
Automatiske Pauser
Pauser mellem sætninger: 300ms (standard)
Pauser mellem afsnit: 400ms (standard)
Disse indstillinger kan ændres i rullemenuer fra 150ms til 30 sekunder.
Manuel Indsættelse af Pause
Via grænsefladen:
- Placer markøren på det ønskede sted i teksten
- Klik på knappen "Pause" i menuen
- Symbolet .- vises i teksten
Via tags:
Indsæt tagget <break time="200ms"/> eller <break time="2s"/> på det ønskede sted
Pause regler:
- Maksimal pause: 30 sekunder
- Flere pauser kan placeres i træk for længere forsinkelse
- Pauser forbruger ikke yderligere grænser
Hvornår skal pauser bruges:
- Før vigtige udsagn
- Efter retoriske spørgsmål
- Mellem forskellige emner
- For at skabe dramatisk effekt
Lyd med Flere Stemmer
Funktionen til dialoger giver mulighed for at bruge forskellige stemmer i én tekst.
Anvendelser:
- Lydbøger: Forskellige stemmer til karakterer
- Uddannelsesmæssige dialoger: Lærer og elev
- Præsentationer: Hovedtaler og kommentator
- Podcasts: Flere værter
Funktionen til dialoger med flere stemmer åbner op for kreative muligheder ud over blot karakterstemmer. Sprogundervisere kan for eksempel bruge denne funktion til at demonstrere den samme frase med forskellige hastigheder til sprogindlæring, hvilket hjælper eleverne med at forstå udtale på forskellige niveauer. For detaljerede teknikker og anvendelser i klasseværelset, se vores vejledning om brug af tekst-til-tale til fremmedsprogsundervisning.
Valg af Stemme
Flersprogede Stemmer
Stemmer med sprogkoder (f.eks. Ava_US, Ava_ES, Ava_DE) er designet til at bevare en ensartet stemmegenkendelse på tværs af forskellige sprog. Disse flersprogede stemmer giver dig mulighed for at skabe en ensartet stil for flersproget indhold, hvilket sikrer, at den samme stemmekarakter kan tale flere sprog problemfrit. Denne funktion er især nyttig i dialogtilstand, hvor du kan skifte mellem sprog, mens du bevarer den samme genkendelige stemmepersonlighed gennem hele dit lydprojekt.
Lydsegmentering
SpeechGen giver dig mulighed for at opdele din genererede lyd i flere segmenter inden for et enkelt synteseprojekt, hvilket gør det perfekt til videoredigerere, der har brug for separate lydfiler til forskellige scener eller kapitler. Denne funktion er især nyttig til at skabe voiceovers til YouTube-videoer, onlinekurser eller ethvert projekt, der kræver præcis lydsynkronisering.
Sådan Opretter du Segmenter
For at opdele din lyd skal du blot placere markøren, hvor du vil opdele teksten, og klikke på klippeknappen i menuen. Dette indsætter et <cut/> tag på den position. Du kan også manuelt skrive eller kopiere/indsætte dette tag i din tekst. For brugerdefinerede filnavne skal du bruge dette format:
<cut name="dit-filnavn"/>
Denne funktion hjælper dig med at organisere segmenter med meningsfulde navne som:
<cut name="intro"/>
<cut name="kapitel-1"/>
Download og Håndtering af Segmenter
Når du har tilføjet mindst ét segment-tag, vises en "download segmenter"-knap efter generering. Klik på den for at downloade alle segmenter på én gang, eller brug "mere"-knappen på lydafspilleren for at få adgang til individuelle segmenter. Hver fil navngives automatisk med et unikt ID, sekvensnummer og en beskrivende titel (f.eks. "7054789_1_første-sætning"), hvilket gør det nemt at identificere og organisere dine lydfiler i dit redigeringssoftware.
Segment Begrænsninger
- Korte segmenter: Op til 1000 segmenter pr. generering
- Lange segmenter: Op til 500 segmenter pr. generering
For større projekter, opdel i flere genereringer. For omfattende instruktioner, avancerede teknikker og videotutorials, besøg vores komplette dokumentation for lydsegmentering.
Intonationsopsætning
Nogle stemmer har intonationsgrafer:
Intonationsgrafer er tilgængelige på stemmer, der viser et indstillings ikon ved siden af stemmenavnet - denne funktion findes på mere end halvdelen af stemmerne i biblioteket, inklusive både almindelige og PRO-muligheder
- Træk punkter på grafen for at ændre intonationen
- Hæv punkter for at øge tonehøjden på bestemte ord
- Sænk punkter for at skabe en mere seriøs tone
- Eksperimenter med forskellige kurver for naturlighed
Vælg den sætning, hvor du vil justere intonationen, og tryk på knappen intonation. Denne grænseflade vises.
Cache System og Grænsebesparelse
Smart Cache
SpeechGen bruger et intelligent cache-system, der markant sparer dine grænser. Systemet fungerer ved at gemme hver sætning (op til 100.000 tegn) i cachen i 7 dage. Når du regenererer din lyd, hentes alle uændrede sætninger automatisk fra cachen gratis - du betaler kun for nye eller redigerede sætninger. Dette betyder, at du kan foretage gradvise redigeringer af din tekst uden at forbruge hele din tegnkvote hver gang. Projektets historik gemmes i 30 dage, og filer du tilføjer til favoritter gemmes permanent.
Opbevaringsperioder:
- Sætningscache: 7 dage
- Projekthistorik: 30 dage
- Favoritfiler: Gemmes permanent
Fejlfinding af Almindelige Problemer
Problemer med Lydkvalitet
Stemmen lyder unaturlig:
- Prøv PRO-stemmer
- Reducer hastigheden til x0.9-x1.1
- Tjek korrekt tegnsætning
- Brug neutral tonehøjde (0)
Forkert udtale:
- Sørg for, at det korrekte sprog er valgt
- Skriv komplekse ord fonetisk
- Brug SSML-tags for præcis kontrol
Unaturlige pauser:
- Tjek tegnsætning
- Konfigurer pauser mellem sætninger
- Brug manuelle pauser .- eller <break time=""/>
- Fjern ekstra mellemrum og linjeskift
SSML-fejl:
- Tjek korrektheden af tags
- Ikke alle stemmer understøtter alle SSML-tags
Yderligere Funktioner
SSML (Speech Synthesis Markup Language)
For ekspert stemmekontrol, brug SSML-tags:
- <break time="2s"/> — pauser
- <emphasis level="strong"> — stemmebetoning
- <prosody rate="slow" pitch="low"> — ændring af talekarakteristika
⚠️ Opmærksomhed: Forskellige stemmer understøtter forskellige sæt af SSML-tags. Test funktionaliteten for hver specifik stemme.
Historik og Favoritter
- Projekthistorik: Gemmes automatisk i 30 dage
- Favoritter: Tilføj vigtige projekter for permanent opbevaring
Integration og API
API er tilgængelig for udviklere til at integrere SpeechGen.io i deres egne applikationer og tjenester.
Min fil vil ikke uploade til SpeechGen. Hvad skal jeg gøre?
Tjek først, at din fil er i et understøttet format (DOCX, PDF eller TXT). Sørg for, at filen ikke er beskadiget, og prøv at uploade igen. Hvis problemet fortsætter, skal du kopiere teksten manuelt og indsætte den direkte i tekstfeltet. Verificer også, at din filstørrelse ikke overstiger platformens grænser.
Hvor længe gemmer SpeechGen mine genererede lydfiler?
Din projekthistorik gemmes automatisk i 30 dage. Smart cachen (til sætningsbaserede besparelser) varer 7 dage. For at gemme filer permanent, tilføj dem til dine favoritter. Dette sikrer, at dine vigtige lydprojekter aldrig går tabt og forbliver tilgængelige i din profil.
Kan jeg bruge forskellige stemmer til forskellige karakterer i én lydfil?
Ja! SpeechGen tilbyder lydgenerering med flere stemmer (dialogtilstand). Du kan tildele forskellige stemmer til forskellige tekstafsnit, hvilket gør det perfekt til lydbøger med flere karakterer, uddannelsesmæssige dialoger eller podcasts med flere talere. Du kan endda bruge flersprogede stemmer til at skifte mellem sprog, mens du bevarer karakterkonsistens.
Forbruger ændring af lydindstillinger mine tegn-grænser?
Det afhænger af, hvilke indstillinger du ændrer. Justering af taletempo eller tonehøjde kræver fuld regenerering og vil forbruge dine tegn-grænser, da disse ændringer påvirker hele stemmesyntesen. Du kan dog frit ændre pauser mellem sætninger og afsnit uden forbrug af grænser. Desuden bruger SpeechGen smart caching: hvis du genererer en stor tekst, derefter redigerer kun én sætning og regenererer, vil systemet kun opkræve dig for den enkelte ændrede sætning, ikke hele teksten. Dette cache-system gemmer dine uændrede sætninger i 7 dage, hvilket gør iterativ redigering meget økonomisk.
Video
Stadig Spørgsmål?
Få hjælp fra vores fællesskab! Stil dine spørgsmål i vores Telegram-chat: https://t.me/speechgen