Voicebox เป็นแอปโอเพนซอร์สที่เปลี่ยน Mac ของคุณให้เป็นสตูดิโอสังเคราะห์เสียงและโคลนเสียงแบบโลคัลขนาดเล็ก มันใช้โมเดล Qwen3-TTS เพื่อสร้างเสียงที่สมจริงได้โดยตรงบนอุปกรณ์ของคุณ โดยไม่ต้องพึ่งพาบริการคลาวด์ โทเค็น หรือการสมัครสมาชิกแบบเสียเงิน
แอปโคลนเสียงที่ออกแบบมาสำหรับ macOS
ด้วย Voicebox คุณสามารถสร้างโปรไฟล์เสียงจากเสียงอ้างอิงเพียงไม่กี่วินาที (สูงสุด 30 วินาที) โมเดล Qwen3-TTS จะวิเคราะห์โทนเสียง เนื้อเสียง และสำเนียงเพื่อจำลองออกมาด้วยความเที่ยงตรงในระดับสูง คุณแค่อัปโหลดไฟล์เสียงหรืออัดเสียงจากไมโครโฟนของ Mac ระบุว่าพูดว่าอะไร หรือใช้การถอดเสียงอัตโนมัติ แล้วคุณก็จะได้โปรไฟล์ที่พร้อมสร้างเสียงใหม่ โดยไม่ต้องทำขั้นตอนซ้ำ
สร้างเสียงด้วยโปรไฟล์เสียงแบบกำหนดเอง
เมื่อคุณมีโปรไฟล์ที่บันทึกไว้แล้ว เพียงพิมพ์ข้อความที่ต้องการ แล้ว Voicebox จะสร้างเสียงด้วยเสียงนั้น ตัวอย่างเช่น คุณสามารถแปลประโยคเป็นภาษาอื่นโดยยังคงโทนเสียงของคุณไว้ เพื่อทำเสียงพากย์ที่บ้านหรือสร้างเสียงสำหรับโปรเจกต์วิดีโอเกมได้ คุณยังสามารถส่งออกโปรไฟล์เสียงและแชร์ให้ผู้ใช้อื่น เพื่อให้พวกเขาสร้างเสียงบนอุปกรณ์ของตนเองได้ด้วย
การถอดเสียงอัตโนมัติและการจับเสียงของระบบ
แอปผสานรวม Whisper ซึ่งแปลงเสียงเป็นข้อความและซิงก์เข้ากับเสียงที่สร้างขึ้น ซึ่งช่วยให้แก้ไขบทพูดได้ง่ายขึ้นโดยตรงบนไทม์ไลน์ ปรับช่วงหยุดหรือแก้การออกเสียงโดยไม่เสียความสม่ำเสมอของโปรไฟล์เสียง นอกจากนี้ยังมีการจับเสียงระบบ ทำให้คุณอัดเสียงบน Mac ได้ (เช่น จากเกมหรือการโทร) แล้วนำไปใช้เป็นข้อมูลอ้างอิงสำหรับโคลนใหม่หรือฉากเสียงได้
เซิร์ฟเวอร์เสียงแบบโลคัลและ API สำหรับโปรเจกต์อื่น
Voicebox ไม่ได้มีแค่อินเทอร์เฟซแบบกราฟิกเท่านั้น แต่ยังทำงานเป็นเซิร์ฟเวอร์เสียงแบบโลคัลได้ด้วย REST API ที่รวมมาในตัว คุณสามารถเปิดใช้งานได้ด้วยคลิกเดียว ส่งข้อความจากเกม แอป หรือเอเจนต์ AI แล้วรับเสียงที่สร้างขึ้นในรูปแบบมาตรฐานได้ สิ่งนี้ช่วยให้ทำงานบรรยาย บทสนทนา หรือทำระบบแจ้งเตือนแบบอัตโนมัติได้โดยไม่ต้องพึ่งบริการภายนอก แอปพัฒนาด้วย Tauri, Rust และ Python ทำให้เบากว่าทางเลือกที่ใช้ Electron หลายตัว ถึงอย่างนั้น ประสิทธิภาพก็จะขึ้นอยู่กับความแรงของ Mac ของคุณและการตั้งค่าโมเดล Qwen3-TTS เพราะการประมวลผลทั้งหมดทำในเครื่อง
สร้างเรื่องเล่าพร้อมเสียงบรรยายด้วยเสียงใดก็ได้
Voicebox ยังมีส่วนสำหรับสร้างเรื่องเล่าที่มีการบรรยายด้วยเสียง คุณเพียงระบุว่าอยากให้เกิดอะไรขึ้น แล้วแอปจะสร้างเนื้อหาโดยใช้เสียงที่คุณเลือก นี่เป็นฟีเจอร์ที่มีประโยชน์สำหรับทำคอนเทนต์สนุกๆ นิทานเด็ก หรือสเก็ตช์เสียง
ประสบการณ์ของฉันในการใช้ Voicebox บน Mac
ตอนที่ฉันทดสอบ Voicebox บน macOS กระบวนการโคลนทำได้รวดเร็วและง่าย: ใช้เสียงเพียงไม่กี่วินาทีก็สร้างโปรไฟล์และสร้างคลิปเสียงหลายๆ คลิปบนไทม์ไลน์ได้แล้ว ประสบการณ์ใช้งานลื่นไหล แม้ว่าจะยังขาดตัวเลือกขั้นสูงบางอย่าง เช่น การเพิ่มตัวอย่างเสียงเพื่อปรับคุณภาพ หรือการปรับจูนเสียงที่โคลนให้ละเอียดขึ้น
สิ่งที่ฉันชอบที่สุดเกี่ยวกับ Voicebox และสิ่งที่ควรปรับปรุง
สิ่งที่ฉันชอบที่สุด: กระบวนการโคลนและสังเคราะห์ทั้งหมดทำแบบโลคัลบน Mac ของคุณ โดยไม่ต้องพึ่งคลาวด์หรือจ่ายค่าสมัครสมาชิก
· สิ่งที่ฉันอยากปรับปรุง: การปรับแต่งเสียงที่มากขึ้นและการรองรับตัวอย่างเสียงหลายไฟล์ เพราะจะช่วยให้ได้ผลลัพธ์ที่สมจริงยิ่งขึ้น นอกจากนี้ เวลาการสร้างอาจแตกต่างกันไปตามพลังของอุปกรณ์และโมเดลที่เลือก
Voicebox เหมาะกับคุณถ้า...
✓ คุณต้องการโคลนเสียงและสร้างเสียงพูดบน macOS โดยไม่ต้องพึ่งบริการคลาวด์
✓ คุณทำงานกับพอดแคสต์ งานพากย์ เกม หรือเอเจนต์ AI และต้องการตัวแก้ไขไทม์ไลน์สำหรับฉากเสียง
✓ คุณชอบโซลูชันแบบโลคัล เป็นส่วนตัว และโอเพนซอร์ส ที่สามารถนำไปผสานรวมกับโปรเจกต์อื่นได้
ดาวน์โหลด Voicebox แล้วเปลี่ยน Mac ของคุณให้เป็นสตูดิโอโคลนเสียงและสังเคราะห์เสียงแบบโลคัลเต็มรูปแบบ ที่รองรับ Qwen3-TTS และ Whisper
รีวิว
ยังไม่มีความคิดเห็นเกี่ยวกับ Voicebox เป็นคนแรก! คอมเมนต์