ThaiLLM - Thai Large Language Model

โครงการความร่วมมือระหว่างรัฐและเอกชนที่เพื่อพัฒนาโมเดลภาษาขนาดใหญ่ภาษาไทยแบบ open-weight โดย เพื่อทำหน้าที่เป็นโครงสร้างพื้นฐานด้านปัญญาประดิษฐ์ที่รองรับบริบททางภาษา และวัฒนธรรมของประเทศไทย โดยระยะแรกมุ่งเน้นในการพัฒนาโมเดลพื้นฐานสำหรับต่อยอด (Foundation Model) และโมเดลเฉพาะทางด้านการแพทย์ โครงการยังมุ่งรวบรวมข้อมูลข้อความภาษาไทย รวมถึงข้อมูลบางส่วนที่ไม่เคยเปิดเผยต่อสาธารณะมาก่อน เพื่อนำมาสร้างชุดข้อมูลและเครื่องมือแบบเปิด ตลอดจนจัดการฝึกอบรมด้านเทคนิคในหลายระดับ เพื่อสนับสนุนชุมชน NLP ภาษาไทย

Foundation Model

Choose a Model based on ThaiLLM to Get Started

OpenThaiGPT-ThaiLLM-8B-Instruct-v7.2 (Research Preview)

by AIEAT

Typhoon-S-ThaiLLM-8B-Instruct (Research Preview)

by SCB 10X

Pathumma-ThaiLLM-qwen3-8b-think-2.0.0

by NECTEC

THaLLE-0.2-ThaiLLM-8B-fa

by KBTG

Thai Open Source AI Infrastructure

ลดอุปสรรค เปิดกว้างสู่นวัตกรรม

ลดทรัพยากรในการเข้าถึงเทคโนโลยีองค์ความรู้ระดับประเทศ ทำให้ไทยมีโอกาสควบคุมข้อมูลและความเป็นส่วนตัว ทางเลือกใหม่เกิดขึ้น

เร่งพัฒนา AI ที่เข้าใจบริบทภาษาไทย

รองรับการปรับแต่งเชิงลึก (fine-tune) ให้ตอบสนองกับภาษา วัฒนธรรม และระบบการใช้งานของไทย เข้าใจและปรับเปลี่ยนให้ตรงความต้องการ

เสรีในการพัฒนาและใช้งาน

ลดข้อจำกัดในการใช้งานความรู้โมเดลระดับประเทศ เปิดโอกาสให้ผู้พัฒนา นักวิจัยใหม่ และนักวิชาการพัฒนาอย่างไม่มีข้อจำกัดลิขสิทธิ์

เพิ่มความโปร่งใส ความมั่นคง

โมเดลเปิดช่วยให้ตรวจสอบได้ ลดความเสี่ยงจาก bias และไม่ปรับเปลี่ยนให้พฤติกรรมอย่างไม่โปร่งใสและธรรมากับผู้ใช้งานชาวไทย

สร้างโอกาสพัฒนาบุคลากรไทย

ช่วยให้บุคลากรได้รับความรู้และการวิจัยด้าน AI จริงจัง พร้อมสร้างมูลค่าและการพัฒนา AI ทางเศรษฐกิจประเทศ

ต่อยอดนโยบายวิจัยระดับชาติ

เป็นพื้นฐานสำคัญในพัฒนาบริการด้านความรู้ต่างๆ เช่น แพทย์ สนับสนุนนโยบายรัฐบาล การศึกษา และการใช้งานสำคัญๆ

An Open-Weight Thai Foundation Model
by ThaiLLM Ecosystem

Open source Collaborators

Infrastructure Supported by

Dataset Contributors