By ThaiLLM Collaboration
*All the names are listed in Thai alphabetical order
โครงการความร่วมมือระหว่างรัฐและเอกชนที่เพื่อพัฒนาโมเดลภาษาขนาดใหญ่ภาษาไทยแบบ open-weight โดย เพื่อทำหน้าที่เป็นโครงสร้างพื้นฐานด้านปัญญาประดิษฐ์ที่รองรับบริบททางภาษา และวัฒนธรรมของประเทศไทย โดยระยะแรกมุ่งเน้นในการพัฒนาโมเดลพื้นฐานสำหรับต่อยอด (Foundation Model) และโมเดลเฉพาะทางด้านการแพทย์ โครงการยังมุ่งรวบรวมข้อมูลข้อความภาษาไทย รวมถึงข้อมูลบางส่วนที่ไม่เคยเปิดเผยต่อสาธารณะมาก่อน เพื่อนำมาสร้างชุดข้อมูลและเครื่องมือแบบเปิด ตลอดจนจัดการฝึกอบรมด้านเทคนิคในหลายระดับ เพื่อสนับสนุนชุมชน NLP ภาษาไทย
ลดทรัพยากรในการเข้าถึงเทคโนโลยีองค์ความรู้ระดับประเทศ ทำให้ไทยมีโอกาสควบคุมข้อมูลและความเป็นส่วนตัว ทางเลือกใหม่เกิดขึ้น
รองรับการปรับแต่งเชิงลึก (fine-tune) ให้ตอบสนองกับภาษา วัฒนธรรม และระบบการใช้งานของไทย เข้าใจและปรับเปลี่ยนให้ตรงความต้องการ
ลดข้อจำกัดในการใช้งานความรู้โมเดลระดับประเทศ เปิดโอกาสให้ผู้พัฒนา นักวิจัยใหม่ และนักวิชาการพัฒนาอย่างไม่มีข้อจำกัดลิขสิทธิ์
โมเดลเปิดช่วยให้ตรวจสอบได้ ลดความเสี่ยงจาก bias และไม่ปรับเปลี่ยนให้พฤติกรรมอย่างไม่โปร่งใสและธรรมากับผู้ใช้งานชาวไทย
ช่วยให้บุคลากรได้รับความรู้และการวิจัยด้าน AI จริงจัง พร้อมสร้างมูลค่าและการพัฒนา AI ทางเศรษฐกิจประเทศ
เป็นพื้นฐานสำคัญในพัฒนาบริการด้านความรู้ต่างๆ เช่น แพทย์ สนับสนุนนโยบายรัฐบาล การศึกษา และการใช้งานสำคัญๆ