เอสซีบี เท็นเอกซ์ (SCB 10X) ประกาศเปิดตัว Typhoon 2 ให้ทดลองใช้งานได้แล้ว ท่ามกลางการเดินหน้าผลักดันระบบนิเวศ AI ประเทศไทยของบริษัท ด้วยโมเดลใหม่ที่มีความสามารถในการรองรับและประมวลผลข้อมูลในรูปแบบภาพ เสียง และข้อความ หรือที่เรียกความสามารถนี้อีกอย่างว่า ‘Multimodal Capabilities’
Typhoon 2 เป็นชุดของโมเดลภาษาขนาดใหญ่ (Large Language Models: LLMs) พัฒนาต่อยอดจากโมเดลโอเพนซอร์สอย่าง Llama 3 และ Qwen2 โดย SCB 10X ได้ฝึกโมเดลเพิ่มเติมด้วยข้อมูลทั้งภาษาอังกฤษและภาษาไทย ซึ่ง Typhoon 2 ก็ถูกปรับแต่งให้เหมาะกับภาษาไทยที่ประกอบด้วยโมเดลสำหรับการประมวลผลข้อความ ภาพ และเสียง
ข่าวที่เกี่ยวข้อง:
- Typhoon โมเดลภาษาโอเพนซอร์สที่จะเปลี่ยนไทยจาก ‘ผู้ใช้’ เป็น ‘ผู้สร้าง’ นวัตกรรม
- SCBX จับมือ SambaNova เพิ่ม ‘ไต้ฝุ่น’ โมเดลภาษาไทยขนาดใหญ่
ในการเปิดตัวครั้งนี้ SCB 10X เปิดตัวโมเดลข้อความ (Text Model) 5 ขนาด แบ่งเป็นขนาดเล็ก (1 กับ 3 Billion Parameters), ขนาดกลาง (7 กับ 8 Billion Parameters) และขนาดใหญ่ (70 Billion Parameters) ที่มาพร้อมกับความสามารถในการปฏิบัติตามคำสั่งที่ดีขึ้น และปริมาณข้อความที่ AI สามารถประมวลผลและจดจำได้ (Context Length) ที่ยาวกว่าเดิม รวมทั้งปรับประสิทธิภาพ Benchmark ภาษาไทยต่างๆ ให้ดีขึ้น
นอกจากนี้เวอร์ชันที่สามารถปรับแต่งสำหรับงานเฉพาะด้าน (Instruction Tuned) ยังมี Typhoon2-Safety ซึ่งเป็นตัวจำแนก (Classifier) เพื่อเพิ่มความปลอดภัยในการสร้างคำตอบ ซึ่งถูกปรับให้เหมาะกับวัฒนธรรมและภาษาไทย
อีกไฮไลต์สำคัญคือ Typhoon2-Vision ที่เข้าใจเอกสารภาษาไทยได้ดีขึ้น ขณะที่ยังคงความสามารถด้านการประมวลผลภาพ เช่น การสร้างคำบรรยายภาพ (Image Captioning) และยังมี Typhoon2-Audio โมเดลที่ช่วยให้สร้างข้อความและเสียงพร้อมกันได้เพื่อการโต้ตอบที่ราบรื่น
สำหรับผู้ที่สนใจทดลอง สามารถโหลด Model Weights ได้ที่ https://huggingface.co/…/typhoon-2-text… เพื่อเริ่มต้นใช้งาน Typhoon 2
อ้างอิง: