กลุ่ม SCBX โดยเอสซีบี เอกซ์ (SCBX) และเอสซีบี เท็นเอกซ์ (SCB 10X) เดินหน้าผลักดันระบบนิเวศและคอมมูนิตี้ AI ในประเทศไทยอย่างต่อเนื่อง ดัน ‘ไต้ฝุ่น’ เปิดให้บริการบนแพลตฟอร์ม Samba-1
ล่าสุดได้ร่วมมือกับ SambaNova Systems (SambaNova) บริษัทผู้ให้บริการโซลูชันด้าน Generative AI ที่รวบรวมโมเดลที่เร็วที่สุดและชิปที่ทันสมัยที่สุด นำ ‘ไต้ฝุ่น’ (Typhoon) โมเดลภาษาไทยขนาดใหญ่ (Thai Large Language Model) เปิดให้บริการบนแพลตฟอร์ม Samba-1 Composition of Experts (CoE) เพื่อให้นักพัฒนา AI ทั่วโลกสามารถใช้ต่อยอดและพัฒนาแอปพลิเคชันด้าน AI บนแพลตฟอร์ม Samba-1 ได้แล้ววันนี้
กสิมะ ธารพิพิธชัย Head of AI Strategy บริษัท เอสซีบี เท็นเอกซ์ จำกัด (SCB 10X) กล่าวว่า ‘ไต้ฝุ่น’ โมเดลภาษาไทยขนาดใหญ่ (Thai Large Language Model) ได้เข้าร่วมเป็นส่วนหนึ่งของ Samba-1 และพร้อมให้บริการแก่ลูกค้าของ SambaNova ทั่วโลก โดยเชื่อมั่นว่า Samba-1 จะช่วยให้โมเดลไต้ฝุ่นเข้าถึงนักพัฒนานวัตกรรมและแอปพลิเคชันด้าน AI ภาษาไทยได้มากขึ้น
โดยล่าสุดไต้ฝุ่นได้เปิดตัวเวอร์ชัน Typhoon-1.5X ในขนาด 8B และ 70B พัฒนาต่อยอดจากโมเดล Llama 3 โมเดลถูกปรับแต่งให้เหมาะสำหรับภาษาไทย โดยมีเทคนิคการฝึกอบรมเพื่อให้เข้าใจบริบทและวัฒนธรรมไทยให้ดียิ่งขึ้น มีประสิทธิภาพเทียบเท่ากับโมเดลชั้นนำอย่าง ChatGPT และ GPT-4 นับเป็นความก้าวหน้าที่สำคัญของ NLP และ AI ภาษาไทย
ไต้ฝุ่นเปิดให้ใช้งานในรูปแบบ Open Beta ใน 2 รูปแบบ ได้แก่
- Pre-trained Model โมเดลข้อมูลด้านภาษาไทย ครอบคลุมคำศัพท์ บริบท หรือความแตกต่างทางวัฒนธรรม รวมถึงความรู้ทั่วไปที่เกิดขึ้นทั่วโลก โมเดลนี้เป็น Open Source ที่นักพัฒนาด้าน AI สามารถดาวน์โหลดได้ฟรี เพื่อนำไปใช้พัฒนาแอปพลิเคชันและนวัตกรรมด้าน AI
- Instruction-Tuned Model โมเดลที่ต่อยอดจาก Pre-training สามารถทำตามคำสั่งที่ป้อนเข้าไป เช่น การแปล การสรุปความ หรือการตอบคำถาม ได้ดียิ่งขึ้น โดยสามารถเข้าถึงได้ผ่านบริการ API
ด้าน กวีวุฒิ เต็มภูวภัทร Head of R&D and Innovation Lab บริษัท เอสซีบี เอกซ์ จำกัด (มหาชน) หรือ SCBX กล่าวว่า ไต้ฝุ่น โมเดลภาษาขนาดใหญ่ (Large Language Model หรือ LLM) ถูกพัฒนาขึ้นมาเพื่อแก้ปัญหาที่มักเจอเมื่อใช้งานโมเดลภาษาขนาดใหญ่ที่พัฒนาโดยชาวต่างชาติ และถูกฝึกฝนเป็นภาษาอังกฤษเป็นหลัก เช่น การให้ข้อมูลภาษาไทย แต่ไม่ถูกกับบริบทหรือวัฒนธรรมของคนไทย
อีกทั้งภาษาไทยถูกเก็บข้อมูลสำหรับใช้พัฒนาโมเดลภาษาไว้น้อยมาก (Low-Resource Language) เช่นเดียวกับภาษาอื่นๆ ในภูมิภาคเอเชียตะวันออกเฉียงใต้ ทำให้เกิดปัญหาช่องว่างทางภาษา เราเชื่อว่าการนำโมเดลไต้ฝุ่นไปอยู่บน Samba-1 จะช่วยให้นักพัฒนาด้าน AI ได้รับประสบการณ์ (User Experience) ที่ดีขึ้น พร้อมมีส่วนช่วยยกระดับนวัตกรรมด้าน AI และเสริมสร้างความแข็งแกร่งให้แก่อุตสาหกรรม AI ของไทย
ขณะที่ โรดริโก เหลียง ผู้ร่วมก่อตั้งและซีอีโอของ SambaNova Systems กล่าวว่า Samba-1 นำเสนอโมเดล Open Source ที่ทันสมัยที่สุด ซึ่งช่วยให้นักพัฒนาแอปพลิเคชันและนวัตกรรมด้าน AI เข้าถึงโมเดล AI ที่ดีที่สุดและเร็วที่สุดในโลก โดยการเข้าร่วมของไต้ฝุ่นครั้งนี้สอดคล้องกับกลยุทธ์ของเรา อีกทั้งเรายินดีเป็นอย่างยิ่งที่จะได้นำไต้ฝุ่นเข้าสู่ Samba-1 ร่วมกับโมเดลชั้นนำระดับโลก
ส่วน มาร์แชล ชอย SVP Product ของ SambaNova Systems กล่าวเสริมว่า นักพัฒนาด้าน AI ในอุตสาหกรรมต่างๆ รวมถึงอุตสาหกรรมด้านการเงินการธนาคาร จะมีแพลตฟอร์มใหม่ที่ช่วยเพิ่มศักยภาพในการพัฒนาแอปพลิเคชันและนวัตกรรมด้าน AI ของพวกเขา การนำโมเดลไต้ฝุ่นมาอยู่บนแพลตฟอร์ม Samba-1 Composition of Experts จะช่วยส่งเสริมประสิทธิภาพของโมเดลไต้ฝุ่น และลดต้นทุนการใช้งานให้น้อยลงกว่าที่เคย
ไต้ฝุ่นได้เป็นส่วนหนึ่งของแพลตฟอร์ม Samba-1 Composition of Experts ซึ่งเป็นเอกลักษณ์เฉพาะของ SambaNova ที่รวบรวมโมเดลสำหรับพัฒนานวัตกรรมด้าน AI ที่หลากหลาย และสามารถแนะนำโมเดลเฉพาะทางที่ตอบโจทย์ผู้ใช้งานได้อย่างมีประสิทธิภาพและตรงกับความต้องการผู้ใช้งาน นอกจากนี้ไต้ฝุ่นทำงานบนชิป SN40L ของ SambaNova ด้วยหน่วยความจำ Dataflow 3 ชั้น ซึ่งช่วยให้การประมวลผลข้อมูลมีประสิทธิภาพมากยิ่งขึ้น