×

DeepSeek เปิดตัวโมเดล AI รุ่นใหม่ เน้นประสิทธิภาพสูง ราคาถูกลง แต่ยังมีข้อกังขาเรื่องความปลอดภัย

01.10.2025
  • LOADING...
deepseek-v3-2-exp-sparse-attention-reduce-ai-cost-50-percent

สตาร์ทอัพจีน DeepSeek เปิดตัวโมเดล AI ทดลองรุ่นล่าสุดที่จะช่วยเพิ่มประสิทธิภาพและรองรับข้อมูลขนาดใหญ่ได้ดียิ่งขึ้น ในขณะที่มีค่าใช้จ่ายต่ำลงกว่ารุ่นก่อน แต่คำถามใหญ่ยังคงอยู่เกี่ยวกับความแม่นยำและความปลอดภัยของสถาปัตยกรรมใหม่นี้

 

DeepSeek เคยสร้างความฮือฮาในซิลิคอนแวลลีย์เมื่อปีที่แล้ว หลังจากเปิดตัวโมเดลแรก R1 แบบไม่คาดคิด โดยแสดงให้เห็นว่าสามารถฝึกโมเดลภาษา (LLMs) ได้อย่างรวดเร็ว โดยใช้ชิปที่ทรงพลังน้อยกว่าและทรัพยากรน้อยกว่าโมเดลยักษ์ใหญ่ทั่วไป

 

ล่าสุด ได้เปิดตัวโมเดลใหม่ DeepSeek-V3.2-Exp ต่อยอดจากรุ่นก่อนหน้า V3.1-Terminus และมีการเปิดเผยรายละเอียดบนแพลตฟอร์ม Hugging Face จุดเด่นสำคัญคือฟีเจอร์ DSA (DeepSeek Sparse Attention) ซึ่งช่วยให้โมเดลจัดการเอกสารและบทสนทนาที่ยาวขึ้นได้ดีขึ้น พร้อมทั้งลดต้นทุนการทำงานของ AI ลงครึ่งหนึ่งเมื่อเทียบกับรุ่นก่อน

 

ผู้เชี่ยวชาญอย่าง Nick Patience จาก Futurum Group ระบุว่า ฟีเจอร์ใหม่นี้ทำให้โมเดลเร็วขึ้น ราคาถูกลง และเข้าถึงได้ง่ายขึ้นสำหรับนักพัฒนา บริษัทขนาดเล็ก และนักวิจัย ซึ่งอาจจุดประกายให้เกิดการประยุกต์ใช้ AI รูปแบบใหม่ๆ จำนวนมาก

 

หลักการของ Sparse Attention คือการเลือกประมวลผลเฉพาะข้อมูลที่เกี่ยวข้องกับงานนั้นๆ แทนที่จะต้องใช้ข้อมูลทั้งหมดเหมือนโมเดลดั้งเดิม ยกตัวอย่างเช่น การหาทางบินที่ดีที่สุดจากเมืองหนึ่งไปอีกเมืองหนึ่ง แทนที่จะพิจารณาเส้นทางทุกเส้นทาง โมเดลจะกรองเส้นทางที่ไม่เหมาะสมออกไป ทำให้ประหยัดเวลา น้ำมัน และต้นทุนได้มาก

 

อย่างไรก็ตาม มีความกังวลว่า Sparse Attention อาจลดทอนความละเอียดอ่อนของข้อมูล หากกลไกการตัดสินใจว่าข้อมูลใดไม่สำคัญ ไม่แม่นยำพอ ก็อาจทำให้ผลลัพธ์ไม่ถูกต้องหรือไม่น่าเชื่อถือ ซึ่งอาจกระทบต่อความปลอดภัยและความครอบคลุมของ AI ได้

 

นักลงทุนอย่าง Ekaterina Almasque ตั้งข้อสังเกตว่า “คำถามคือโมเดลสามารถตัดสิ่งที่ไม่สำคัญออกจริงๆ หรือมันอาจตัดข้อมูลสำคัญทิ้งไปด้วย?” หากเป็นเช่นนั้น ผลลัพธ์ก็อาจไม่เกี่ยวข้องหรือไม่ปลอดภัยเท่าที่ควร

 

แม้จะมีข้อกังขา แต่ DeepSeek ยืนยันว่าโมเดลใหม่นี้ทำงานได้ในระดับเดียวกับ V3.1-Terminus อีกทั้งยังทำงานได้อย่างมีประสิทธิภาพบนชิป AI ที่ผลิตในจีน เช่น Ascend และ Cambricon ซึ่งช่วยให้สามารถรันโมเดลบนฮาร์ดแวร์ภายในประเทศได้ทันทีโดยไม่ต้องพึ่งพาเทคโนโลยีต่างชาติ

 

DeepSeek ยังได้เปิดโค้ดและเครื่องมือทั้งหมดของโมเดลทดลองให้สาธารณะเข้าถึงได้ในรูปแบบโอเพ่นซอร์ส เพื่อให้นักพัฒนานำไปศึกษาและต่อยอดได้ แต่สิ่งนี้ก็ทำให้บริษัทไม่สามารถสร้างสิทธิบัตรเพื่อปกป้องเทคโนโลยีได้ ทำให้ความได้เปรียบในการแข่งขันอาจขึ้นอยู่กับ ‘วิธีการคัดเลือกข้อมูล’ มากกว่าตัวโมเดลเอง

 

บริษัทระบุว่า V3.2-Exp เป็นเพียงก้าวกลางไปสู่สถาปัตยกรรมรุ่นถัดไป ขณะที่นักวิเคราะห์ชี้ว่า กลยุทธ์ของ DeepSeek คือการย้ำจุดขายเรื่องประสิทธิภาพและต้นทุนต่ำมากกว่าพลังการประมวลผลดิบๆ เพื่อดึงดูดชุมชนและผู้ใช้งานให้อยู่กับระบบของตนในระยะยาว

 

Adina Yakefu จาก Hugging Face กล่าวสรุปว่าผู้คนจะเลือกสิ่งที่ถูก เชื่อถือได้ และมีประสิทธิภาพเสมอ ซึ่งเป็นสิ่งที่ DeepSeek พยายามสร้างความได้เปรียบในสงคราม AI ระหว่างสหรัฐฯ และจีนในปัจจุบัน

 

ภาพ: CFOTO / Contributor / Getty Images 

 

อ้างอิง:

  • LOADING...

READ MORE




Latest Stories

Close Advertising