OpenAI เปิดตัวโมเดล o1 ที่คิดก่อนตอบ และผลสอบเทียบเท่าผู้เรียนปริญญาเอก...

OpenAI ประกาศเปิดตัว ‘o1’ (โอวัน) โมเดลใหม่ที่ถูกออกแบบมาเพื่อความละเอียดในการวิเคราะห์โจทย์ก่อนจะสร้างคำตอบ หรือ ‘คิดก่อนตอบ’ ทำให้ o1 สามารถรับมือกับคำถามที่มีความซับซ้อนได้ดีกว่าด้วยการ ‘ใช้เหตุผล’ ตามที่ระบุในโพสต์ของ OpenAI เพื่อทบทวนกระบวนการหาคำตอบและรับรู้ข้อผิดพลาดของตัวเอง

o1 ที่ OpenAI ปล่อยออกมามี 2 โมเดล คือ o1-preview และ o1-mini โดย o1-preview เปิดให้บริการแค่สำหรับผู้ใช้ ChatGPT Plus และ ChatGPT Team (ต้องเสียค่าใช้จ่าย 20 และ 25 ดอลลาร์สหรัฐต่อเดือน ตามลำดับ) โดยมีการจำกัดการส่งข้อความที่ 30 ข้อความต่อสัปดาห์

ส่วน o1-mini เป็นโมเดลเวอร์ชันที่มีต้นทุนต่ำกว่า o1-preview ถึง 80% ทำให้มันเป็นตัวเลือกที่น่าสนใจสำหรับนักพัฒนากับผู้ใช้งานที่ต้องการคำตอบในสายงานที่เกี่ยวข้องกับวิทยาศาสตร์ เทคโนโลยี วิศวกรรม และคณิตศาสตร์ (STEM)

o1 แสดงให้เห็นถึงระดับความสามารถที่เทียบเท่ากับนักศึกษาระดับปริญญาเอกในแบบทดสอบ GPQA Diamond กับวิชาที่ท้าทายอย่างฟิสิกส์ เคมี และชีววิทยา ที่ผลการทดสอบจาก OpenAI ระบุว่า “o1 เป็นโมเดลแรกที่ทำคะแนนได้สูงกว่าผู้เชี่ยวชาญที่เป็นมนุษย์” รวมทั้งคณิตศาสตร์และการเขียนโค้ดที่ o1-preview ก็ได้คะแนน 83% ในข้อสอบคัดเลือกโอลิมปิกคณิตศาสตร์นานาชาติ ขณะที่ GPT-4o ทำได้เพียง 13% เท่านั้น

อย่างไรก็ตาม วรวิสุทธิ์ ภิญโญยาง ที่ปรึกษาด้านเอไอให้องค์กร และผู้ร่วมก่อตั้งบริษัท Impact Mind AI และ Insiderly.ai ได้โพสต์บนเฟซบุ๊กส่วนตัวเพื่อย้ำในประเด็นการตีความผิดเมื่อเราเทียบความเก่งของ AI กับมนุษย์ว่า “พวก Benchmark เหล่านี้คือการให้มัน (AI) ทำข้อสอบแล้วเอาไปเทียบ ไม่ได้แปลว่ามันเก่งกว่าคนจบปริญญาเอกแต่อย่างใด”

สำหรับ OpenAI การเปิดตัวโมเดลใหม่นี้ถือเป็นก้าวสำคัญที่จะไปสู่เป้าหมายการสร้าง AI ที่มีศักยภาพคล้ายมนุษย์ ซึ่งตอนนี้ o1 สามารถเขียนโค้ดหรือแก้โจทย์ที่ซับซ้อนได้ดีกว่ารุ่นก่อนๆ แม้ว่าการใช้งานจะมีค่าใช้จ่ายการสร้าง Output แพงกว่า 4 เท่า และใช้เวลาประมวลผลช้ากว่าเมื่อเทียบกับ GPT-4o

จุดที่ทำให้ o1 แตกต่างจากโมเดล GPT ในรุ่นก่อนหน้าของ OpenAI ตามประสบการณ์ของ The Verge ที่ได้พูดคุยกับ Jerry Tworek หัวหน้าทีมวิจัยของ OpenAI คือระบบการฝึกฝนโมเดล o1 ให้คิดเป็นลำดับขั้น หรือที่เรียกว่า ‘Chain of Thought’ ซึ่งคล้ายกับวิธีที่มนุษย์ใช้สำหรับการแก้ปัญหาที่เป็นกระบวนการคิดแบบทีละขั้นตอน

ระบบการฝึกฝนที่ให้ AI คิดเป็นลำดับขั้นทำให้ o1 สร้างคำตอบผิดน้อยลง “เราพบได้ว่าโมเดลนี้ (o1) เกิดอาการหลอนน้อยลง แต่แน่นอนว่าเราก็ยังฟันธงไม่ได้ว่าเราแก้ปัญหานี้ได้แล้วอย่างหมดจด” Jerry กล่าว

อย่างไรก็ดี ใช่ว่าโมเดล o1 จะเป็นนวัตกรรมที่ดีที่สุด เพราะ o1 ก็ยังไม่สามารถทำหน้าที่บางด้านที่ GPT-4o (โมเดลเรือธงก่อนหน้า o1) สามารถทำได้ในขณะนี้ เช่น การเข้าถึงข้อมูลบนเว็บไซต์ต่างๆ การประมวลผลเพื่อวิเคราะห์ไฟล์หรือการวิเคราะห์รูป โดย OpenAI ระบุว่าบริษัทมีแผนที่จะนำฟีเจอร์เหล่านี้เพิ่มเข้ามาในอนาคตให้กับ o1 แต่ยังไม่มีวันเวลาที่ชัดเจน

ผู้ใช้ ChatGPT Plus และ ChatGPT Team จะสามารถเข้าถึงทั้ง o1-preview และ o1-mini ได้ตั้งแต่วันนี้เป็นต้นไป ในขณะที่ผู้ใช้ ChatGPT Enterprise และ ChatGPT Edu จะทำได้ในช่วงต้นสัปดาห์หน้า ขณะที่ผู้ใช้ ChatGPT ฟรีทุกคนน่าจะเข้าถึงโมเดลน้องเล็กอย่าง o1-mini ได้ตามแผนของ OpenAI แต่ทางบริษัทยังไม่มีกำหนดวันที่แน่นอนสำหรับผู้ใช้งานฟรี

ภาพ: OpenAI

อ้างอิง:

FOLLOW US

OpenAI เปิดตัวโมเดล o1 ที่คิดก่อนตอบ และผลสอบเทียบเท่าผู้เรียนปริญญาเอกในวิชาฟิสิกส์ เคมี และชีววิทยา

TAGS:

ABOUT THE AUTHOR

สรสิช ลีลานุกิจ

EDITOR'S PICK

Corruption is testing Thailand’s OECD ambitions.

“ผ่านเกณฑ์มาตรฐาน” แต่ห้ามกินเครื่องในปลา ย้อนดูวิกฤตโลหะหนักข้ามพรมแดนในลุ่มน้ำภาคเหนือ

โต เลิม เยือนไทย: กึ่งศตวรรษความสัมพันธ์ไทย-เวียดนามกับโอกาสที่ไม่ควรพลาดบนระเบียบโลกใหม่

เปิดเหตุผลนักวิเคราะห์ ทำไมสหรัฐฯ บุกคิวบา อาจไม่ง่ายอย่างที่คิด

MOST POPULAR

ดร.มัลลิกา ประกาศวิสัยทัศน์กรุงเทพฯ เมืองเสรี ปลอดภัย เคารพความหลากหลายทางเพศ สร้างเศรษฐกิจกลางคืน

งานแบบไหนที่ AI (ยัง) แทนไม่ได้? พร้อมทริควางแผนการเงินให้อยู่รอดในยุค AI ครองโลก

Google ยืนยันโฆษณายุค AI ไม่ได้จ่ายแพงขึ้น ใช้ Gemini รับพฤติกรรมคนค้นหาที่เปลี่ยนสู่การสนทนา

ซาบีดาเปิดวัฒนธรรมสร้างสรรค์สัญจร ปี 4 ดึงเยาวชนร่วมขับเคลื่อนทุนวัฒนธรรม รับมือยุค AI