Google กำลังผลักดันวิสัยทัศน์สู่การพัฒนา ปัญญาประดิษฐ์ทั่วไป (AGI) ที่ฉลาด เข้าใจบริบท และสามารถกระทำการแทนมนุษย์ได้อย่างมีประสิทธิภาพ
Demis Hassabis ซีอีโอของ DeepMind ระบุว่า Google กำลังเร่งวิจัยเชิงลึกเพื่อบรรลุเป้าหมายนี้ ในงาน Google I/O 2025 การประชุมนักพัฒนาประจำปีของ Google ที่จัดขึ้นวันที่ 20-21 พฤษภาคม ซึ่งเป็นเวทีสำคัญในการเปิดตัวนวัตกรรมและเทคโนโลยีใหม่ๆ โดยในปีนี้ THE STANDARD เป็นสื่อไทยเพียงรายเดียวที่รายงานข่าวจากเมาน์เทนวิว รัฐแคลิฟอร์เนีย
หนึ่งในก้าวสำคัญคือการขยาย Gemini 2.5 Pro สู่การเป็น world model – ระบบ AI ที่สามารถจำลองโลก วางแผน และจินตนาการประสบการณ์ใหม่ๆ ได้เสมือนสมองมนุษย์ นำไปสู่การสร้าง ผู้ช่วย AI สากล ที่สามารถเข้าใจเสียง ภาพ และบริบทในชีวิตจริง รวมถึงดำเนินการแทนผู้ใช้ได้ในทุกอุปกรณ์
Demis Hassabis กล่าวว่า “ตลอดทศวรรษที่ผ่านมา เราได้วางรากฐานมากมายสำหรับยุคใหม่ของ AI ตั้งแต่การบุกเบิกสถาปัตยกรรม Transformer ซึ่งเป็นพื้นฐานของโมเดลภาษาขนาดใหญ่ (LLM) ทั้งหมด ไปจนถึงการพัฒนาระบบตัวแทน (agent systems) อย่าง AlphaGo และ AlphaZero ที่สามารถเรียนรู้และวางแผนได้”
“เราได้นำเทคนิคเหล่านี้ไปใช้ในหลากหลายสาขา เช่น ควอนตัมคอมพิวติ้ง คณิตศาสตร์ วิทยาศาสตร์ชีวภาพ และการค้นพบอัลกอริทึมใหม่ๆ ทั้งยังมุ่งหน้าวิจัยพื้นฐานอย่างต่อเนื่อง เพื่อบรรลุเป้าหมาย AGI (Artificial General Intelligence)”
“นี่คือเหตุผลที่เรากำลังขยายโมเดลมัลติโหมดชั้นนำของเรา Gemini 2.5 Pro ให้เป็นโมเดลโลก (world model) ซึ่งสามารถวางแผนและจินตนาการประสบการณ์ใหม่ๆ โดยเข้าใจและจำลองแง่มุมต่างๆ ของโลกได้อย่างที่สมองมนุษย์ทำได้”
“เราเริ่มดำเนินการในทิศทางนี้มานาน ตั้งแต่การฝึก agent ให้เชี่ยวชาญเกมซับซ้อนอย่าง Go และ StarCraft ไปจนถึงการสร้าง Genie 2 ที่สามารถจำลองสภาพแวดล้อมสามมิติจากเพียงภาพเดียว (image prompt)”
“ตอนนี้เราเริ่มเห็นศักยภาพของ Gemini ในการใช้ความรู้เกี่ยวกับโลก การใช้เหตุผลเพื่อจำลองสภาพแวดล้อมธรรมชาติ, ความเข้าใจในกฎฟิสิกส์พื้นฐานผ่าน Veo, และความสามารถของ Gemini Robotics ในการควบคุมหุ่นยนต์ให้ทำงานตามคำสั่งและปรับตัวต่อสถานการณ์แบบเรียลไทม์”
“การทำให้ Gemini เป็น โมเดลโลก ถือเป็นก้าวสำคัญสู่การพัฒนา AI ที่ทั่วไปและมีประโยชน์ยิ่งขึ้น – หรือก็คือ ผู้ช่วย AI สากล ที่ฉลาด เข้าใจบริบท และสามารถวางแผนหรือดำเนินการแทนผู้ใช้ในทุกอุปกรณ์ได้”
นอกจากนี้ Gemini 2.5 Pro ยังมาพร้อมโหมด Deep Think ความสามารถด้านเหตุผลขั้นสูงโดยเฉพาะในการคำนวณคณิตศาสตร์และการเขียนโค้ดที่ซับซ้อน ซึ่งแม้จะใช้เวลาประมวลผลนานขึ้น แต่ให้คำตอบแม่นยำและมีโครงสร้างการคิดที่ลึกซึ้งยิ่งขึ้น
Project Astra: ตัวอย่างแรกของผู้ช่วย AI ที่เข้าใจโลกจริง
หนึ่งในไฮไลต์ของ Google I/O ปีนี้คือ Project Astra – ผู้ช่วย AI แบบเรียลไทม์ที่เข้าใจเสียง ภาพ และสถานการณ์รอบตัว ด้วยการประมวลผลแบบมัลติโมดัล สามารถมองเห็นผ่านกล้อง เข้าใจสิ่งที่เกิดขึ้น สื่อสารแบบทันที และตอบสนองอย่างชาญฉลาด
หาก Gemini เปรียบได้กับ สมอง ของ AI สากล Astra ก็คือดวงตาและหู สะท้อนวิสัยทัศน์ของผู้ช่วย AI ที่สามารถ “เห็น-ฟัง-คิด-ตอบสนอง” ได้เหมือนมนุษย์
Jules และ Mariner: Agent ที่ทำแทนคุณจริงๆ
นอกจากนี้ Google ยังเปิดเผยความคืบหน้าของ agent อื่นๆ เช่น
- Jules: AI สำหรับเขียนโค้ดแบบอัตโนมัติ (autonomous coding)
- Project Mariner: ระบบตัวแทนอัจฉริยะในเบราว์เซอร์ ที่สามารถทำงานพร้อมกันได้ถึง 10 อย่าง เช่น ค้นคว้า จองโรงแรม สั่งสินค้า – โดยไม่ต้องสลับแท็บหรือควบคุมเอง
นี่คือก้าวสำคัญที่ทำให้ AI ไม่ใช่แค่ “ช่วย” แต่เริ่ม “ทำแทน” ได้อย่างแท้จริง
การแข่งขันสู่ AGI: เดิมพันอนาคตมนุษยชาติ
การแข่งขันเพื่อสร้าง ปัญญาประดิษฐ์ทั่วไป (AGI) ไม่ใช่แค่แนวคิดในห้องแล็บอีกต่อไป แต่กลายเป็นเป้าหมายหลักของผู้นำเทคโนโลยีระดับโลก
Sam Altman ซีอีโอของ OpenAI กล่าวชัดว่า “เราเริ่ม OpenAI เพราะเชื่อว่า AGI เป็นไปได้ และอาจกลายเป็นเทคโนโลยีที่ทรงอิทธิพลที่สุดในประวัติศาสตร์มนุษย์”
หนึ่งในโครงการที่มีความทะเยอทะยานที่สุดคือ Stargate – ความร่วมมือด้านโครงสร้างพื้นฐาน AI มูลค่าสูงสุดในประวัติศาสตร์ มูลค่ารวมกว่า 500,000 ล้านดอลลาร์สหรัฐ โดยมีผู้ร่วมลงทุนคือ OpenAI, SoftBank, Oracle และ MGX จากอาบูดาบี เพื่อสร้างศูนย์ข้อมูลขั้นสูงในสหรัฐฯ
แม้ AGI ยังอยู่ห่างไกล แต่เส้นทางได้เริ่มต้นแล้ว พร้อมด้วยเงินลงทุนมหาศาล งานวิจัยที่ก้าวกระโดด และการแข่งขันที่ดุเดือด โลกกำลังเข้าสู่การเปลี่ยนผ่านทางสังคมครั้งใหญ่ ที่อาจลึกซึ้งยิ่งกว่าทุกยุคที่ผ่านมา
Demis Hassabis กล่าวทิ้งท้ายว่า “เรากำลังสร้าง AI ที่เป็นส่วนตัวมากขึ้น เชิงรุกมากขึ้น และทรงพลังมากขึ้น เพื่อเร่งการค้นพบใหม่ๆ และนำพาเราเข้าสู่ยุคทองแห่งวิทยาการ”