Menu
251976

อีกก้าวที่ยิ่งใหญ่! มนุษย์ให้กำเนิดจักรกลอัจฉริยะ ที่สามารถแก้รูบิกได้ด้วยตัวเอง

23.05.2019
  • LOADING...
Autodidactic Iteration

HIGHLIGHTS

2 Mins. Read
  • การเดินหมากรุกในแต่ละตา เราพอจะบอกได้ว่าตานั้นๆ เป็นการเดินที่ดีหรือไม่ แต่สำหรับรูบิกนั้นเราไม่สามารถบอกได้เลยว่าการหมุนแต่ละครั้งกำลังนำไปสู่ความสำเร็จในการแก้ปัญหาหรือไม่
  • นั่นเป็นเหตุผลให้จักรกล Deep-Learning ไม่สามารถแก้รูบิกเองได้มาโดยตลอด จนกระทั่งเร็วๆ นี้ ความสามารถและความเฉลียวฉลาดของมนุษย์กำลังถูกท้าทายโดยจักรกลอัจฉริยะอีกครั้ง
  • Stephen McAleer และทีมงานจาก University of California, Irvine คิดค้นเทคนิค Deep-Learning รูปแบบใหม่ ซึ่งเรียกว่า ‘Autodidactic Iteration’ ทำให้เครื่องจักรสามารถสอนตัวมันเองให้แก้รูบิกได้ โดยไม่ต้องพึ่งพาความช่วยเหลือของมนุษย์!

ทุกวันนี้ จักรกลอัจฉริยะเกิดขึ้นมากมายทั่วโลกด้วยความสามารถที่หลากหลายแตกต่างกันไป ทั้งเล่นเกมคอมพิวเตอร์ เล่นหมากรุก หมากล้อม (โกะ) หนำซ้ำหลายๆ ครั้งยังเก่งจนเอาชนะผู้เล่นที่เป็นมนุษย์ได้ด้วย แต่กับของเล่นง่ายๆ อย่างรูบิกนั้นต่างออกไป

 

การเดินหมากรุกในแต่ละตานั้น เราพอจะบอกได้ว่าตานั้นๆ เป็นการเดินที่ดีหรือไม่ แต่สำหรับรูบิกนั้นเราไม่สามารถบอกได้เลยว่าการหมุนแต่ละครั้งกำลังนำไปสู่ความสำเร็จในการแก้ปัญหาหรือไม่

 

นั่นเป็นเหตุผลให้จักรกล Deep-Learning ไม่สามารถแก้รูบิกเองได้มาโดยตลอด จนกระทั่งเร็วๆ นี้ ความสามารถและความเฉลียวฉลาดของมนุษย์กำลังถูกท้าทายโดยจักรกลอัจฉริยะอีกครั้ง เพราะตอนนี้โลกเรามีเครื่องจักรที่สามารถเรียนรู้วิธีการแก้รูบิกได้โดยปราศจากความช่วยเหลือจากมนุษย์! นับเป็นหมุดหมายครั้งสำคัญสำหรับวิทยาการคอมพิวเตอร์

 

การเล่นรูบิกให้ชนะไม่ใช่เรื่องที่ยากมากนัก (ถ้าเราจับหลักการของมันได้) แต่เรามักแข่งขันกันที่ความเร็วในการแก้รูบิก คำถามที่สำคัญที่ดึงดูดทั้งนักวิทยาการคอมพิวเตอร์และนักคณิตศาสตร์ คือจำนวนครั้งที่น้อยที่สุดในการหมุนรูบิกเพื่อให้จบเกมเป็นเท่าไร ซึ่งมีการหาคำตอบและพิสูจน์กันไปแล้วเมื่อปี ค.ศ. 2014 นั่นคืออย่างน้อย 26 ครั้ง

 

อีกหนึ่งความท้าทายคือการออกแบบขั้นตอนวิธีการแก้ปัญหารูบิกจากทุกๆ รูปแบบ ซึ่งใช้เวลาเพียงเดือนเดียวมนุษย์ก็สามารถสร้างขั้นตอนเหล่านั้นขึ้นมาได้ แต่คอมพิวเตอร์ก็ยังออกแบบขั้นตอนการหมุนรูบิกด้วยตัวเองไม่ได้

 

ไม่นานมานี้ นักวิทยาการคอมพิวเตอร์ออกแบบเครื่องจักรที่สามารถแก้รูบิกด้วยตัวเองได้

 

Stephen McAleer และทีมงานจาก University of California, Irvine คิดค้นเทคนิค Deep-Learning รูปแบบใหม่ ซึ่งเรียกว่า ‘Autodidactic Iteration’ แปลเป็นไทยคร่าวๆ คือการเรียนรู้และทบทวนแบบอัตโนมัติ กล่าวคือ เครื่องจักรสามารถสอนตัวมันเองให้แก้รูบิกได้โดยไม่ต้องพึ่งพาความช่วยเหลือของมนุษย์

 

วิธีการทำงานคือ เมื่อเครื่องจักรได้รับรูบิกที่ยังไม่ถูกแก้ มันจะต้องตัดสินเองว่า วิธีการที่มันจะหมุนต่อไปนั้นถือเป็นการก้าวไปสู่การแก้รูบิกให้สำเร็จหรือไม่ โดยระบบ Autodidactic Iteration จะเริ่มต้นจากรูบิกที่แก้สำเร็จแล้ว จากนั้นทำการย้อนกลับมาหารูปแบบใกล้เคียงจากโจทย์ตั้งต้น แม้จะไม่ใช่การหาทางแก้ที่สมบูรณ์ แต่เครื่องจักรเรียนรู้จะค่อยๆ เรียนรู้ เพื่อหาคำตอบออกมาว่าครั้งต่อไปควรจะหมุนแบบใด ผลลัพธ์ที่ออกมาถือว่าน่าทึ่งเลยทีเดียว

 

McAleer และทีมงานบอกว่า “ขั้นตอนวิธีของพวกเราสามารถแก้รูบิกทุกรูปแบบได้ 100% ซึ่งค่าเฉลี่ยของจำนวนครั้งในการหมุนอยู่ที่ 30 ครั้ง และไม่มากไปกว่าจักรกลที่ต้องใช้มนุษย์ช่วยในการแก้”

 

Autodidactic Iteration

เปรียบเทียบผัง Autodidactic Iteration กับผังแบบ MCTS ซึ่ง AlphaGoใช้

 

ความน่าสนใจของจักรกลแก้รูบิกเองได้คือ มันมีความเกี่ยวพันกับปัญหาที่ Deep-Learning ยังไม่สามารถแก้ได้หลายอย่าง เช่น เกม Sokoban (เกมที่เราต้องใช้ตัวละครผลักกล่องไปยังจุดที่กำหนดให้ครบ) และเกม Montezuma’s Revenge (เกม 8 บิต ยุค 80 บนเครื่อง Atari 2600 ที่ AlphaGo ของกูเกิลก็ยังเล่นไม่ผ่าน) รวมไปถึงปัญหาทางคณิตศาสตร์อย่างการแยกตัวประกอบที่เป็นจำนวนเฉพาะ

 

McAleer และทีมงานยังค้นพบว่า จักรกล Deep-Learning ทั่วๆ ไปนั้นใช้วิธีการจดจำขั้นตอนการแก้ปัญหาแบบตรงไปตรงมา แต่ขั้นตอนที่พวกเขาสร้างขึ้น ซึ่งมีชื่อว่า DeepCube นั้นสามารถสอนให้ตัวมันรู้ว่าจะใช้เหตุผลอย่างไรในการแก้ความซับซ้อนของปัญหา นอกจากนี้ McAleer และทีมงานยังมีเป้าหมายในการนำวิธีนี้ไปใช้กับการแก้ปัญหาอื่นๆ อีกด้วย

 

โลกอนาคตที่ปัญญาประดิษฐ์ฉลาดกว่ามนุษย์ทุกๆ ด้านอาจฟังดูเพ้อฝัน

 

แต่การพัฒนาของวิทยาการคอมพิวเตอร์ที่รวดเร็ว น่าจะทำให้เราต้องย้อนกลับมาคิดให้ดีว่า

 

“จะทำอย่างไร เราถึงจะใช้คอมพิวเตอร์ให้ทำงานให้เรา มิใช่เราคอยทำงานให้มัน”

 

ภาพประกอบ: Sradarit

พิสูจน์อักษร: ลักษณ์นารา พักตร์เพียงจันทร์

อ้างอิง:

  • LOADING...

READ MORE

FOLLOW US

MOST POPULAR