วานนี้ (20 ตุลาคม) บริษัท Amazon Web Services (AWS) ผู้ให้บริการคลาวด์รายใหญ่ที่สุดในโลก ประสบปัญหาระบบล่มครั้งใหญ่ ส่งผลให้เว็บไซต์และบริการออนไลน์ ชื่อดัง ทั่วโลกไม่สามารถใช้งานได้ชั่วคราว รวมถึงเว็บไซต์ของ Amazon เอง บริการ Alexa และระบบภายในของบริษัท
เหตุขัดข้องเริ่มขึ้นเมื่อเวลา 03:11 น. (ET) ในศูนย์ข้อมูลหลักของ AWS ที่รัฐเวอร์จิเนีย โดยทีมงาน AWS รายงานว่าปัญหานี้เกิดจากความบกพร่องของระบบ DNS (Domain Name System) ซึ่งเป็นระบบแปลงชื่อเว็บไซต์ให้เป็นหมายเลข IP ที่เบราว์เซอร์ใช้ในการเข้าถึง ข้อมูล ระบบ DNS ดังกล่าวเกี่ยวข้องกับบริการฐานข้อมูลหลักของ AWS ที่ชื่อว่า DynamoDB ซึ่งเป็นรากฐานของแอปพลิเคชันและบริการนับพันที่รันอยู่บนโครงสร้างพื้นฐานของ AWS
AWS ระบุในแถลงการณ์ช่วงเช้าตรู่ว่า ปัญหานี้เป็นความผิดปกติทางเทคนิคที่ส่งผลกระทบ ต่อบริการจำนวนมากกว่า 70 รายการ และทีมงานกำลังดำเนินการแก้ไขหลายแนวทาง พร้อมกันเพื่อเร่งการฟื้นฟูระบบ
รายงานจาก Downdetector แสดงให้เห็นว่าบริการออนไลน์จำนวนมากได้รับผลกระทบ เช่น Disney+, Lyft, แอปของ McDonald’s, The New York Times, Reddit, Robinhood, Snapchat, Ring, United Airlines, T-Mobile, Venmo รวมถึงเว็บไซต์ภาครัฐของอังกฤษอย่าง Gov.uk และ HM Revenue and Customs
เหตุขัดข้องนี้ไม่ได้ส่งผลเฉพาะต่อลูกค้า AWS เท่านั้น แต่ยังรวมถึงระบบภายในของ Amazon เองด้วย พนักงานคลังสินค้าและคนขับในบริการ Amazon Flex รายงานผ่าน Reddit ว่าระบบภายในหลายแห่งล่ม ทำให้ไม่สามารถเข้าถึงแอป Anytime Pay ได้ ซึ่งเป็นแอปที่ใช้เบิกเงินค่าจ้างล่วงหน้าได้ทันที บางคลังสินค้าถึงขั้นต้องให้พนักงาน รอในห้องพักหรือพื้นที่โหลดของ เนื่องจากระบบขนส่งหยุดทำงานชั่วคราว
แพลตฟอร์ม Seller Central ซึ่งใช้โดยผู้ขายบุคคลที่สามใน Amazon ก็ถูกปิดการใช้งาน ไปด้วย นอกจากนี้ Reddit ระบุว่ากำลังเร่งฟื้นฟูระบบให้กลับมาทำงานได้ 100% เช่นเดียวกับสายการบิน United และ Delta Air Lines ที่มีผู้โดยสารบางส่วนโพสต์ว่า พวกเขาไม่สามารถเช็กอินหรือดูข้อมูลการจองได้
บริษัท T-Mobile ออกแถลงการณ์ว่าลูกค้าบางรายอาจพบปัญหา เมื่อพยายามเข้าใช้ เว็บไซต์อื่นๆ ที่พึ่งพา AWS แต่ยืนยันว่าเครือข่ายของตนไม่ได้ล่มหรือหยุดให้บริการ
แพลตฟอร์มการเรียนออนไลน์ Canvas, เกมออนไลน์อย่าง Roblox และ Fortnite, รวมถึงแพลตฟอร์มคริปโต Coinbase ต่างก็ได้รับผลกระทบเช่นกัน
ขณะที่เครื่องมือออกแบบชื่อดัง Canva กล่าวว่า กำลังประสบกับอัตราความผิดพลาด ที่สูงขึ้นอย่างมาก เนื่องจากปัญหาหลักเกิดจากผู้ให้บริการคลาวด์ของเรา (AWS) เครื่องมือค้นหา AI รุ่นใหม่อย่าง Perplexity ก็ไม่รอดเช่นกัน โดย CEO Aravind Srinivas ยืนยันว่า “สาเหตุมาจากปัญหาภายในของ AWS และทีมงานกำลังเร่งแก้ไข”
ปัจจุบัน AWS ครองส่วนแบ่งตลาดคลาวด์ทั่วโลกประมาณ 1 ใน 3 ซึ่งมากกว่า Microsoft และ Google ตามข้อมูลจาก Synergy Research Group ทั้ง 3 บริษัทยักษ์ใหญ่นี้กำลังแข่งขัน กันดึงดูดลูกค้าองค์กรขนาดใหญ่
ก่อนหน้านี้ หลังเหตุขัดข้องของ Microsoft 365 เมื่อต้นเดือนที่ผ่านมา Google ได้ใช้โอกาส โปรโมตบริการ Google Workspace พร้อมประกาศว่า
“แค่ Microsoft 365 ล่ม ไม่ได้หมายความว่าทีมของคุณต้องกลับไป ใช้ปากกาและกระดาษอีกครั้ง”
ผู้เชี่ยวชาญด้านความปลอดภัยไซเบอร์ Rob Jardin จากบริษัท NymVPN กล่าวว่า สาเหตุของเหตุการณ์นี้ไม่น่าจะมาจากการโจมตีไซเบอร์ แต่เป็นปัญหาทางเทคนิค ในศูนย์ข้อมูลหลักของ Amazon ซึ่งอาจเกิดขึ้นได้เมื่อระบบมีการใช้งานเกินขีดจำกัด หรือมีส่วนประกอบหลักบางส่วนหยุดทำงาน
จากเหตุการณ์ระบบคลาวด์ล่มครั้งนี้ นักวิเคราะห์มองว่า เหตุการณ์นี้เป็นเครื่องเตือนใจ อีกครั้งว่า ยิ่งโลกทั้งใบพึ่งพาผู้ให้บริการคลาวด์เพียงไม่กี่ราย ได้แก่ Amazon, Microsoft และ Google มากเพียงใด เมื่อยักษ์คลาวด์เหล่านี้ ‘จาม’ ขึ้นมา อินเทอร์เน็ตทั้งโลกก็ ‘เป็นหวัด’ ทันที
ภาพ: Photo For Everything / Shutterstock
อ้างอิง: