×

นักวิทย์ใช้ AI วิเคราะห์ภาษาวาฬสเปิร์ม พบมีความ​ซับซ้อน​ถึงระดับ​ ‘สัทอักษร’

โดย Mr.Vop
15.05.2024
  • LOADING...

ทีมนัก​วิทยาศาสตร์จากห้องปฏิบัติการ​วิทยาศาสตร์​คอมพิวเตอร์​และปัญญา​ประดิษฐ์​ (CSAIL)​ สถาบันเทคโนโลยีแมสซาชูเซตส์ (MIT)​ นำโดย Pratyusha Sharma ร่วมกับทีมนักชีววิทยา​ทางทะเล และทีมงานจากโครงการเซติ (CETI)​ ค้นพบความซับซ้อน​ของเสียง ‘คลิก’ ที่เปล่งออกมาจากวาฬสเปิร์ม ​ไม่ได้เป็นเพียงเสียงเรียกหากันธรรมดา แต่มีลักษณะ​เป็นพยัญชนะทางเสียงที่ซับซ้อน​ในระดับที่ทีมงานเรียกว่า Phonetic Alphabet หรือสัทอักษร​ของวาฬสเปิร์ม​เลยทีเดียว

 

วาฬสเปิร์ม​หรือวาฬหัวทุยครองตำแหน่ง​สัตว์​ที่มีขนาดของสมองใหญ่ที่สุด​ในโลก สามารถดำน้ำเพื่อล่าเหยื่อ​ในมหาสมุทร​ที่ลึกกว่า 2,200 เมตร ซึ่งเป็นที่ที่มืดสนิท เนื่องจากแสงแดดส่องลงไปไม่ถึง เนื้อที่ส่วนใหญ่​ของสมองวาฬสเปิร์ม​จึงมีวิวัฒนาการ​เน้นไปที่การแยกแยะรายละเอียด​ของเสียง

 

หัวของวาฬชนิดนี้มีขนาดใหญ่ถึงราว 1 ใน 3 ของขนาดลำตัว ภายในมีอวัยวะ​ที่เรียกว่า Spermaceti ทำหน้าที่สร้างเสียงคลิกที่เรียกว่า ‘โคดา’ (Coda)​ ที่อาจมีความดังได้ถึง 230 เดซิเบล​ เรียกว่าดังกว่าเสียงปล่อยจรวดสู่อวกาศ​เสียอีก แน่นอนว่าความดังของเสียงเป็นอันตราย​ต่อสัตว์น้ำชนิดอื่น รวมถึงนักประดาน้ำ​ด้วย

 

วาฬ​สเปิร์ม​เป็นสังคม​ชั้นสูง​ที่อยู่อาศัย​กันเป็นฝูง วาฬแต่ละตัวจะสนทนา​กันทั้งตอนที่พบเจอกันตามปกติ​หรือในขณะออกหาอาหาร จากการติดตามบันทึกเสียงโคดาของวาฬสเปิร์ม​จำนวน 60 ตัว ซึ่งเป็นฝูงเล็ก​ที่แยกออกมาจากฝูง​ใหญ่​ที่มีจำนวน​กว่า 400 ตัวในทะเลแคริบเบียนตะวันออก​ตั้งแต่ปี 2005-2018 แล้วนำเสียงที่ได้มาวิเคราะห์​ พบว่ามีประเภทโคดาที่ใช้สื่อสารกัน 21 กลุ่มเสียง จาก 150 กลุ่ม​เสียงที่ใช้สื่อสาร​กันในฝูงวาฬสเปิร์ม​อื่นทั่วโลก และเคยบันทึกได้จากงานวิจัย​ครั้งก่อนๆ

 

ภาพ: Nature.com

 

โชคดีที่ระบบปัญญา​ประดิษฐ์​หรือ AI ทุกวันนี้​เข้ามาช่วยงานนักวิทยาศาสตร์​ได้ค่อนข้าง​มาก ทำให้เราสามารถถอดรูป​แบบที่มีรายละเอียด​สูงของโคดาหรือเสียงคลิก​จากวาฬสเปิร์ม​ได้ง่ายขึ้น จากที่ไม่เคยทำได้มาก่อน 

 

การถอดรหัสโคดาจำนวน 8,719 ตัวอย่าง ซึ่งเกิดขึ้นทั้งในขณะที่วาฬอยู่ตัวเดียว อยู่ท่ามกลางฝูง หรือส่งเสียงโต้ตอบกันระหว่างวาฬ 2 ตัว เราพบว่าเสียงเหล่านี้มีองค์ประกอบ​ 4 ชนิด ได้แก่ Tempo, Rhythm, Rubato และ Ornamentation โดย Tempo หมายถึง​อัตราความเร็ว​โดยรวมของจังหวะตลอดทั้งโคดา Rhythm หมายถึงจังหวะในแต่ละคลิก ส่วน Rubato หมายถึงลูกเล่นที่บางทีจะเล่นสั้นหรือยาวขึ้นบ้างในบางจุด และ Ornamentation เป็นคลิกพิเศษ​ที่อยู่​นอกเหนือจากคลิกอื่นๆ ในโคดา 

 

Dr.Daniela Rus ผู้อำนวยการห้องปฏิบัติการ CSAIL หนึ่งในทีมวิจัย กล่าวถึง Ornamentation ว่า มักจะพบว่าอยู่ก่อนหรือหลังโคดา ทำหน้าที่คล้ายวลีเชื่อมประโยค (Discourse Marker)​ แต่สำหรับ Ornamentation นั้นพบได้ไม่บ่อย ซึ่งถ้าการถอดรหัสไม่ผิดพลาด Dr.Daniela Rus คิดว่ามันดูคล้ายกับการที่มนุษย์เราออกเสียงว่า ‘อืม…’ หรือ ‘เออ…’ เมื่อนึกคำพูดต่อไปไม่ทัน

 

ทั้งหมดนี้ ระบบ AI ตรวจพบ Rhythm 18 รูปแบบ, Tempo 5 รูปแบบ, Rubato 3 รูปแบบ และ Ornamentation 2 รูปแบบ สามารถนำมาผสมผสานกันได้อย่างหลากหลายวิธีจนกลายเป็นคลังเสียงขนาดมหึมา ยิ่งไปกว่านั้น ความหมายของโคดายังสามารถปรับแต่งเพิ่มเติมได้ ขึ้นอยู่กับตำแหน่งของโคดาที่ตามหลังหรือซ้อนทับโคดาอื่นๆ ทำให้ใช้งานได้ระหว่างสนทนากันราวกับเป็นภาษามนุษย์

 

แต่ทั้งหมดทั้งมวล ยังไม่มีใครเข้าใจว่าวาฬสเปิร์มสนทนาอะไรกัน ซึ่งคงต้องใช้เวลาและรอความก้าวหน้าของ AI ในอนาคต เพื่อให้มนุษย์สามารถเข้าใจภาษาวาฬสเปิร์มอย่างถ่องแท้ 

 

ทีมงาน​ตีพิมพ์​งานวิจัย​ครั้งนี้​ลงในวารสาร Nature​ https://www.nature.com/articles/s41467-024-47221-8

 

ภาพ: Alexis Rosenfeld / Getty Images

อ้างอิง: 

 


 

ข่าวที่เกี่ยวข้อง:

 

 

  • LOADING...

READ MORE





Latest Stories

Close Advertising
X