×

Sora โมเดล AI น้องใหม่จาก OpenAI ที่จะแปลงคำไม่กี่คำสู่คลิปวิดีโอยาว 1 นาที ที่อ้างว่าสมจริงและเหนือจินตนาการ

16.02.2024
  • LOADING...

OpenAI ได้เปิดตัว Generative Video Model ที่ชื่อว่า Sora ซึ่งเป็น AI ที่สามารถแปลงข้อความสั้นๆ ไม่กี่คำเป็นคลิปวิดีโอความยาว 1 นาที ที่อ้างว่า ‘สมจริง’ และ ‘เหนือจินตนาการ’

 

บริษัทที่ตั้งอยู่ในซานฟรานซิสโกได้ผลักดันขอบเขตของสิ่งที่เป็นไปได้กับการสร้างวิดีโอจากข้อความ ซึ่งเป็นสิ่งที่ MIT Technology Review ประเมินว่าจะเป็นทิศทางการวิจัยใหม่ที่ร้อนแรงและควรจับตามองในปี 2024

 


ข่าวที่เกี่ยวข้อง: 


 

“เราคิดว่าการสร้างโมเดลที่สามารถเข้าใจวิดีโอและเข้าใจการโต้ตอบที่ซับซ้อนทั้งหมดของโลกเราเป็นขั้นตอนสำคัญสำหรับระบบ AI ในอนาคตทั้งหมด” ทิม บรูกส์ นักวิทยาศาสตร์ที่ OpenAI กล่าวในบทความของ MIT Technology Review

 

ขณะที่ CNN Business อ้างอิงรายงานของ OpenAI ที่โพสต์บนเว็บของตัวเองว่า Sora (ซึ่งหมายถึงท้องฟ้าในภาษาญี่ปุ่น) สามารถสร้างวิดีโอได้ยาวถึง 60 วินาทีจากข้อความ โดยมีความสามารถในการนำเสนอฉากที่มีตัวละครหลายตัว การเคลื่อนไหวที่เฉพาะเจาะจง และฉากหลังที่ละเอียด

 

“โมเดลเข้าใจไม่เพียงแค่สิ่งที่ผู้ใช้ได้ระบุเท่านั้น แต่ยังรวมถึงวิธีการที่สิ่งเหล่านั้นมีอยู่ในโลกแห่งความจริง” OpenAI กล่าวพร้อมเสริมว่ามีเป้าหมายที่จะฝึกฝนโมเดล AI เพื่อ “ช่วยให้ผู้คนแก้ไขปัญหาที่ต้องการการโต้ตอบกับโลกแห่งความจริง”

 

การขยับตัวของ OpenAI ไม่ใช่เรื่องใหม่ Generative Video Model รุ่นแรกๆ ที่สามารถสร้างวิดีโอจากข้อความสั้นๆ เริ่มปรากฏขึ้นปลายปี 2022 แต่ตัวอย่างแรกๆ จาก Meta, Google และสตาร์ทอัพที่ชื่อว่า Runway นั้นมีข้อผิดพลาดและให้ภาพที่มีรายละเอียดไม่ชัดเจน

 

นับตั้งแต่นั้นเทคโนโลยีก็พัฒนาอย่างรวดเร็ว โมเดล Gen-2 ของ Runway ที่เปิดตัวเมื่อปีที่แล้วสามารถสร้างคลิปสั้นๆ ที่มีคุณภาพใกล้เคียงกับแอนิเมชันของสตูดิโอใหญ่ แต่ตัวอย่างส่วนใหญ่ยังมีระยะเวลาเพียงไม่กี่วินาทีเท่านั้น

 

OpenAI ยังอ้างว่า Sora จัดการกับการบดบังได้ดี หนึ่งปัญหากับโมเดลที่มีอยู่คือพวกเขาอาจล้มเหลวในการติดตามวัตถุเมื่อมันหายไปจากมุมมอง ตัวอย่างเช่น หากมีรถบรรทุกผ่านหน้าป้ายถนน ป้ายอาจไม่ปรากฏขึ้นหลังจากนั้น

 

MIT Technology Review ระบุว่า แม้วิดีโอจะน่าประทับใจ แต่การเปิดเผยออกมานั้นอาจถูกคัดเลือกมาเพื่อแสดงให้เห็น Sora ในแบบที่ดีที่สุดโดยไม่มีข้อมูลเพิ่มเติม จึงยากที่จะทราบว่าพวกเขาเป็นตัวแทนของผลลัพธ์ทั่วไปของ Sora หรือไม่

 

“จากมุมมองทางเทคนิคดูเหมือนจะเป็นการก้าวกระโดดที่สำคัญมาก” แซม เกรกอรี ผู้อำนวยการบริหารของ WITNESS องค์กรด้านสิทธิมนุษยชนที่เกี่ยวข้องกับการใช้เทคโนโลยีในทางที่ผิดกล่าว “แต่เหรียญมี 2 ด้าน ความสามารถดังกล่าวนำเสนอศักยภาพให้คนจำนวนมากขึ้นสามารถเป็นนักเล่าเรื่องโดยใช้วิดีโอ แต่อีกด้านก็สามารถนำไปสร้างคลิปที่ให้ข้อมูลผิดๆ เกี่ยวกับพื้นที่ความขัดแย้งหรือการประท้วง”

 

ณ ตอนนี้ข้อความจาก OpenAI ยังคงมุ่งเน้นไปที่ความปลอดภัย บริษัทกล่าวว่ามีแผนที่จะทำงานร่วมกับทีมผู้เชี่ยวชาญ เพื่อทดสอบโมเดลล่าสุดและตรวจสอบอย่างใกล้ชิดในหลายๆ ด้าน รวมถึงข้อมูลเท็จ การสร้างเนื้อหาที่เป็นความเกลียดชังและอคติ นอกจากนี้ยังกำลังพัฒนาเครื่องมือเพื่อช่วยตรวจจับข้อมูลที่ผิดพลาด

 

คนทั่วไปยังไม่สามารถใช้ Sora ได้เร็วๆ นี้ แต่เบื้องต้นจะเปิดให้ใช้งานกับนักวิชาการด้านความปลอดภัยไซเบอร์ ซึ่งสามารถประเมิน AI ในแง่อันตรายหรือความเสี่ยงได้ รวมถึงนักออกแบบและผู้สร้างภาพยนตร์ เพื่อรวบรวมข้อเสนอแนะว่ามืออาชีพด้านการสร้างสรรค์สามารถใช้งานได้อย่างไร

 

อ้างอิง:

  • LOADING...

READ MORE





Latest Stories

Close Advertising
X