Sora โมเดล AI น้องใหม่จาก OpenAI ที่จะแปลงคำไม่กี่คำสู่คลิปวิดีโอยาว 1 นาที ที่อ้างว่าสมจริงและเหนือจินตนาการ

OpenAI ได้เปิดตัว Generative Video Model ที่ชื่อว่า Sora ซึ่งเป็น AI ที่สามารถแปลงข้อความสั้นๆ ไม่กี่คำเป็นคลิปวิดีโอความยาว 1 นาที ที่อ้างว่า ‘สมจริง’ และ ‘เหนือจินตนาการ’

บริษัทที่ตั้งอยู่ในซานฟรานซิสโกได้ผลักดันขอบเขตของสิ่งที่เป็นไปได้กับการสร้างวิดีโอจากข้อความ ซึ่งเป็นสิ่งที่ MIT Technology Review ประเมินว่าจะเป็นทิศทางการวิจัยใหม่ที่ร้อนแรงและควรจับตามองในปี 2024

ข่าวที่เกี่ยวข้อง:

“เราคิดว่าการสร้างโมเดลที่สามารถเข้าใจวิดีโอและเข้าใจการโต้ตอบที่ซับซ้อนทั้งหมดของโลกเราเป็นขั้นตอนสำคัญสำหรับระบบ AI ในอนาคตทั้งหมด” ทิม บรูกส์ นักวิทยาศาสตร์ที่ OpenAI กล่าวในบทความของ MIT Technology Review

ขณะที่ CNN Business อ้างอิงรายงานของ OpenAI ที่โพสต์บนเว็บของตัวเองว่า Sora (ซึ่งหมายถึงท้องฟ้าในภาษาญี่ปุ่น) สามารถสร้างวิดีโอได้ยาวถึง 60 วินาทีจากข้อความ โดยมีความสามารถในการนำเสนอฉากที่มีตัวละครหลายตัว การเคลื่อนไหวที่เฉพาะเจาะจง และฉากหลังที่ละเอียด

“โมเดลเข้าใจไม่เพียงแค่สิ่งที่ผู้ใช้ได้ระบุเท่านั้น แต่ยังรวมถึงวิธีการที่สิ่งเหล่านั้นมีอยู่ในโลกแห่งความจริง” OpenAI กล่าวพร้อมเสริมว่ามีเป้าหมายที่จะฝึกฝนโมเดล AI เพื่อ “ช่วยให้ผู้คนแก้ไขปัญหาที่ต้องการการโต้ตอบกับโลกแห่งความจริง”

การขยับตัวของ OpenAI ไม่ใช่เรื่องใหม่ Generative Video Model รุ่นแรกๆ ที่สามารถสร้างวิดีโอจากข้อความสั้นๆ เริ่มปรากฏขึ้นปลายปี 2022 แต่ตัวอย่างแรกๆ จาก Meta, Google และสตาร์ทอัพที่ชื่อว่า Runway นั้นมีข้อผิดพลาดและให้ภาพที่มีรายละเอียดไม่ชัดเจน

นับตั้งแต่นั้นเทคโนโลยีก็พัฒนาอย่างรวดเร็ว โมเดล Gen-2 ของ Runway ที่เปิดตัวเมื่อปีที่แล้วสามารถสร้างคลิปสั้นๆ ที่มีคุณภาพใกล้เคียงกับแอนิเมชันของสตูดิโอใหญ่ แต่ตัวอย่างส่วนใหญ่ยังมีระยะเวลาเพียงไม่กี่วินาทีเท่านั้น

OpenAI ยังอ้างว่า Sora จัดการกับการบดบังได้ดี หนึ่งปัญหากับโมเดลที่มีอยู่คือพวกเขาอาจล้มเหลวในการติดตามวัตถุเมื่อมันหายไปจากมุมมอง ตัวอย่างเช่น หากมีรถบรรทุกผ่านหน้าป้ายถนน ป้ายอาจไม่ปรากฏขึ้นหลังจากนั้น

MIT Technology Review ระบุว่า แม้วิดีโอจะน่าประทับใจ แต่การเปิดเผยออกมานั้นอาจถูกคัดเลือกมาเพื่อแสดงให้เห็น Sora ในแบบที่ดีที่สุดโดยไม่มีข้อมูลเพิ่มเติม จึงยากที่จะทราบว่าพวกเขาเป็นตัวแทนของผลลัพธ์ทั่วไปของ Sora หรือไม่

“จากมุมมองทางเทคนิคดูเหมือนจะเป็นการก้าวกระโดดที่สำคัญมาก” แซม เกรกอรี ผู้อำนวยการบริหารของ WITNESS องค์กรด้านสิทธิมนุษยชนที่เกี่ยวข้องกับการใช้เทคโนโลยีในทางที่ผิดกล่าว “แต่เหรียญมี 2 ด้าน ความสามารถดังกล่าวนำเสนอศักยภาพให้คนจำนวนมากขึ้นสามารถเป็นนักเล่าเรื่องโดยใช้วิดีโอ แต่อีกด้านก็สามารถนำไปสร้างคลิปที่ให้ข้อมูลผิดๆ เกี่ยวกับพื้นที่ความขัดแย้งหรือการประท้วง”

ณ ตอนนี้ข้อความจาก OpenAI ยังคงมุ่งเน้นไปที่ความปลอดภัย บริษัทกล่าวว่ามีแผนที่จะทำงานร่วมกับทีมผู้เชี่ยวชาญ เพื่อทดสอบโมเดลล่าสุดและตรวจสอบอย่างใกล้ชิดในหลายๆ ด้าน รวมถึงข้อมูลเท็จ การสร้างเนื้อหาที่เป็นความเกลียดชังและอคติ นอกจากนี้ยังกำลังพัฒนาเครื่องมือเพื่อช่วยตรวจจับข้อมูลที่ผิดพลาด

คนทั่วไปยังไม่สามารถใช้ Sora ได้เร็วๆ นี้ แต่เบื้องต้นจะเปิดให้ใช้งานกับนักวิชาการด้านความปลอดภัยไซเบอร์ ซึ่งสามารถประเมิน AI ในแง่อันตรายหรือความเสี่ยงได้ รวมถึงนักออกแบบและผู้สร้างภาพยนตร์ เพื่อรวบรวมข้อเสนอแนะว่ามืออาชีพด้านการสร้างสรรค์สามารถใช้งานได้อย่างไร

อ้างอิง:

FOLLOW US

Sora โมเดล AI น้องใหม่จาก OpenAI ที่จะแปลงคำไม่กี่คำสู่คลิปวิดีโอยาว 1 นาที ที่อ้างว่าสมจริงและเหนือจินตนาการ

TAGS:

ABOUT THE AUTHOR

ถนัดกิจ จันกิเสน

EDITOR'S PICK

เจาะลึกกับ กมธ. งบฯ 70: ปัญหาในงบ 1 พันล้าน ของกองทุนฟื้นฟูและพัฒนาเกษตรกร ที่ สตง. ชี้ว่า “ไม่น่าเชื่อถือ”

ทำไมญี่ปุ่นถึงกลายเป็น ‘รังสายลับต่างชาติ’ รัฐแก้ปัญหานี้อย่างไร

อาร์เจนตินากับหัวใจของแชมป์โลก ยิ่งกดดัน ยิ่งแข็งแกร่ง

สเปนทำยังไงถึงชนะฝรั่งเศส ทีมที่ดีที่สุดในฟุตบอลโลกครั้งนี้

เจาะปม ‘GROREIT’ เมื่อ ROH ไม่มาซื้อคืนโรงแรม 4,873 ล้านบาท บทพิสูจน์แรกของ ‘REIT Buy-Back’ กองแรกของไทย

MOST POPULAR

หุ้นเกาหลีใต้ร่วง 40% ใน 40 วัน บทเรียน 3,100 ล้านล้านวอน เมื่อรัฐผลิตความเสี่ยงด้วย Single-stock leveraged ETFs

MOST POPULAR

EDITOR'S PICKS

เจาะลึกกับ กมธ. งบฯ 70: ปัญหาในงบ 1 พันล้าน ของกองทุนฟื้นฟูและพัฒนาเกษตรกร ที่ สตง. ชี้ว่า “ไม่น่าเชื่อถือ”

ทำไมญี่ปุ่นถึงกลายเป็น ‘รังสายลับต่างชาติ’ รัฐแก้ปัญหานี้อย่างไร

อาร์เจนตินากับหัวใจของแชมป์โลก ยิ่งกดดัน ยิ่งแข็งแกร่ง

สเปนทำยังไงถึงชนะฝรั่งเศส ทีมที่ดีที่สุดในฟุตบอลโลกครั้งนี้

เจาะปม ‘GROREIT’ เมื่อ ROH ไม่มาซื้อคืนโรงแรม 4,873 ล้านบาท บทพิสูจน์แรกของ ‘REIT Buy-Back’ กองแรกของไทย

Latest Stories

FOLLOW US

Sora โมเดล AI น้องใหม่จาก OpenAI ที่จะแปลงคำไม่กี่คำสู่คลิปวิดีโอยาว 1 นาที ที่อ้างว่าสมจริงและเหนือจินตนาการ

สามารถติดตาม THE STANDARD WEALTHผ่านแอปพลิเคชันต่างๆ ที่คุณสะดวกหรือใช้งานอยู่แล้วได้เลย

TAGS:

ABOUT THE AUTHOR

ถนัดกิจ จันกิเสน

สามารถติดตาม THE STANDARD WEALTH
ผ่านแอปพลิเคชันต่างๆ ที่คุณสะดวกหรือใช้งานอยู่แล้วได้เลย