
ByteDance เปิดตัวโมเดลวิดีโอ AI Seedance 2.0 ซึ่งผู้ก่อตั้งช่องเทคโนโลยีชื่อดัง “影視颶風” Tim ได้ให้คะแนนสูงในรีวิว โดยชี้ว่ามีความก้าวหน้าครั้งสำคัญในด้านการเคลื่อนไหวกล้อง การวางแผนฉาก และเสียงภาพ อย่างไรก็ตาม Tim พบว่าโมเดลได้ทำการจับคู่เสียงของเขาโดยอัตโนมัติ โดยไม่ได้รับอนุญาต และเขาไม่เคยได้รับค่าลิขสิทธิ์ใด ๆ เลย影視颶風 กังวลว่า AI อาจสามารถสร้างตัวแทนดิจิทัลที่สมบูรณ์แบบและยากต่อการแยกแยะความจริงปลอมได้ โครงการ Slice คาดการณ์ว่าหนังจะเดินทางสองเส้นทาง คือ การสร้างประสบการณ์เสมือนจริงแบบเกมและการกลับสู่ฟังก์ชันโซเชียล
โมเดลวิดีโอ AI รุ่นล่าสุดของ ByteDance อย่าง Seedance 2.0 ได้เปิดตัวอย่างเงียบ ๆ โดยช่องเทคโนโลยีชื่อดัง “影視颶風” Tim ให้ความเห็นชื่นชมในวิดีโอใหม่ของเขา ซึ่งแตกต่างจากปัญหาเดิมที่ AI เคลื่อนไหวกล้องแข็งทื่อ Tim เชื่อว่า Seedance 2.0 สามารถจัดการกับการเคลื่อนไหวกล้องที่กว้างและราบรื่น ซึ่งเป็นความก้าวหน้าสำคัญในวงการสร้างวิดีโอ AI
เครื่องมือสร้างวิดีโอ AI ในอดีต เช่น Runway, Pika แม้จะสามารถสร้างภาพได้ แต่การเคลื่อนไหวกล้องมักดูเป็นเครื่องจักรและไม่เป็นธรรมชาติ ปัญหาที่พบได้บ่อยคือ ความเร็วในการเลื่อนกล้องเปลี่ยนแปลงอย่างกะทันหัน การสั่นไหวไม่ราบรื่น และขาดความรู้สึก “หายใจ” ของช่างภาพมืออาชีพ ข้อบกพร่องเหล่านี้ทำให้วิดีโอที่สร้างด้วย AI สามารถถูกแยกแยะได้ง่ายและไม่สามารถเทียบเท่ามาตรฐานการผลิตภาพยนตร์ระดับมืออาชีพ ความก้าวหน้าของ Seedance 2.0 อยู่ที่ความสามารถในการจำลองตรรกะการเคลื่อนไหวของช่างภาพจริง รวมถึงเส้นโค้งการเร่งและลดความเร็วที่นุ่มนวล การเปลี่ยนโฟกัสอย่างเป็นธรรมชาติ และการจัดองค์ประกอบภาพที่สวยงาม
ความสามารถในการวางแผนฉาก (storyboarding) ก็มีความเปลี่ยนแปลงอย่างปฏิวัติ Tim ชี้ให้เห็นว่า AI สามารถแสดงเจตจำนงเชิงบรรยายคล้ายผู้กำกับ สามารถเปลี่ยนมุมมองเพื่อความต่อเนื่องของเรื่องราวและรักษาความสอดคล้องของตัวละคร ในการผลิตภาพยนตร์แบบดั้งเดิม การวางแผนฉากเป็นงานหลักของผู้กำกับและผู้กำกับภาพ ซึ่งต้องพิจารณาจังหวะการเล่าเรื่อง อารมณ์ และความต่อเนื่องของภาพ Seedance 2.0 สามารถเข้าใจตรรกะการเล่าเรื่องในบทและออกแบบการเปลี่ยนกล้องอย่างอัตโนมัติ ซึ่งหมายความว่า AI ได้พัฒนาจากเครื่องมือสร้างภาพธรรมดา ไปเป็นผู้ช่วยสร้างสรรค์ที่มีความคิดแบบผู้กำกับแล้ว
ความก้าวหน้าด้านความสอดคล้องของเสียงและภาพก็ไม่น้อยหน้า Seedance 2.0 สามารถสร้างเสียงพูดและเสียงรอบข้างแบบผสมผสานได้ในคลิกเดียว ซึ่งช่วยลดเวลาการทำงานด้านเสียงอย่างมาก ในงานหลังการผลิตแบบดั้งเดิม การออกแบบเสียงเป็นงานที่ซับซ้อนและใช้เวลานาน วิฉากหนึ่งความยาวสองนาที นักออกแบบเสียงมืออาชีพอาจใช้เวลาหลายวันในการทำความสะอาดเสียง พิสูจน์เสียง สร้างเสียงประกอบ และปรับแต่งเสียงผสมกัน Seedance 2.0 สามารถทำให้กระบวนการนี้เสร็จสิ้นภายในไม่กี่นาที เพิ่มประสิทธิภาพขึ้นกว่าหลายพันเท่า
การเคลื่อนไหวกล้องราบรื่น: จำลองเส้นโค้งการเร่งและลดความเร็ว รวมถึงตรรกะการจัดองค์ประกอบภาพของช่างภาพจริง
ฉากระดับผู้กำกับ: เข้าใจตรรกะการเล่าเรื่อง ออกแบบการเปลี่ยนกล้องอัตโนมัติ รักษาความสอดคล้องของตัวละคร
เสียงในคลิกเดียว: สร้างเสียงพูดและเสียงรอบข้างอัตโนมัติ ช่วยลดขั้นตอนการทำงานในภายหลัง
จากมุมมองทางเทคนิค ความก้าวหน้าเหล่านี้อาจเกิดจากข้อมูลการฝึกที่มีขนาดใหญ่ขึ้นและโมเดลลำดับเวลาที่ล้ำหน้าขึ้น Seedance 2.0 อาจใช้โครงสร้าง Transformer ผสมผสานกับโมเดลการแพร่กระจาย (diffusion) และ GAN (Generative Adversarial Networks) และฝึกบนผลงานภาพยนตร์ระดับมืออาชีพจำนวนมาก ข้อมูลวิดีโอสั้นจำนวนมากจาก Douyin และ TikTok ซึ่งเป็นฐานข้อมูลวิดีโอสั้นที่ใหญ่ที่สุดในโลก เป็นทรัพยากรการฝึกที่ไม่อาจเทียบได้สำหรับ Seedance 2.0
แม้ว่าเทคโนโลยี Seedance 2.0 จะมีความแข็งแกร่ง แต่影視颶風 ก็เปิดเผยความกังวลในระหว่างการทดสอบ Tim พบว่า แม้จะอัปโหลดเพียงภาพถ่ายของตัวเองโดยไม่ให้ไฟล์เสียง โมเดลก็สามารถระบุได้ว่าเป็นเขาและจับคู่เสียงของเขาโดยอัตโนมัติ ยิ่งไปกว่านั้น หลังจากอัปโหลดภาพด้านหน้าของอาคารสำนักงานใหญ่影視颶風 ก็สามารถคำนวณรายละเอียดด้านหลังอาคารในมุมกล้องที่มองไม่เห็นได้อย่างแม่นยำ
Tim ระบุว่า เขาไม่เคยได้รับค่าลิขสิทธิ์จาก ByteDance และไม่ได้รับการติดต่อใด ๆ ซึ่งแสดงให้เห็นว่า Seedance 2.0 อาจใช้ข้อมูลภาพและเสียงของผู้สร้างภาพยนตร์จำนวนมากโดยไม่ได้แจ้งให้ทราบล่วงหน้า การดำเนินการเช่นนี้ก่อให้เกิดข้อพิพาทด้านลิขสิทธิ์อย่างรุนแรง ในเขตอำนาจศาลส่วนใหญ่ สิทธิส่วนบุคคลในภาพและเสียงได้รับการคุ้มครองตามกฎหมาย การใช้ข้อมูลเสียงและภาพของผู้อื่นเพื่อการฝึกอบรมเชิงพาณิชย์โดยไม่ได้รับอนุญาตอาจเป็นการละเมิดลิขสิทธิ์
Tim กังวลว่า หาก AI สามารถเข้าถึงข้อมูลเสียงและภาพของบุคคลอย่างสมบูรณ์ ก็จะสามารถสร้างตัวแทนดิจิทัลที่สมบูรณ์แบบและยากต่อการแยกแยะความจริงปลอมได้ เมื่อถึงจุดนั้น แม้แต่คนในครอบครัวก็อาจแยกแยะไม่ออก ซึ่งจะก่อให้เกิดข้อพิพาทด้านลิขสิทธิ์และจริยธรรมอย่างรุนแรง ความกังวลนี้ไม่ใช่เรื่องไร้สาระ ยิ่งเทคโนโลยี Deepfake พัฒนาขึ้น ก็มีกรณีการใช้ AI สร้างวิดีโอคนดังเพื่อการหลอกลวงเกิดขึ้นหลายครั้ง หาก Seedance 2.0 ถูกใช้อย่างผิดวัตถุประสงค์ อาจนำไปสู่การโจรกรรมตัวตน การสร้างข่าวปลอม และการฉ้อโกงทางการเงินในระดับรุนแรง
ปัญหาจริยธรรมที่ลึกซึ้งกว่านั้นคือ ความโปร่งใสของข้อมูลการฝึกอบรม ByteDance ไม่เคยเปิดเผยแหล่งข้อมูลการฝึกของ Seedance 2.0 หากโมเดลใช้เนื้อหาจากผู้สร้างวิดีโอจำนวนมาก ผู้สร้างเหล่านั้นทราบหรือไม่? เห็นด้วยหรือไม่? ควรได้รับค่าตอบแทนหรือไม่? คำถามเหล่านี้ยังไม่มีกรอบกฎหมายที่ชัดเจนในระดับโลก กฎหมาย AI ของสหภาพยุโรปและข้อเสนอหลายฉบับของสหรัฐฯ กำลังพยายามสร้างแนวทาง แต่ความเข้มงวดและผลลัพธ์จริงยังคงต้องติดตาม
ในเชิงอุตสาหกรรม หาก Seedance 2.0 สามารถคัดลอกสไตล์ เสียง และรูปลักษณ์ของผู้สร้างใด ๆ โดยไม่ได้รับอนุญาต มูลค่าของเนื้อหาจะพังทลายลงอย่างสิ้นเชิง นักสร้างสรรค์ที่ใช้เวลาหลายปีสร้างแบรนด์และสไตล์เฉพาะตัว อาจถูก AI ลอกเลียนแบบสมบูรณ์ภายในไม่กี่นาที นี่ไม่ใช่แค่ความเสียหายทางเศรษฐกิจ แต่เป็นการคุกคามต่อความเป็นตัวตนของผู้สร้างอย่างรุนแรง
Tim เชื่อว่า แม้ Seedance 2.0 ยังไม่สมบูรณ์แบบ แต่เวอร์ชันถัดไปอาจเปลี่ยนแปลงอุตสาหกรรมอย่างสิ้นเชิง เมื่อก่อนทีมเอฟเฟกต์ต้องใช้เวลาหลายร้อยชั่วโมงในการสร้างฉาก ตอนนี้ AI ทำได้ในไม่กี่นาที ซึ่งทำให้ทักษะมืออาชีพเสื่อมค่ารวดเร็ว เมื่อแรงงานและประสิทธิภาพการผลิตไม่สามารถแข่งขันกับ AI ได้ Tim ตั้งคำถามในตอนจบของวิดีโอว่า: เทคโนโลยี AI กำลังทำลายกำแพงป้องกันของการผลิตภาพยนตร์แบบดั้งเดิม แต่สิ่งนี้ดีหรือไม่ดีสำหรับมนุษย์?
影視颶風 ในวิดีโอ “AI สามารถแทนที่ฉันได้ แล้วความหมายของฉันคืออะไร?” สรุปว่า “ประสบการณ์” คือสิ่งสำคัญ ประสบการณ์สร้างจิตวิญญาณที่เป็นเอกลักษณ์ของแต่ละคน เมื่อคุณเห็นผมขาวของแม่ เมื่อคุณเดินเข้าไปในโรงเรียนเก่า กลิ่นในห้องเรียน ในช่วงเวลานั้น AI อาจมองไม่เห็นคุณ ความเร็วของรถไอน้ำอาจช้าและโง่เขลาสำหรับ AI แต่สำหรับมนุษย์ มันเต็มไปด้วยความทรงจำของการจากลาและความหวังที่จะได้พบกันอีกครั้ง
นักวิจารณ์ภาพยนตร์ชื่อดัง “切片計畫” ซึ่งมีผู้ติดตามเกือบ 2 ล้านคนบน Bilibili เชื่อว่า AI อาจมีข้อมูลไม่จำกัด แต่เฉพาะมนุษย์เท่านั้นที่มีร่างกายที่เปราะบางและไม่สมบูรณ์ แต่ก็เป็นสิ่งที่ทำให้มันจริงแท้ เธอชี้ให้เห็นว่า คนในยุคปัจจุบันเติบโตในโลกภาพ เสียเวลาไปกับการเรียนรู้การแสดงออกก่อนที่จะได้ใช้ชีวิต เรียนรู้ความสับสนและการสูญเสีย ซึ่งทำให้หลายผลงานสร้างจากรูปแบบเป็นหลักและสร้างความหมายจากโครงสร้างมากกว่าจริง ๆ ทำให้ภาพเหล่านี้ดูเหมือนการเลียนแบบความฝัน มากกว่าความฝันเอง
เส้นทางที่หนึ่ง: การสร้างแบบเกมและประสบการณ์เสมือนจริงสูงสุด: การเล่าเรื่องแบบโต้ตอบที่ AI ขับเคลื่อน ผู้ชมกลายเป็นผู้ร่วมสร้างเรื่องราว ทุกครั้งที่ชมจะมีตอนจบที่แตกต่างกัน
เส้นทางที่สอง: การกลับสู่ความเรียบง่ายของฟังก์ชันโซเชียล: การย้อนกลับไปสู่แก่นแท้ของการสื่อสารแบบเก่า ให้ผู้คนรวมตัวกันหน้าจอเพื่อรับรู้โลกอีกครั้ง เหมือนบรรพบุรุษนั่งล้อมกองไฟเล่าเรื่องและแบ่งปันความหวัง
ผู้กำกับภาพยนตร์ชื่อดัง ลีอัน (李安) เคยกล่าวไว้ว่า: “ผมไม่กลัวว่า AI จะมาแทนที่เรา แต่ผมกลัวว่าเราจะกลายเป็น AI ไปเอง” คำพูดนี้สะท้อนความกังวลลึกซึ้ง ยิ่งเทคโนโลยีก้าวหน้า ก็ยิ่งเสี่ยงที่มนุษย์จะสูญเสียความสามารถในการคิดอย่างอิสระและรู้สึกอย่างแท้จริง การสร้างสรรค์กลายเป็นเพียงการลอกเลียนเนื้อหาที่ AI สร้างขึ้น
คำพูดของ สตีฟ จ็อบส์ (Steve Jobs) ผู้ก่อตั้งแอปเปิล อาจเป็นแนวทางอีกด้านหนึ่ง หลังจากภาพยนตร์แอนิเมชันคอมพิวเตอร์เรื่องแรก “Toy Story” ออกฉายเมื่อปี 1995 จ็อบส์กล่าวว่า: “เทคโนโลยีทั้งหมดถูกสร้างขึ้นเพื่อสนับสนุนเรื่องราว เพื่อให้คนที่มีความคิดสร้างสรรค์ใช้ประโยชน์ ผมเชื่อว่าในอนาคต คนจะยังดู ‘Toy Story’ อีก 60 ปี แต่ไม่ใช่เพราะเทคนิคพิเศษของคอมพิวเตอร์ แต่เพราะเรื่องราวเกี่ยวกับมิตรภาพ” คำพูดนี้ยังคงใช้ได้ในวันนี้ 30 ปีต่อมา Seedance 2.0 แม้จะเก่งกาจเพียงใด ก็เป็นเพียงเครื่องมือ สุดท้ายแล้ว สิ่งที่สร้างความประทับใจให้คนคือเรื่องราวเอง