ในขณะที่ OpenAI ChatGPT กำลังดูดออกซิเจนทั้งหมดออกจากวงจรข่าว 24 ชั่วโมง Google ได้เปิดตัวโมเดล AI ใหม่ที่สามารถสร้างวิดีโอเมื่อได้รับวิดีโอ รูปภาพ และข้อความ โปรแกรมตัดต่อวิดีโอ Google Dreamix AI ใหม่ทำให้วิดีโอที่สร้างขึ้นมีความใกล้เคียงกับความเป็นจริงมากขึ้น
จากการวิจัยที่เผยแพร่บน GitHub นั้น Dreamix แก้ไขวิดีโอตามวิดีโอและข้อความแจ้ง วิดีโอที่ได้จะรักษาความเที่ยงตรงของสี ท่าทาง ขนาดวัตถุ และท่าทางของกล้อง ทำให้ได้วิดีโอที่สอดคล้องกันชั่วคราว ในขณะนี้ Dreamix ไม่สามารถสร้างวิดีโอจากข้อความแจ้งได้ อย่างไรก็ตาม สามารถใช้เนื้อหาที่มีอยู่แล้วแก้ไขวิดีโอโดยใช้ข้อความแจ้ง
Google ใช้โมเดลการแพร่กระจายวิดีโอสำหรับ Dreamix ซึ่งเป็นแนวทางที่ประสบความสำเร็จในการตัดต่อภาพวิดีโอส่วนใหญ่ที่เราเห็นในภาพ AI เช่น DALL-E2 หรือ Stable Diffusion แบบโอเพนซอร์ส
แนวทางนี้เกี่ยวข้องกับการลดวิดีโออินพุตลงอย่างมาก เพิ่มสัญญาณรบกวน แล้วประมวลผลในรูปแบบการแพร่กระจายวิดีโอ ซึ่งจากนั้นจะใช้ข้อความแจ้งเพื่อสร้างวิดีโอใหม่จากวิดีโอนั้น โดยยังคงคุณสมบัติบางอย่างของวิดีโอต้นฉบับไว้และแสดงผลอื่นๆ ซ้ำตาม เพื่อป้อนข้อความ
โมเดลการแพร่กระจายวิดีโอนำเสนออนาคตที่สดใสซึ่งอาจนำไปสู่ยุคใหม่ในการทำงานกับวิดีโอ
ตัวอย่างเช่น ในวิดีโอด้านล่าง Dreamix เปลี่ยนลิงที่กำลังกินอยู่ (ซ้าย) ให้เป็นหมีเต้นรำ (ขวา) เมื่อได้รับคำสั่ง “หมีเต้นและกระโดดไปตามจังหวะดนตรี เคลื่อนไหวร่างกายของมัน”
ในอีกตัวอย่างหนึ่งด้านล่าง Dreamix ใช้ภาพถ่ายเดียวเป็นแม่แบบ (เช่นเดียวกับภาพต่อวิดีโอ) จากนั้นวัตถุจะเคลื่อนไหวจากภาพนั้นในวิดีโอผ่านข้อความแจ้ง การเคลื่อนไหวของกล้องยังเป็นไปได้ในฉากใหม่หรือการบันทึกแบบเหลื่อมเวลาในภายหลัง
ในอีกตัวอย่างหนึ่ง Dreamix เปลี่ยนลิงอุรังอุตังในสระน้ำ (ซ้าย) ให้เป็นลิงอุรังอุตังขนสีส้มอาบน้ำในห้องน้ำที่สวยงาม
“แม้ว่าโมเดลการแพร่กระจายจะประสบความสำเร็จในการแก้ไขภาพ แต่ก็มีงานน้อยมากสำหรับการตัดต่อวิดีโอ เรานำเสนอวิธีการแบบกระจายตัวแบบแรกที่สามารถทำการเคลื่อนไหวตามข้อความและการแก้ไขลักษณะที่ปรากฏของวิดีโอทั่วไป”
จากรายงานการวิจัยของ Google Dreamix ใช้โมเดลการแพร่กระจายวิดีโอเพื่อรวมข้อมูลเชิงพื้นที่เชิงพื้นที่ที่มีความละเอียดต่ำจากวิดีโอต้นฉบับเข้ากับข้อมูลความละเอียดสูงใหม่ที่สังเคราะห์ขึ้นเพื่อให้สอดคล้องกับข้อความแนะนำ”
Google กล่าวว่าใช้แนวทางนี้เพราะ “การได้รับวิดีโอต้นฉบับที่มีความเที่ยงตรงสูงนั้นจำเป็นต้องรักษาข้อมูลที่มีความละเอียดสูงไว้บางส่วน เราจึงเพิ่มขั้นตอนเบื้องต้นในการปรับแต่งโมเดลในวิดีโอต้นฉบับอย่างละเอียด ซึ่งจะเพิ่มความเที่ยงตรงได้อย่างมาก”
ด้านล่างนี้เป็นภาพรวมวิดีโอเกี่ยวกับวิธีการทำงานของ Dreamix
[เนื้อหาฝัง]
โมเดลการแพร่กระจายวิดีโอของ Dreamix ทำงานอย่างไร
จากข้อมูลของ Google การปรับรูปแบบการกระจายวิดีโออย่างละเอียดสำหรับ Dreamix บนวิดีโออินพุตเพียงอย่างเดียวจะจำกัดขอบเขตของการเปลี่ยนแปลงการเคลื่อนไหว เราใช้วัตถุประสงค์แบบผสมที่นอกเหนือจากวัตถุประสงค์ดั้งเดิม (ซ้ายล่าง) แล้ว ยังปรับแต่งชุดของเฟรมที่ไม่ได้เรียงลำดับอีกด้วย สิ่งนี้ทำได้โดยใช้ "การใส่ใจชั่วขณะโดยสวมหน้ากาก" ป้องกันไม่ให้ปรับความสนใจชั่วขณะและการโน้มน้าวใจ (ด้านล่างขวา) สิ่งนี้ทำให้สามารถเพิ่มการเคลื่อนไหวให้กับวิดีโอแบบคงที่ได้
“วิธีการของเรารองรับแอพพลิเคชั่นหลายตัวโดยการประมวลผลล่วงหน้าที่ขึ้นกับแอพพลิเคชั่น (ซ้าย) แปลงเนื้อหาอินพุตเป็นรูปแบบวิดีโอที่เหมือนกัน สำหรับภาพต่อวิดีโอ ภาพอินพุตจะถูกทำซ้ำและแปลงโดยใช้การแปลงเปอร์สเปคทีฟ สังเคราะห์วิดีโอหยาบด้วยการเคลื่อนไหวของกล้อง สำหรับการสร้างวิดีโอตามหัวข้อ จะละเว้นอินพุต – การปรับแต่งเพียงอย่างเดียวจะดูแลความเที่ยงตรง วิดีโอหยาบนี้ได้รับการแก้ไขโดยใช้ "Dreamix Video Editor" ทั่วไปของเรา (ขวา): อันดับแรก เราทำให้วิดีโอเสียหายโดยสุ่มตัวอย่างตามด้วยการเพิ่มสัญญาณรบกวน จากนั้นเราจะใช้โมเดลการแพร่กระจายวิดีโอแบบข้อความนำทางที่ปรับแต่งแล้ว ซึ่งจะยกระดับวิดีโอให้มีความละเอียดเชิงพื้นที่ชั่วคราวขั้นสุดท้าย” Dream เขียนไว้ GitHub.
คุณสามารถอ่านเอกสารการวิจัยด้านล่าง
Google ดรีมมิกซ์- เนื้อหาที่ขับเคลื่อนด้วย SEO และการเผยแพร่ประชาสัมพันธ์ รับการขยายวันนี้
- เพลโตบล็อคเชน Web3 Metaverse ข่าวกรอง ขยายความรู้. เข้าถึงได้ที่นี่.
- ที่มา: https://techstartups.com/2023/02/10/google-launches-ai-powered-video-editor-dreamix-to-create-edit-videos-and-animate-images/
- a
- สามารถ
- ตาม
- AI
- วิดีโอ ai
- ขับเคลื่อนด้วย AI
- ทั้งหมด
- ช่วยให้
- คนเดียว
- และ
- อื่น
- การใช้งาน
- ประยุกต์
- ใช้
- เข้าใกล้
- เทียม
- ความสนใจ
- ตาม
- หมี
- สวยงาม
- เพราะ
- กำลัง
- ด้านล่าง
- ร่างกาย
- การส่งเสริม
- ด้านล่าง
- นำ
- ห้อง
- ไม่ได้
- ซึ่ง
- เปลี่ยนแปลง
- ChatGPT
- ใกล้ชิด
- สี
- รวมกัน
- คงเส้นคงวา
- เนื้อหา
- การสร้าง
- วงจร
- การเต้นรำ
- การจัดจำหน่าย
- ฝัน
- บรรณาธิการ
- ที่ฝัง
- ยุค
- ตัวอย่าง
- ที่มีอยู่
- สองสาม
- ความจงรักภักดี
- สุดท้าย
- ชื่อจริง
- ตาม
- รูป
- ราคาเริ่มต้นที่
- อนาคต
- General
- สร้าง
- สร้าง
- รุ่น
- GIF
- GitHub
- กำหนด
- ผม
- หนัก
- ความละเอียดสูง
- สรุป ความน่าเชื่อถือของ Olymp Trade?
- อย่างไรก็ตาม
- HTTPS
- ภาพ
- ภาพ
- in
- ข้อมูล
- อินพุต
- แทน
- IT
- การเปิดตัว
- ขีด จำกัด
- รักษา
- วัสดุ
- แม็กซ์
- วิธี
- ผสม
- แบบ
- โมเดล
- แก้ไข
- ขณะ
- มากที่สุด
- การเคลื่อนไหว
- การเคลื่อนไหว
- การย้าย
- หลาย
- ดนตรี
- ใหม่
- ข่าว
- สัญญาณรบกวน
- วัตถุ
- วัตถุประสงค์
- เสนอ
- โอเพนซอร์ส
- OpenAI
- ส้ม
- เป็นต้นฉบับ
- ผลิตภัณฑ์อื่นๆ
- ภาพรวม
- ออกซิเจน
- กระดาษ
- รูปแบบไฟล์ PDF
- ดำเนินการ
- มุมมอง
- เพลโต
- เพลโตดาต้าอินเทลลิเจนซ์
- เพลโตดาต้า
- สระ
- เป็นไปได้
- นำเสนอ
- การป้องกัน
- การประมวลผล
- แวว
- คุณสมบัติ
- การตีพิมพ์
- เงียบ ๆ
- อ่าน
- ความจริง
- การบันทึก
- ลด
- ต้อง
- การวิจัย
- ความละเอียด
- ส่งผลให้
- การรักษา
- กล่าวว่า
- ฉาก
- ชุด
- อย่างมีความหมาย
- เดียว
- ขนาด
- So
- บาง
- มั่นคง
- ระยะ
- ภายหลัง
- ประสบความสำเร็จ
- อย่างเช่น
- รองรับ
- เอา
- เทมเพลต
- พื้นที่
- เวลา
- ไปยัง
- การแปลง
- เปลี่ยน
- เปิดตัว
- ใช้
- ผ่านทาง
- วีดีโอ
- วิดีโอ
- น้ำดื่ม
- ที่
- การทำงาน
- โรงงาน
- YouTube
- ลมทะเล