যখন OpenAI ChatGPT 24-ঘন্টার সংবাদ চক্রের সমস্ত অক্সিজেন চুষে নিচ্ছে, Google শান্তভাবে একটি নতুন AI মডেল উন্মোচন করেছে যা ভিডিও, চিত্র এবং পাঠ্য ইনপুট দেওয়া হলে ভিডিও তৈরি করতে পারে। নতুন Google Dreamix AI ভিডিও এডিটর এখন জেনারেট করা ভিডিওকে বাস্তবের কাছাকাছি নিয়ে এসেছে।
গিটহাবে প্রকাশিত গবেষণা অনুসারে, ড্রিমিকস একটি ভিডিও এবং একটি পাঠ্য প্রম্পটের উপর ভিত্তি করে ভিডিওটি সম্পাদনা করে। ফলস্বরূপ ভিডিওটি রঙ, ভঙ্গি, বস্তুর আকার এবং ক্যামেরার ভঙ্গির প্রতি তার বিশ্বস্ততা বজায় রাখে, ফলে একটি সাময়িকভাবে সামঞ্জস্যপূর্ণ ভিডিও হয়। এই মুহুর্তে, Dreamix শুধুমাত্র একটি প্রম্পট থেকে ভিডিও তৈরি করতে পারে না, তবে, এটি বিদ্যমান উপাদান নিতে পারে এবং পাঠ্য প্রম্পট ব্যবহার করে ভিডিও পরিবর্তন করতে পারে।
Google ড্রিমিকসের জন্য ভিডিও ডিফিউশন মডেল ব্যবহার করে, একটি পদ্ধতি যা আমরা DALL-E2 বা ওপেন-সোর্স স্টেবল ডিফিউশন-এর মতো ইমেজ AI-তে দেখি বেশিরভাগ ভিডিও ইমেজ এডিটিং-এর জন্য সফলভাবে প্রয়োগ করা হয়েছে।
পদ্ধতির মধ্যে ব্যাপকভাবে ইনপুট ভিডিও হ্রাস করা, কৃত্রিম শব্দ যোগ করা, এবং তারপরে এটিকে একটি ভিডিও ডিফিউশন মডেলে প্রক্রিয়াকরণ করা জড়িত, যা তারপরে এটি থেকে একটি নতুন ভিডিও তৈরি করতে একটি পাঠ্য প্রম্পট ব্যবহার করে যা মূল ভিডিওর কিছু বৈশিষ্ট্য বজায় রাখে এবং অন্যগুলিকে সেই অনুযায়ী পুনরায় রেন্ডার করে। পাঠ্য ইনপুটে।
ভিডিও ডিফিউশন মডেল একটি প্রতিশ্রুতিশীল ভবিষ্যতের প্রস্তাব দেয় যা ভিডিওগুলির সাথে কাজ করার জন্য একটি নতুন যুগের সূচনা করতে পারে।
উদাহরণ স্বরূপ, নীচের ভিডিওতে, ড্রিমিকস ভোজন করা বানরকে (বামে) একটি নাচতে ভাল্লুক (ডানে) পরিণত করে "একটি ভালুক নাচছে এবং উচ্ছ্বসিত সঙ্গীতে লাফাচ্ছে, তার পুরো শরীরকে নাড়াচ্ছে"।
নীচের অন্য একটি উদাহরণে, Dreamix একটি টেমপ্লেট হিসাবে একটি একক ফটো ব্যবহার করে (যেমন চিত্র-টু-ভিডিওতে) এবং একটি অবজেক্ট তারপর একটি প্রম্পটের মাধ্যমে একটি ভিডিওতে এটি থেকে অ্যানিমেট করা হয়। ক্যামেরা নড়াচড়াও নতুন দৃশ্যে বা পরবর্তী সময়ের ব্যবধানের রেকর্ডিংয়েও সম্ভব।
অন্য একটি উদাহরণে, ড্রিমিকস একটি সুন্দর বাথরুমে গোসল করা কমলা চুলের সাথে একটি জলের পুল (বামে) ওরাঙ্গুটানকে একটি ওরাঙ্গুটানে পরিণত করে।
“যদিও ইমেজ এডিটিং এর জন্য ডিফিউশন মডেল সফলভাবে প্রয়োগ করা হয়েছে, ভিডিও এডিটিং এর জন্য খুব কম কাজই করা হয়েছে। আমরা প্রথম ডিফিউশন-ভিত্তিক পদ্ধতি উপস্থাপন করেছি যা পাঠ্য-ভিত্তিক গতি এবং সাধারণ ভিডিওগুলির উপস্থিতি সম্পাদনা করতে সক্ষম।"
গুগল রিসার্চ পেপার অনুসারে, ড্রিমিকস একটি ভিডিও ডিফিউশন মডেল ব্যবহার করে, অনুমান করার সময়ে, মূল ভিডিও থেকে লো-রেজোলিউশনের স্প্যাটিওটেম্পোরাল তথ্যকে নতুন, উচ্চ-রেজোলিউশন তথ্যের সাথে একত্রিত করতে যা এটি গাইডিং টেক্সট প্রম্পটের সাথে সারিবদ্ধ করার জন্য সংশ্লেষিত করে।
গুগল বলেছে যে এটি এই পদ্ধতিটি গ্রহণ করেছে কারণ "মূল ভিডিওতে উচ্চ-বিশ্বস্ততা অর্জনের জন্য এর কিছু উচ্চ-রেজোলিউশন তথ্য বজায় রাখা প্রয়োজন, আমরা আসল ভিডিওতে মডেলটিকে ফাইনটিউন করার একটি প্রাথমিক পর্যায় যোগ করি, উল্লেখযোগ্যভাবে বিশ্বস্ততা বৃদ্ধি করে।"
নিচে Dreamix কিভাবে কাজ করে তার একটি ভিডিও ওভারভিউ আছে।
[এম্বেড করা সামগ্রী]
ড্রিমিকস ভিডিও ডিফিউশন মডেলগুলি কীভাবে কাজ করে
গুগলের মতে, একা ইনপুট ভিডিওতে ড্রিমিকসের জন্য ভিডিও ডিফিউশন মডেলটি ফাইনটিউন করা গতি পরিবর্তনের পরিমাণকে সীমিত করে। পরিবর্তে, আমরা একটি মিশ্র উদ্দেশ্য ব্যবহার করি যেটি মূল উদ্দেশ্যের পাশাপাশি (নীচে বাম দিকে) ফ্রেমের বিন্যাসহীন সেটে ফাইনটিউনও করে। এটি "মাস্কড টেম্পোরাল অ্যাটেনশন" ব্যবহার করে করা হয়, টেম্পোরাল অ্যাটেনশন এবং কনভল্যুশনকে ফাইনটিউন করা থেকে বাধা দেয় (নীচে ডানদিকে)। এটি একটি স্ট্যাটিক ভিডিওতে গতি যোগ করার অনুমতি দেয়।
"আমাদের পদ্ধতিটি একাধিক অ্যাপ্লিকেশনকে অ্যাপ্লিকেশন-নির্ভর প্রাক-প্রক্রিয়াকরণ (বামে) সমর্থন করে, ইনপুট সামগ্রীকে একটি অভিন্ন ভিডিও বিন্যাসে রূপান্তর করে৷ ইমেজ-টু-ভিডিওর জন্য, ইনপুট ইমেজ ডুপ্লিকেট করা হয় এবং পরিপ্রেক্ষিত রূপান্তর ব্যবহার করে রূপান্তরিত হয়, কিছু ক্যামেরা মোশন সহ একটি মোটা ভিডিও সংশ্লেষ করে। বিষয়-চালিত ভিডিও জেনারেশনের জন্য, ইনপুট বাদ দেওয়া হয়েছে - একা ফাইনটিউনিং বিশ্বস্ততার যত্ন নিন। এই মোটা ভিডিওটি তারপরে আমাদের সাধারণ "ড্রিমিকস ভিডিও এডিটর" (ডানদিকে) ব্যবহার করে সম্পাদনা করা হয়: আমরা প্রথমে ডাউনস্যাম্পলিং করে তারপরে শব্দ যোগ করে ভিডিওটি নষ্ট করি৷ তারপরে আমরা ফাইনটিউনড টেক্সট-গাইডেড ভিডিও ডিফিউশন মডেলটি প্রয়োগ করি, যা ভিডিওটিকে চূড়ান্ত স্পাটিওটেম্পোরাল রেজোলিউশনে উন্নীত করে,” ড্রিম লিখেছেন GitHub.
আপনি নীচের গবেষণা পত্র পড়তে পারেন.
গুগল ড্রিমিকস- এসইও চালিত বিষয়বস্তু এবং পিআর বিতরণ। আজই পরিবর্ধিত পান।
- প্লেটোব্লকচেন। Web3 মেটাভার্স ইন্টেলিজেন্স। জ্ঞান প্রসারিত. এখানে প্রবেশ করুন.
- উত্স: https://techstartups.com/2023/02/10/google-launches-ai-powered-video-editor-dreamix-to-create-edit-videos-and-animate-images/
- a
- সক্ষম
- অনুযায়ী
- AI
- আইআই ভিডিও
- এআই চালিত
- সব
- অনুমতি
- একা
- এবং
- অন্য
- অ্যাপ্লিকেশন
- ফলিত
- প্রয়োগ করা
- অভিগমন
- কৃত্রিম
- মনোযোগ
- ভিত্তি
- বিয়ার
- সুন্দর
- কারণ
- হচ্ছে
- নিচে
- শরীর
- boosting
- পাদ
- আনে
- ক্যামেরা
- না পারেন
- যত্ন
- পরিবর্তন
- চ্যাটজিপিটি
- কাছাকাছি
- রঙ
- মেশা
- সঙ্গত
- বিষয়বস্তু
- তৈরি করা হচ্ছে
- চক্র
- নাট্য
- আশ্লেষ
- স্বপ্ন
- সম্পাদক
- এম্বেড করা
- যুগ
- উদাহরণ
- বিদ্যমান
- কয়েক
- বিশ্বস্ততা
- চূড়ান্ত
- প্রথম
- অনুসৃত
- বিন্যাস
- থেকে
- ভবিষ্যৎ
- সাধারণ
- উত্পাদন করা
- উত্পন্ন
- প্রজন্ম
- GIF
- GitHub
- প্রদত্ত
- গুগল
- চুল
- প্রচন্ডভাবে
- উচ্চ রেজল্যুশন
- কিভাবে
- যাহোক
- HTTPS দ্বারা
- ভাবমূর্তি
- চিত্র
- in
- তথ্য
- ইনপুট
- পরিবর্তে
- IT
- লঞ্চ
- সীমা
- রক্ষণাবেক্ষণ
- উপাদান
- সর্বোচ্চ
- পদ্ধতি
- মিশ্র
- মডেল
- মডেল
- পরিবর্তন
- মুহূর্ত
- সেতু
- গতি
- আন্দোলন
- চলন্ত
- বহু
- সঙ্গীত
- নতুন
- সংবাদ
- গোলমাল
- লক্ষ্য
- উদ্দেশ্য
- অফার
- ওপেন সোর্স
- OpenAI
- কমলা
- মূল
- অন্যরা
- ওভারভিউ
- অক্সিজেন
- কাগজ
- পিডিএফ
- সম্পাদন করা
- পরিপ্রেক্ষিত
- Plato
- প্লেটো ডেটা ইন্টেলিজেন্স
- প্লেটোডাটা
- পুকুর
- সম্ভব
- বর্তমান
- নিরোধক
- প্রক্রিয়াজাতকরণ
- আশাপ্রদ
- বৈশিষ্ট্য
- প্রকাশিত
- শান্তভাবে
- পড়া
- বাস্তবতা
- রেকর্ডিং
- হ্রাস
- প্রয়োজন
- গবেষণা
- সমাধান
- ফলে এবং
- ধারনকারী
- বলেছেন
- দৃশ্য
- সেট
- উল্লেখযোগ্যভাবে
- একক
- আয়তন
- So
- কিছু
- স্থিতিশীল
- পর্যায়
- পরবর্তী
- সফলভাবে
- এমন
- সমর্থন
- গ্রহণ করা
- টেমপ্লেট
- সার্জারির
- সময়
- থেকে
- রূপান্তরের
- রুপান্তরিত
- অপাবৃত
- ব্যবহার
- মাধ্যমে
- ভিডিও
- Videos
- পানি
- যে
- কাজ
- কাজ
- ইউটিউব
- zephyrnet