->
ছবি: মার্ক হ্যাচম্যান / IDG এর মাধ্যমে Dreamstudio.ai
টম হ্যাঙ্কস আমাকে কেবল একটি অংশ পিচ করার জন্য আমাকে ডাকেননি, তবে এটি অবশ্যই এটির মতো শোনাচ্ছে।
যখন থেকে PCWorld এর উত্থান কভার করা শুরু করেছে বিভিন্ন এআই অ্যাপ্লিকেশন যেমন এআই শিল্প, আমি GitHub-এর কোড রিপোজিটরি এবং Reddit-এর মধ্যে লিঙ্কগুলিতে ঘুরে বেড়াচ্ছি, যেখানে লোকেরা বিভিন্ন পদ্ধতির জন্য তাদের নিজস্ব AI মডেলগুলিতে টুইক পোস্ট করবে।
এই মডেলগুলির মধ্যে কিছু আসলে বাণিজ্যিক সাইটগুলিতে শেষ হয়, যেগুলি হয় তাদের নিজস্ব অ্যালগরিদমগুলি রোল করে বা অন্যগুলিকে মানিয়ে নেয় যা ওপেন সোর্স হিসাবে প্রকাশিত হয়েছে৷ একটি বিদ্যমান AI অডিও সাইটের একটি দুর্দান্ত উদাহরণ Uberduck.ai, যা আক্ষরিক অর্থে শত শত প্রিপ্রোগ্রামড মডেল অফার করে। টেক্সট ফিল্ডে টেক্সট লিখুন এবং আপনার কাছে ভার্চুয়াল এলন মাস্ক, বিল গেটস, পেগি হিল, ড্যাফি ডাক, অ্যালেক্স ট্রেবেক, বিভিস, দ্য জোকার বা এমনকি সিরি আপনার প্রাক-প্রোগ্রাম করা লাইন পড়তে পারেন।
আমরা গত বছর PCWorld-এর প্রশংসা করে একটি নকল বিল ক্লিনটন আপলোড করেছি এবং মডেলটি ইতিমধ্যেই বেশ ভালো শোনাচ্ছে৷
বক্তৃতা পুনরুত্পাদন করার জন্য একটি AI প্রশিক্ষণের মধ্যে স্পষ্ট ভয়েস নমুনা আপলোড করা জড়িত। AI "শিখে" কিভাবে স্পিকার সেই সম্পর্কগুলি শেখার, সেগুলিকে নিখুঁত করা এবং ফলাফলগুলি অনুকরণ করার লক্ষ্যের সাথে শব্দগুলিকে একত্রিত করে৷ আপনি যদি চমৎকার 1992 থ্রিলারের সাথে পরিচিত হন কেডস (রবার্ট রেডফোর্ড, সিডনি পোইটিয়ার এবং বেন কিংসলে-এর অল-স্টার কাস্ট সহ), তারপর আপনি সেই দৃশ্য সম্পর্কে জানেন যেখানে অক্ষরদের লক্ষ্যের ভয়েসের একটি ভয়েস নমুনা রেকর্ড করে একটি বায়োমেট্রিক ভয়েস পাসওয়ার্ড "ক্র্যাক" করতে হবে . এটি প্রায় একই জিনিস।
সাধারণত, একটি ভাল ভয়েস মডেল একত্রিত করার জন্য একটি নির্দিষ্ট ব্যক্তি কীভাবে কথা বলে তা নির্দেশ করার জন্য দীর্ঘ নমুনা সহ বেশ কিছুটা প্রশিক্ষণ নিতে পারে। গত কয়েক দিনে, তবে, কিছু নতুন আবির্ভূত হয়েছে: Microsoft Val-E, একটি গবেষণা পত্র একটি সংশ্লেষিত ভয়েসের (লাইভ উদাহরণ সহ) যা সম্পূর্ণরূপে প্রোগ্রামযোগ্য ভয়েস তৈরি করতে মাত্র কয়েক সেকেন্ডের সোর্স অডিও প্রয়োজন।
স্বাভাবিকভাবেই, এআই গবেষকরা এবং অন্যান্য এআই গ্রুপগুলি জানতে চেয়েছিল যে Val-E মডেলটি এখনও জনসাধারণের কাছে প্রকাশ করা হয়েছে কিনা। উত্তর হল না, যদিও আপনি ইচ্ছা করলে অন্য মডেলের সাথে খেলতে পারেন, যার নাম কচ্ছপ। (লেখক উল্লেখ করেছেন যে এটিকে কচ্ছপ বলা হয় কারণ এটি ধীর, যা এটি, তবে এটি কাজ করে।)
কচ্ছপের সাথে আপনার নিজস্ব এআই ভয়েসকে প্রশিক্ষণ দিন
যা কচ্ছপকে আকর্ষণীয় করে তোলে তা হল যে আপনি যে ভয়েস চয়ন করেন তাতে মডেলটিকে প্রশিক্ষণ দিতে পারেন কেবল কয়েকটি অডিও ক্লিপ আপলোড করার মাধ্যমে। দ্য কচ্ছপ গিটহাব পৃষ্ঠা নোট করে যে আপনার প্রায় এক ডজন সেকেন্ড বা তার কিছু ক্লিপ থাকা উচিত। আপনাকে একটি নির্দিষ্ট গুণমান সহ একটি .WAV ফাইল হিসাবে সেগুলি সংরক্ষণ করতে হবে৷
কিভাবে এটা সব কাজ করে? একটি পাবলিক ইউটিলিটির মাধ্যমে যা আপনি হয়তো জানেন না: গুগল কোলাব. মূলত, Collab হল একটি ক্লাউড পরিষেবা যা Google প্রদান করে যা পাইথন সার্ভারে অ্যাক্সেসের অনুমতি দেয়। আপনি (বা অন্য কেউ) যে কোডটি লেখেন তা একটি নোটবুক হিসাবে সংরক্ষণ করা যেতে পারে, যা সাধারণ Google অ্যাকাউন্ট আছে এমন ব্যবহারকারীদের সাথে ভাগ করা যেতে পারে। দ্য কচ্ছপের ভাগ করা সম্পদ এখানে.
ইন্টারফেস ভীতিজনক দেখায়, কিন্তু এটি খারাপ নয়। আপনাকে একজন Google ব্যবহারকারী হিসাবে লগ ইন করতে হবে এবং তারপরে আপনাকে উপরের ডানদিকের কোণায় "সংযোগ করুন" এ ক্লিক করতে হবে৷ সতর্কতা একটি শব্দ. এই Colab আপনার Google Drive-এ কিছু ডাউনলোড না করলেও, অন্যান্য Colab-এ হতে পারে। (যদিও এটি তৈরি করা অডিও ফাইলগুলি ব্রাউজারে সংরক্ষণ করা হয় তবে আপনার পিসিতে ডাউনলোড করা যেতে পারে।) সচেতন থাকুন যে আপনি অন্য কেউ লিখেছেন এমন কোড চালাচ্ছেন। আপনি হয়ত খারাপ ইনপুটগুলির কারণে বা Google এর পিছনের দিকে একটি হেঁচকি আছে যেমন একটি উপলব্ধ GPU না থাকার কারণে ত্রুটি বার্তা পেতে পারেন৷ এটা সব একটু পরীক্ষামূলক.
কোডের প্রতিটি ব্লকে একটি ছোট "প্লে" আইকন থাকে যা আপনি এটির উপর আপনার মাউস ঘোরালে প্রদর্শিত হবে৷ এটি চালানোর জন্য আপনাকে কোডের প্রতিটি ব্লকে "প্লে" ক্লিক করতে হবে, পরবর্তীটি চালানোর আগে প্রতিটি ব্লক কার্যকর হওয়ার জন্য অপেক্ষা করতে হবে।
যদিও আমরা সমস্ত বৈশিষ্ট্যের বিশদ নির্দেশাবলীর মাধ্যমে ধাপে ধাপে যাচ্ছি না, শুধু জেনে রাখুন যে লাল টেক্সটটি ব্যবহারকারীর পরিবর্তনযোগ্য, যেমন প্রস্তাবিত পাঠ্য যেটি আপনি মডেলটি বলতে চান। প্রায় সাতটি ব্লক নিচে, আপনার কাছে মডেল প্রশিক্ষণের বিকল্প থাকবে। আপনাকে মডেলটির নাম দিতে হবে, তারপর অডিও ফাইলগুলি আপলোড করতে হবে৷ এটি সম্পূর্ণ হলে, চতুর্থ ব্লকে নতুন অডিও মডেল নির্বাচন করুন, কোডটি চালান, তারপর তৃতীয় ব্লকে পাঠ্যটি কনফিগার করুন। চালান যে কোড ব্লক।
সবকিছু পরিকল্পনা অনুযায়ী চলে গেলে, আপনার নমুনা ভয়েসের একটি ছোট অডিও আউটপুট থাকবে। এটা কি কাজ করে? ঠিক আছে, আমি আমার সহকর্মী গর্ডন মাহ উং এর একটি দ্রুত এবং নোংরা ভয়েস মডেল করেছি, যার কাজ আমাদের সম্পূর্ণ Nerd পডকাস্ট পাশাপাশি বিভিন্ন ভিডিও। আমি ছোট স্নিপেটগুলির পরিবর্তে একটি কয়েক মিনিটের নমুনা আপলোড করেছি, এটি কাজ করবে কিনা তা দেখার জন্য।
ফলাফল? ভাল, এটা শব্দসমূহ প্রাণবন্ত, কিন্তু মোটেও গর্ডনের মতো নয়। তিনি অবশ্যই আপাতত ডিজিটাল ছদ্মবেশ থেকে নিরাপদ। (এটি কোনো ফাস্ট-ফুড চেইনের অনুমোদনও নয়।)
তবে একটি বিদ্যমান মডেল যা কচ্ছপ লেখক অভিনেতা টম হ্যাঙ্কসকে প্রশিক্ষণ দিয়েছিলেন তা বেশ ভাল শোনাচ্ছে। এই টম হ্যাঙ্কস এখানে কথা বলছেন না! টমও করেছে না আমাকে একটি চাকরির প্রস্তাব দেয়, তবে এটি আমার অন্তত একজন বন্ধুকে বোকা বানানোর জন্য যথেষ্ট ছিল।
উপসংহার? এটা একটু ভীতিকর: আমরা যা শুনি (এবং শীঘ্রই দেখি) তা বিশ্বাস করার বয়স শেষ হয়ে যাচ্ছে। অথবা এটা ইতিমধ্যে আছে.
কুপন কোড
- এসইও চালিত বিষয়বস্তু এবং পিআর বিতরণ। আজই পরিবর্ধিত পান।
- প্লেটোব্লকচেন। Web3 মেটাভার্স ইন্টেলিজেন্স। জ্ঞান প্রসারিত. এখানে প্রবেশ করুন.
- উত্স: https://www.pcworld.com/article/1473072/tom-hanks-did-not-offer-me-a-job-but-ai-sounds-like-it.html
- 1
- 2023
- 39
- a
- সম্পর্কে
- প্রবেশ
- হিসাব
- প্রকৃতপক্ষে
- খাপ খাওয়ানো
- AI
- Alex
- আলগোরিদিম
- সব
- অনুমতি
- ইতিমধ্যে
- মধ্যে
- amp
- এবং
- অন্য
- উত্তর
- অ্যাপ্লিকেশন
- পন্থা
- কাছাকাছি
- প্রবন্ধ
- কৃত্রিম
- অডিও
- লেখক
- সহজলভ্য
- পিছনে
- খারাপ
- কারণ
- আগে
- শুরু হয়
- বিশ্বাসী
- বিল
- বিল ক্লিনটন
- বিল গেটস
- বায়োমেট্রিক
- বিট
- বাধা
- ব্লক
- ব্রাউজার
- বোতাম
- কল
- নামক
- কার্ড
- বিভাগ
- অবশ্যই
- চেন
- অক্ষর
- চিপ
- বেছে নিন
- পরিষ্কার
- ক্লিপ্স
- মেঘ
- কোড
- সহকর্মী
- সম্মিলন
- মন্তব্য
- ব্যবসায়িক
- সমাপ্ত
- উপসংহার
- নিয়ন্ত্রণগুলি
- কোণ
- পথ
- আচ্ছাদন
- ধার
- সিএসএস
- তারিখ
- দিন
- বিবরণ
- বিশদ
- DID
- ডিজিটাল
- না
- নিচে
- ডাউনলোড
- ডজন
- ড্রাইভ
- প্রতি
- সম্পাদক
- পারেন
- এলোন
- ইলন
- উদিত
- যথেষ্ট
- প্রবেশ করান
- ভুল
- মূলত
- থার (eth)
- এমন কি
- সব
- উদাহরণ
- উদাহরণ
- চমত্কার
- এক্সিকিউট
- বিদ্যমান
- নকল
- পরিচিত
- বৈশিষ্ট্য
- কয়েক
- ক্ষেত্র
- ফাইল
- নথি পত্র
- গুরুত্ত্ব
- অনুসরণ করা
- সাবেক
- পূর্বে
- চতুর্থ
- বন্ধুদের
- থেকে
- সম্পূর্ণ
- সম্পূর্ণরূপে
- গেটস
- উত্পাদন করা
- উত্পন্ন
- পাওয়া
- পেয়ে
- GitHub
- লক্ষ্য
- Goes
- চালু
- ভাল
- গুগল
- জিপিইউ
- মহান
- জমিদারি
- উচ্চতা
- বাতাসে ভাসিতে থাকা
- কিভাবে
- যাহোক
- এইচটিএমএল
- HTTPS দ্বারা
- মানবীয়
- শত শত
- আইকন
- ভাবমূর্তি
- in
- সূচক
- ইঙ্গিত
- নির্দেশাবলী
- মজাদার
- ইন্টারফেস
- ভয় দেখিয়ে
- IT
- জানুয়ারী
- কাজ
- ভাঁড়
- জানা
- বড়
- গত
- গত বছর
- শিক্ষা
- লাইন
- লিঙ্ক
- সামান্য
- জীবিত
- সৌন্দর্য
- তৈরি করে
- পরিচালক
- ছাপ
- জরায়ু
- সর্বোচ্চ প্রস্থ
- বার্তা
- মাইক্রোসফট
- হতে পারে
- মিনিট
- আয়না
- মডেল
- মডেল
- কস্তুরী
- নাম
- প্রয়োজন
- নতুন
- সংবাদ
- পরবর্তী
- নোটবই
- নোট
- অর্পণ
- অফার
- ONE
- খোলা
- ওপেন সোর্স
- অপ্টিমাইজ
- পছন্দ
- অন্যান্য
- অন্যরা
- নিজের
- অংশ
- বিশেষ
- পাসওয়ার্ড
- গত
- PC
- সম্প্রদায়
- উপসংহার
- ব্যক্তি
- ব্যক্তিগত
- পিচ
- পরিকল্পিত
- Plato
- প্লেটো ডেটা ইন্টেলিজেন্স
- প্লেটোডাটা
- খেলা
- প্লাগ লাগানো
- পোস্ট
- প্রিমিয়াম
- সভাপতি
- চমত্কার
- প্রাথমিক
- প্রোফাইল
- উপলব্ধ
- প্রকাশ্য
- প্রকাশিত
- পাইথন
- গুণ
- পড়া
- পড়া
- গ্রহণ করা
- সাম্প্রতিক
- রেকর্ডিং
- লাল
- সম্পর্ক
- মুক্ত
- প্রয়োজন
- গবেষণা
- গবেষকরা
- সংস্থান
- ফল
- ফলাফল
- ওঠা
- রবার্ট
- রোবট
- রোবট
- রোল
- চালান
- দৌড়
- নিরাপদ
- একই
- সংরক্ষণ করুন
- দৃশ্য
- সেকেন্ড
- জ্যেষ্ঠ
- এসইও
- সেবা
- সেবা
- সাত
- ভাগ
- সংক্ষিপ্ত
- উচিত
- কেবল
- থেকে
- একক
- সিরীয়
- সাইট
- সাইট
- অধিবেশন
- ধীর
- ছোট
- So
- সফটওয়্যার
- কেউ
- কিছু
- শীঘ্রই
- উৎস
- কথা বলা
- বক্তা
- ভাষী
- স্পিক্স
- নির্দিষ্ট
- বক্তৃতা
- শুরু
- শুরু
- ধাপ
- সঞ্চিত
- খবর
- এমন
- টেবিল
- TAG
- গ্রহণ করা
- প্রযুক্তিঃ
- সার্জারির
- তাদের
- জিনিস
- তৃতীয়
- দ্বারা
- সময়
- শিরনাম
- থেকে
- অত্যধিক
- রেলগাড়ি
- প্রশিক্ষিত
- প্রশিক্ষণ
- চালু
- টুইটার
- আপলোড করা
- আপলোড
- URL টি
- ব্যবহারকারী
- ব্যবহারকারী
- উপযোগ
- বিভিন্ন
- সংস্করণ
- মাধ্যমে
- Videos
- ভার্চুয়াল
- কণ্ঠস্বর
- ভয়েস
- W
- প্রতীক্ষা
- চেয়েছিলেন
- সতর্কবার্তা
- কি
- যে
- যখন
- হু
- ইচ্ছা
- মধ্যে
- শব্দ
- হয়া যাই ?
- কাজ
- would
- লিখিত
- বছর
- আপনার
- ইউটিউব
- zephyrnet