লেখকের ছবি
Gemini হল Google দ্বারা তৈরি একটি নতুন মডেল এবং Bard আবার ব্যবহারযোগ্য হয়ে উঠছে৷ মিথুনের সাহায্যে, এখন আপনার প্রশ্নের প্রায় নিখুঁত উত্তর পাওয়া সম্ভব তাদের ছবি, অডিও এবং টেক্সট দিয়ে।
এই টিউটোরিয়ালে, আমরা Gemini API সম্পর্কে শিখব এবং কীভাবে এটি আপনার মেশিনে সেট আপ করবেন। আমরা টেক্সট জেনারেশন এবং ইমেজ বোঝার সহ বিভিন্ন Python API ফাংশনও এক্সপ্লোর করব।
মিথুনরাশি এটি একটি নতুন এআই মডেল যা গুগল রিসার্চ এবং গুগল ডিপমাইন্ড সহ Google-এর দলের মধ্যে সহযোগিতার মাধ্যমে তৈরি করা হয়েছে। এটি বিশেষভাবে মাল্টিমোডাল হওয়ার জন্য তৈরি করা হয়েছিল, যার অর্থ এটি পাঠ্য, কোড, অডিও, চিত্র এবং ভিডিওর মতো বিভিন্ন ধরণের ডেটা বুঝতে এবং কাজ করতে পারে।
মিথুন হল এখন পর্যন্ত Google দ্বারা তৈরি করা সবচেয়ে উন্নত এবং বৃহত্তম AI মডেল৷ এটি অত্যন্ত নমনীয় হওয়ার জন্য ডিজাইন করা হয়েছে যাতে এটি ডেটা সেন্টার থেকে মোবাইল ডিভাইস পর্যন্ত বিস্তৃত সিস্টেমে দক্ষতার সাথে কাজ করতে পারে। এর মানে হল যে ব্যবসা এবং বিকাশকারীরা AI অ্যাপ্লিকেশনগুলি তৈরি করতে এবং স্কেল করতে পারে সেই পদ্ধতিতে এটি বিপ্লব করার সম্ভাবনা রয়েছে।
এখানে জেমিনি মডেলের তিনটি সংস্করণ রয়েছে যা বিভিন্ন ব্যবহারের ক্ষেত্রে ডিজাইন করা হয়েছে:
- মিথুন আল্ট্রা: সবচেয়ে বড় এবং সবচেয়ে উন্নত AI জটিল কাজ সম্পাদন করতে সক্ষম।
- মিথুন প্রো: একটি ভারসাম্যপূর্ণ মডেল যা ভাল কর্মক্ষমতা এবং মাপযোগ্যতা আছে।
- মিথুন ন্যানো: মোবাইল ডিভাইসের জন্য সবচেয়ে কার্যকর।
চিত্র থেকে মিথুনের সাথে পরিচয়
জেমিনি আল্ট্রার অত্যাধুনিক পারফরম্যান্স রয়েছে, যা বিভিন্ন মেট্রিক্সে GPT-4-এর পারফরম্যান্সকে ছাড়িয়ে গেছে। এটি ম্যাসিভ মাল্টিটাস্ক ল্যাঙ্গুয়েজ আন্ডারস্ট্যান্ডিং বেঞ্চমার্কে মানব বিশেষজ্ঞদের ছাড়িয়ে যাওয়ার প্রথম মডেল, যা 57টি বিভিন্ন বিষয়ে বিশ্ব জ্ঞান এবং সমস্যা সমাধানের পরীক্ষা করে। এটি এর উন্নত বোঝাপড়া এবং সমস্যা সমাধানের ক্ষমতা প্রদর্শন করে।
API ব্যবহার করার জন্য, আমাদের প্রথমে একটি API কী পেতে হবে যা আপনি এখান থেকে করতে পারেন: https://ai.google.dev/tutorials/setup
তারপরে "একটি API কী পান" বোতামে ক্লিক করুন এবং তারপরে "নতুন প্রকল্পে API কী তৈরি করুন" এ ক্লিক করুন।
API কীটি অনুলিপি করুন এবং এটি একটি পরিবেশ পরিবর্তনশীল হিসাবে সেট করুন। আমরা ডিপনোট ব্যবহার করছি এবং "GEMINI_API_KEY" নাম দিয়ে কী সেট করা আমাদের পক্ষে বেশ সহজ। শুধু ইন্টিগ্রেশনে যান, নিচে স্ক্রোল করুন এবং পরিবেশ ভেরিয়েবল নির্বাচন করুন।
পরবর্তী ধাপে, আমরা PIP ব্যবহার করে Python API ইনস্টল করব:
pip install -q -U google-generativeai
এর পরে, আমরা Google-এর GenAI-তে API কী সেট করব এবং উদাহরণটি শুরু করব।
import google.generativeai as genai
import os
gemini_api_key = os.environ["GEMINI_API_KEY"]
genai.configure(api_key = gemini_api_key)
API কী সেট আপ করার পরে, সামগ্রী তৈরি করতে Gemini Pro মডেল ব্যবহার করা সহজ। `generate_content` ফাংশনে একটি প্রম্পট প্রদান করুন এবং আউটপুটটিকে মার্কডাউন হিসেবে প্রদর্শন করুন।
from IPython.display import Markdown
model = genai.GenerativeModel('gemini-pro')
response = model.generate_content("Who is the GOAT in the NBA?")
Markdown(response.text)
এটি আশ্চর্যজনক, তবে আমি তালিকার সাথে একমত নই। যাইহোক, আমি বুঝতে পারি যে এটি ব্যক্তিগত পছন্দ সম্পর্কে।
মিথুন একক প্রম্পটের জন্য একাধিক প্রতিক্রিয়া তৈরি করতে পারে, যাকে প্রার্থী বলা হয়। আপনি সবচেয়ে উপযুক্ত একটি নির্বাচন করতে পারেন. আমাদের ক্ষেত্রে, আমাদের শুধুমাত্র একটি প্রতিক্রিয়া ছিল।
response.candidates
আসুন এটিকে পাইথনে একটি সাধারণ গেম লিখতে বলি।
response = model.generate_content("Build a simple game in Python")
Markdown(response.text)
ফলাফল সহজ এবং পয়েন্ট. বেশিরভাগ এলএলএম পাইথন কোড লেখার পরিবর্তে ব্যাখ্যা করতে শুরু করে।
আপনি `generation_config` আর্গুমেন্ট ব্যবহার করে আপনার প্রতিক্রিয়া কাস্টমাইজ করতে পারেন। আমরা প্রার্থীর সংখ্যা 1-এ সীমাবদ্ধ করছি, স্টপ শব্দ "স্পেস" যোগ করছি এবং সর্বোচ্চ টোকেন এবং তাপমাত্রা সেট করছি।
response = model.generate_content(
'Write a short story about aliens.',
generation_config=genai.types.GenerationConfig(
candidate_count=1,
stop_sequences=['space'],
max_output_tokens=200,
temperature=0.7)
)
Markdown(response.text)
আপনি দেখতে পাচ্ছেন, "স্পেস" শব্দের আগে প্রতিক্রিয়া বন্ধ হয়ে গেছে। আশ্চর্যজনক।
আপনি প্রতিক্রিয়া স্ট্রিম করতে `স্ট্রিম` যুক্তি ব্যবহার করতে পারেন। এটি অ্যানথ্রোপিক এবং ওপেনএআই API-এর মতো কিন্তু দ্রুত।
model = genai.GenerativeModel('gemini-pro')
response = model.generate_content("Write a Julia function for cleaning the data.", stream=True)
for chunk in response:
print(chunk.text)
এই বিভাগে, আমরা লোড হবে মাসুদ আসলামীর ছবি এবং জেমিনি প্রো ভিশনের মাল্টিমোডালিটি পরীক্ষা করতে এটি ব্যবহার করুন।
ছবিগুলিকে 'পিআইএল'-এ লোড করুন এবং এটি প্রদর্শন করুন।
import PIL.Image
img = PIL.Image.open('images/photo-1.jpg')
img
আমাদের কাছে রুয়া অগাস্টা আর্চের একটি উচ্চ মানের ছবি রয়েছে।
আসুন জেমিনি প্রো ভিশন মডেলটি লোড করি এবং এটি চিত্রের সাথে সরবরাহ করি।
model = genai.GenerativeModel('gemini-pro-vision')
response = model.generate_content(img)
Markdown(response.text)
মডেলটি সঠিকভাবে প্রাসাদটিকে চিহ্নিত করেছে এবং এর ইতিহাস এবং স্থাপত্য সম্পর্কে অতিরিক্ত তথ্য প্রদান করেছে।
আসুন GPT-4-এ একই চিত্র প্রদান করি এবং চিত্রটি সম্পর্কে জিজ্ঞাসা করি। উভয় মডেল প্রায় অনুরূপ উত্তর প্রদান করেছে. কিন্তু আমি GPT-4 প্রতিক্রিয়া বেশি পছন্দ করি।
আমরা এখন API এ পাঠ্য এবং চিত্র প্রদান করব। আমরা ভিশন মডেলকে রেফারেন্স হিসাবে ছবিটি ব্যবহার করে একটি ভ্রমণ ব্লগ লিখতে বলেছি।
response = model.generate_content(["Write a travel blog post using the image as reference.", img])
Markdown(response.text)
এটি আমাকে একটি ছোট ব্লগ প্রদান করেছে। আমি দীর্ঘ ফর্ম্যাট আশা করছিলাম.
GPT-4 এর তুলনায়, জেমিনি প্রো ভিশন মডেলটি একটি দীর্ঘ-ফরম্যাট ব্লগ তৈরি করতে সংগ্রাম করেছে।
আমরা সামনে-আগে চ্যাট সেশনের জন্য মডেল সেট আপ করতে পারি। এইভাবে, মডেল পূর্ববর্তী কথোপকথন ব্যবহার করে প্রসঙ্গ এবং প্রতিক্রিয়া মনে রাখে।
আমাদের ক্ষেত্রে, আমরা চ্যাট সেশন শুরু করেছি এবং মডেলকে বলেছি আমাকে Dota 2 গেমটি শুরু করতে সাহায্য করতে।
model = genai.GenerativeModel('gemini-pro')
chat = model.start_chat(history=[])
chat.send_message("Can you please guide me on how to start playing Dota 2?")
chat.history
আপনি দেখতে পাচ্ছেন, `চ্যাট` অবজেক্ট ব্যবহারকারী এবং মোড চ্যাটের ইতিহাস সংরক্ষণ করছে।
আমরা তাদের একটি মার্কডাউন শৈলীতে প্রদর্শন করতে পারি।
for message in chat.history:
display(Markdown(f'**{message.role}**: {message.parts[0].text}'))
এর ফলো আপ প্রশ্ন জিজ্ঞাসা করা যাক.
chat.send_message("Which Dota 2 heroes should I start with?")
for message in chat.history:
display(Markdown(f'**{message.role}**: {message.parts[0].text}'))
আমরা নীচে স্ক্রোল করতে পারি এবং মডেলের সাথে পুরো সেশনটি দেখতে পারি।
প্রসঙ্গ-সচেতন অ্যাপ্লিকেশনগুলির জন্য এমবেডিং মডেলগুলি ক্রমশ জনপ্রিয় হয়ে উঠছে৷ Gemini এম্বেডিং-001 মডেল শব্দ, বাক্য বা সম্পূর্ণ নথিকে ঘন ভেক্টর হিসাবে উপস্থাপন করার অনুমতি দেয় যা শব্দার্থগত অর্থ এনকোড করে। এই ভেক্টর উপস্থাপনাটি তাদের সংশ্লিষ্ট এমবেডিং ভেক্টরগুলির তুলনা করে পাঠ্যের বিভিন্ন অংশের মধ্যে সাদৃশ্য তুলনা করা সহজ করে তোলে।
আমরা বিষয়বস্তুকে `এম্বেড_কন্টেন্ট` প্রদান করতে পারি এবং পাঠ্যকে এম্বেডিং-এ রূপান্তর করতে পারি। এটা যে সহজ.
output = genai.embed_content(
model="models/embedding-001",
content="Can you please guide me on how to start playing Dota 2?",
task_type="retrieval_document",
title="Embedding of Dota 2 question")
print(output['embedding'][0:10])
[0.060604308, -0.023885584, -0.007826327, -0.070592545, 0.021225851, 0.043229062, 0.06876691, 0.049298503, 0.039964676, 0.08291664]
আমরা 'কন্টেন্ট' আর্গুমেন্টে স্ট্রিংগুলির একটি তালিকা পাস করে পাঠ্যের একাধিক অংশকে এমবেডিংয়ে রূপান্তর করতে পারি।
output = genai.embed_content(
model="models/embedding-001",
content=[
"Can you please guide me on how to start playing Dota 2?",
"Which Dota 2 heroes should I start with?",
],
task_type="retrieval_document",
title="Embedding of Dota 2 question")
for emb in output['embedding']:
print(emb[:10])
[0.060604308, -0.023885584, -0.007826327, -0.070592545, 0.021225851, 0.043229062, 0.06876691, 0.049298503, 0.039964676, 0.08291664]
[0.04775657, -0.044990525, -0.014886052, -0.08473655, 0.04060122, 0.035374347, 0.031866882, 0.071754575, 0.042207796, 0.04577447]
আপনার যদি একই ফলাফল পুনরুত্পাদন করতে সমস্যা হয় তবে আমার দেখুন ডিপনোট ওয়ার্কস্পেস.
অনেক উন্নত ফাংশন আছে যা আমরা এই পরিচায়ক টিউটোরিয়ালে কভার করিনি। আপনি গিয়ে Gemini API সম্পর্কে আরও জানতে পারেন Gemini API: Python এর সাথে Quickstart.
এই টিউটোরিয়ালে, আমরা জেনেছি জেমিনি সম্পর্কে এবং কীভাবে প্রতিক্রিয়া তৈরি করতে পাইথন API অ্যাক্সেস করতে হয়। বিশেষ করে, আমরা টেক্সট জেনারেশন, ভিজ্যুয়াল বোঝাপড়া, স্ট্রিমিং, কথোপকথনের ইতিহাস, কাস্টম আউটপুট এবং এম্বেডিং সম্পর্কে শিখেছি। যাইহোক, এটি মিথুন কি করতে পারে তার উপরিভাগে স্ক্র্যাচ করে।
বিনামূল্যে Gemini API ব্যবহার করে আপনি যা তৈরি করেছেন তা নির্দ্বিধায় আমার সাথে ভাগ করুন৷ সম্ভাবনা সীমাহীন।
আবিদ আলী আওয়ান (@1 আবিদালিয়াওয়ান) একজন প্রত্যয়িত ডেটা সায়েন্টিস্ট পেশাদার যিনি মেশিন লার্নিং মডেল তৈরি করতে পছন্দ করেন। বর্তমানে, তিনি মেশিন লার্নিং এবং ডেটা সায়েন্স টেকনোলজিতে বিষয়বস্তু তৈরি এবং প্রযুক্তিগত ব্লগ লেখার উপর মনোযোগ নিবদ্ধ করছেন। আবিদ টেকনোলজি ম্যানেজমেন্টে স্নাতকোত্তর ডিগ্রি এবং টেলিকমিউনিকেশন ইঞ্জিনিয়ারিংয়ে স্নাতক ডিগ্রি অর্জন করেছেন। তার দৃষ্টিভঙ্গি মানসিক অসুস্থতার সাথে সংগ্রামরত শিক্ষার্থীদের জন্য একটি গ্রাফ নিউরাল নেটওয়ার্ক ব্যবহার করে একটি AI পণ্য তৈরি করা।
- এসইও চালিত বিষয়বস্তু এবং পিআর বিতরণ। আজই পরিবর্ধিত পান।
- PlatoData.Network উল্লম্ব জেনারেটিভ Ai. নিজেকে ক্ষমতায়িত করুন। এখানে প্রবেশ করুন.
- প্লেটোএআইস্ট্রিম। Web3 ইন্টেলিজেন্স। জ্ঞান প্রসারিত. এখানে প্রবেশ করুন.
- প্লেটোইএসজি। কার্বন, ক্লিনটেক, শক্তি, পরিবেশ সৌর, বর্জ্য ব্যবস্থাপনা. এখানে প্রবেশ করুন.
- প্লেটো হেলথ। বায়োটেক এবং ক্লিনিক্যাল ট্রায়াল ইন্টেলিজেন্স। এখানে প্রবেশ করুন.
- উত্স: https://www.kdnuggets.com/how-to-access-and-use-gemini-api-for-free?utm_source=rss&utm_medium=rss&utm_campaign=how-to-access-and-use-gemini-api-for-free
- : আছে
- : হয়
- $ ইউপি
- 1
- 10
- 12
- 13
- 14
- 17
- 27
- 7
- 8
- 9
- a
- সম্পর্কে
- প্রবেশ
- সঠিক
- দিয়ে
- যোগ
- অতিরিক্ত
- অতিরিক্ত তথ্য
- অগ্রসর
- আবার
- AI
- বিদেশী
- সব
- অনুমতি
- প্রায়
- এছাড়াও
- আশ্চর্যজনক
- an
- এবং
- উত্তর
- নৃতাত্ত্বিক
- API
- API গুলি
- অ্যাপ্লিকেশন
- স্থাপত্য
- রয়েছি
- যুক্তি
- AS
- জিজ্ঞাসা করা
- At
- অডিও
- সুষম
- BE
- মানানসই
- হয়েছে
- আগে
- উচ্চতার চিহ্ন
- মধ্যে
- ব্লগ
- ব্লগ
- উভয়
- নির্মাণ করা
- ভবন
- নির্মিত
- ব্যবসা
- কিন্তু
- বোতাম
- by
- নামক
- CAN
- প্রার্থী
- প্রার্থী
- ক্ষমতা
- সক্ষম
- কেস
- মামলা
- সেন্টার
- প্রত্যয়িত
- চ্যাট
- চেক
- পরিস্কার করা
- ক্লিক
- কোড
- সহযোগিতা
- তুলনা করা
- তুলনা
- জটিল
- বিষয়বস্তু
- বিষয়বস্তু-সৃষ্টি
- প্রসঙ্গ
- কথোপকথন
- কথোপকথন
- রূপান্তর
- অনুরূপ
- আবরণ
- সৃষ্টি
- এখন
- প্রথা
- কাস্টমাইজ
- উপাত্ত
- তথ্য কেন্দ্র
- তথ্য বিজ্ঞান
- তথ্য বিজ্ঞানী
- তারিখ
- DeepMind
- ডিগ্রী
- ঘন
- পরিকল্পিত
- উন্নত
- ডেভেলপারদের
- ডিভাইস
- করিনি
- বিভিন্ন
- প্রদর্শন
- বিচিত্র
- do
- কাগজপত্র
- ডন
- ডটএ
- Dota 2
- নিচে
- সহজে
- সহজ
- দক্ষ
- দক্ষতার
- এম্বেডিং
- প্রকৌশল
- সমগ্র
- পরিবেশ
- থার (eth)
- আশা করা
- বিশেষজ্ঞদের
- ব্যাখ্যা করা
- অন্বেষণ করুণ
- দ্রুত
- প্রথম
- নমনীয়
- মনোযোগ
- অনুসরণ করা
- জন্য
- বিন্যাস
- বিনামূল্যে
- থেকে
- ক্রিয়া
- ক্রিয়াকলাপ
- খেলা
- মিথুনরাশি
- উত্পাদন করা
- প্রজন্ম
- পাওয়া
- GIF
- Go
- চালু
- ভাল
- গুগল
- Google এর
- চিত্রলেখ
- গ্রাফ নিউরাল নেটওয়ার্ক
- কৌশল
- ছিল
- আছে
- জমিদারি
- he
- সাহায্য
- এখানে
- হিরোস
- উচ্চ
- অত্যন্ত
- তার
- ইতিহাস
- ঝুলিতে
- কিভাবে
- কিভাবে
- যাহোক
- HTTPS দ্বারা
- মানবীয়
- i
- চিহ্নিত
- অসুস্থতা
- ভাবমূর্তি
- চিত্র
- আমদানি
- in
- সুদ্ধ
- ক্রমবর্ধমানভাবে
- তথ্য
- আরম্ভ করা
- ইনস্টল
- উদাহরণ
- পরিবর্তে
- ইন্টিগ্রেশন
- মধ্যে
- পরিচায়ক
- IT
- এর
- JPG
- জুলিয়া
- মাত্র
- কেডনুগেটস
- চাবি
- জ্ঞান
- ভাষা
- বৃহত্তম
- শিখতে
- জ্ঞানী
- শিক্ষা
- মত
- অসীম
- লিঙ্কডইন
- তালিকা
- বোঝা
- আর
- ভালবাসে
- মেশিন
- মেশিন লার্নিং
- তৈরি করে
- ব্যবস্থাপনা
- অনেক
- বৃহদায়তন
- মালিক
- সর্বোচ্চ
- me
- অর্থ
- মানে
- মানসিক
- মানসিক অসুখ
- ছন্দোবিজ্ঞান
- মোবাইল
- মোবাইল ডিভাইস
- মোড
- মডেল
- মডেল
- অধিক
- সেতু
- বহু
- নাম
- ন্যানো
- এন বি এ
- নেটওয়ার্ক
- নিউরাল
- স্নায়বিক নেটওয়ার্ক
- নতুন
- পরবর্তী
- এখন
- লক্ষ্য
- of
- on
- ONE
- কেবল
- OpenAI
- পরিচালনা করা
- or
- OS
- আমাদের
- বাইরে
- ছাড়িয়া যাত্তয়া
- আউটপুট
- প্রাসাদ
- বিশেষ
- পাসিং
- নির্ভুল
- কর্মক্ষমতা
- করণ
- ব্যক্তিগত
- ছবি
- টুকরা
- Plato
- প্লেটো ডেটা ইন্টেলিজেন্স
- প্লেটোডাটা
- কেলি
- দয়া করে
- বিন্দু
- জনপ্রিয়
- সম্ভাবনার
- সম্ভব
- পোস্ট
- সম্ভাব্য
- আগে
- জন্য
- সমস্যা
- সমস্যা সমাধান
- পণ্য
- পেশাদারী
- প্রদান
- প্রদত্ত
- প্রদানের
- পাইথন
- গুণ
- প্রশ্নের
- প্রশ্ন
- পুরোপুরি
- পরিসর
- RE
- উল্লেখ
- প্রতিনিধিত্ব
- প্রতিনিধিত্ব
- গবেষণা
- প্রতিক্রিয়া
- প্রতিক্রিয়া
- ফল
- বিপ্লব করা
- s
- একই
- রক্ষা
- স্কেলেবিলিটি
- স্কেল
- স্কেল ai
- বিজ্ঞান
- বিজ্ঞানী
- স্ক্রল
- অধ্যায়
- দেখ
- নির্বাচন করা
- সেশন
- সেট
- বিন্যাস
- বিভিন্ন
- শেয়ার
- সংক্ষিপ্ত
- উচিত
- অনুরূপ
- সহজ
- একক
- So
- সমাধানে
- স্থান
- বিশেষভাবে
- শুরু
- শুরু
- রাষ্ট্র-এর-শিল্প
- ধাপ
- থামুন
- বন্ধ
- গল্প
- প্রবাহ
- স্ট্রিমিং
- সংগ্রাম
- শিক্ষার্থীরা
- শৈলী
- উপযুক্ত
- পৃষ্ঠতল
- সিস্টেম
- T
- কাজ
- দল
- কারিগরী
- প্রযুক্তি
- প্রযুক্তিঃ
- টেলিযোগাযোগ
- পরীক্ষা
- পরীক্ষা
- পাঠ
- পাঠ্য প্রজন্ম
- যে
- সার্জারির
- তাদের
- তাহাদিগকে
- তারপর
- এই
- তিন
- দ্বারা
- থেকে
- টোকেন
- ভ্রমণ
- ব্যাধি
- অভিভাবকসংবঁধীয়
- ধরনের
- সীমাতিক্রান্ত
- বোঝা
- বোধশক্তি
- us
- উপভোগ্য
- ব্যবহার
- ব্যবহারকারী
- ব্যবহার
- পরিবর্তনশীল
- বিভিন্ন
- ভিডিও
- দৃষ্টি
- চাক্ষুষ
- ছিল
- উপায়..
- we
- কি
- যে
- হু
- ব্যাপক
- প্রশস্ত পরিসর
- ইচ্ছা
- সঙ্গে
- শব্দ
- শব্দ
- হয়া যাই ?
- বিশ্ব
- লেখা
- লেখা
- আপনি
- আপনার
- zephyrnet