How To Access And Use Gemini API For Free - KDnuggets

প্লেটো দ্বারা প্রকাশিত

অনুসরণকারী: 0

কীভাবে বিনামূল্যে জেমিনি API অ্যাক্সেস এবং ব্যবহার করবেন
লেখকের ছবি

Gemini হল Google দ্বারা তৈরি একটি নতুন মডেল এবং Bard আবার ব্যবহারযোগ্য হয়ে উঠছে৷ মিথুনের সাহায্যে, এখন আপনার প্রশ্নের প্রায় নিখুঁত উত্তর পাওয়া সম্ভব তাদের ছবি, অডিও এবং টেক্সট দিয়ে।

এই টিউটোরিয়ালে, আমরা Gemini API সম্পর্কে শিখব এবং কীভাবে এটি আপনার মেশিনে সেট আপ করবেন। আমরা টেক্সট জেনারেশন এবং ইমেজ বোঝার সহ বিভিন্ন Python API ফাংশনও এক্সপ্লোর করব।

মিথুনরাশি এটি একটি নতুন এআই মডেল যা গুগল রিসার্চ এবং গুগল ডিপমাইন্ড সহ Google-এর দলের মধ্যে সহযোগিতার মাধ্যমে তৈরি করা হয়েছে। এটি বিশেষভাবে মাল্টিমোডাল হওয়ার জন্য তৈরি করা হয়েছিল, যার অর্থ এটি পাঠ্য, কোড, অডিও, চিত্র এবং ভিডিওর মতো বিভিন্ন ধরণের ডেটা বুঝতে এবং কাজ করতে পারে।

মিথুন হল এখন পর্যন্ত Google দ্বারা তৈরি করা সবচেয়ে উন্নত এবং বৃহত্তম AI মডেল৷ এটি অত্যন্ত নমনীয় হওয়ার জন্য ডিজাইন করা হয়েছে যাতে এটি ডেটা সেন্টার থেকে মোবাইল ডিভাইস পর্যন্ত বিস্তৃত সিস্টেমে দক্ষতার সাথে কাজ করতে পারে। এর মানে হল যে ব্যবসা এবং বিকাশকারীরা AI অ্যাপ্লিকেশনগুলি তৈরি করতে এবং স্কেল করতে পারে সেই পদ্ধতিতে এটি বিপ্লব করার সম্ভাবনা রয়েছে।

এখানে জেমিনি মডেলের তিনটি সংস্করণ রয়েছে যা বিভিন্ন ব্যবহারের ক্ষেত্রে ডিজাইন করা হয়েছে:

মিথুন আল্ট্রা: সবচেয়ে বড় এবং সবচেয়ে উন্নত AI জটিল কাজ সম্পাদন করতে সক্ষম।
মিথুন প্রো: একটি ভারসাম্যপূর্ণ মডেল যা ভাল কর্মক্ষমতা এবং মাপযোগ্যতা আছে।
মিথুন ন্যানো: মোবাইল ডিভাইসের জন্য সবচেয়ে কার্যকর।

কীভাবে বিনামূল্যে জেমিনি API অ্যাক্সেস এবং ব্যবহার করবেন
চিত্র থেকে মিথুনের সাথে পরিচয়

জেমিনি আল্ট্রার অত্যাধুনিক পারফরম্যান্স রয়েছে, যা বিভিন্ন মেট্রিক্সে GPT-4-এর পারফরম্যান্সকে ছাড়িয়ে গেছে। এটি ম্যাসিভ মাল্টিটাস্ক ল্যাঙ্গুয়েজ আন্ডারস্ট্যান্ডিং বেঞ্চমার্কে মানব বিশেষজ্ঞদের ছাড়িয়ে যাওয়ার প্রথম মডেল, যা 57টি বিভিন্ন বিষয়ে বিশ্ব জ্ঞান এবং সমস্যা সমাধানের পরীক্ষা করে। এটি এর উন্নত বোঝাপড়া এবং সমস্যা সমাধানের ক্ষমতা প্রদর্শন করে।

API ব্যবহার করার জন্য, আমাদের প্রথমে একটি API কী পেতে হবে যা আপনি এখান থেকে করতে পারেন: https://ai.google.dev/tutorials/setup

কীভাবে বিনামূল্যে জেমিনি API অ্যাক্সেস এবং ব্যবহার করবেন

তারপরে "একটি API কী পান" বোতামে ক্লিক করুন এবং তারপরে "নতুন প্রকল্পে API কী তৈরি করুন" এ ক্লিক করুন।

কীভাবে বিনামূল্যে জেমিনি API অ্যাক্সেস এবং ব্যবহার করবেন

API কীটি অনুলিপি করুন এবং এটি একটি পরিবেশ পরিবর্তনশীল হিসাবে সেট করুন। আমরা ডিপনোট ব্যবহার করছি এবং "GEMINI_API_KEY" নাম দিয়ে কী সেট করা আমাদের পক্ষে বেশ সহজ। শুধু ইন্টিগ্রেশনে যান, নিচে স্ক্রোল করুন এবং পরিবেশ ভেরিয়েবল নির্বাচন করুন।

কীভাবে বিনামূল্যে জেমিনি API অ্যাক্সেস এবং ব্যবহার করবেন

পরবর্তী ধাপে, আমরা PIP ব্যবহার করে Python API ইনস্টল করব:

pip install -q -U google-generativeai

এর পরে, আমরা Google-এর GenAI-তে API কী সেট করব এবং উদাহরণটি শুরু করব।

import google.generativeai as genai
import os

gemini_api_key = os.environ["GEMINI_API_KEY"]
genai.configure(api_key = gemini_api_key)

API কী সেট আপ করার পরে, সামগ্রী তৈরি করতে Gemini Pro মডেল ব্যবহার করা সহজ। `generate_content` ফাংশনে একটি প্রম্পট প্রদান করুন এবং আউটপুটটিকে মার্কডাউন হিসেবে প্রদর্শন করুন।

from IPython.display import Markdown

model = genai.GenerativeModel('gemini-pro')
response = model.generate_content("Who is the GOAT in the NBA?")

Markdown(response.text)

এটি আশ্চর্যজনক, তবে আমি তালিকার সাথে একমত নই। যাইহোক, আমি বুঝতে পারি যে এটি ব্যক্তিগত পছন্দ সম্পর্কে।

কীভাবে বিনামূল্যে জেমিনি API অ্যাক্সেস এবং ব্যবহার করবেন

মিথুন একক প্রম্পটের জন্য একাধিক প্রতিক্রিয়া তৈরি করতে পারে, যাকে প্রার্থী বলা হয়। আপনি সবচেয়ে উপযুক্ত একটি নির্বাচন করতে পারেন. আমাদের ক্ষেত্রে, আমাদের শুধুমাত্র একটি প্রতিক্রিয়া ছিল।

response.candidates

কীভাবে বিনামূল্যে জেমিনি API অ্যাক্সেস এবং ব্যবহার করবেন

আসুন এটিকে পাইথনে একটি সাধারণ গেম লিখতে বলি।

response = model.generate_content("Build a simple game in Python")

Markdown(response.text)

ফলাফল সহজ এবং পয়েন্ট. বেশিরভাগ এলএলএম পাইথন কোড লেখার পরিবর্তে ব্যাখ্যা করতে শুরু করে।

কীভাবে বিনামূল্যে জেমিনি API অ্যাক্সেস এবং ব্যবহার করবেন

আপনি `generation_config` আর্গুমেন্ট ব্যবহার করে আপনার প্রতিক্রিয়া কাস্টমাইজ করতে পারেন। আমরা প্রার্থীর সংখ্যা 1-এ সীমাবদ্ধ করছি, স্টপ শব্দ "স্পেস" যোগ করছি এবং সর্বোচ্চ টোকেন এবং তাপমাত্রা সেট করছি।

response = model.generate_content(
    'Write a short story about aliens.',
    generation_config=genai.types.GenerationConfig(
        candidate_count=1,
        stop_sequences=['space'],
        max_output_tokens=200,
        temperature=0.7)
)

Markdown(response.text)

আপনি দেখতে পাচ্ছেন, "স্পেস" শব্দের আগে প্রতিক্রিয়া বন্ধ হয়ে গেছে। আশ্চর্যজনক।

কীভাবে বিনামূল্যে জেমিনি API অ্যাক্সেস এবং ব্যবহার করবেন

আপনি প্রতিক্রিয়া স্ট্রিম করতে `স্ট্রিম` যুক্তি ব্যবহার করতে পারেন। এটি অ্যানথ্রোপিক এবং ওপেনএআই API-এর মতো কিন্তু দ্রুত।

model = genai.GenerativeModel('gemini-pro')
response = model.generate_content("Write a Julia function for cleaning the data.", stream=True)

for chunk in response:
    print(chunk.text)

কীভাবে বিনামূল্যে জেমিনি API অ্যাক্সেস এবং ব্যবহার করবেন

এই বিভাগে, আমরা লোড হবে মাসুদ আসলামীর ছবি এবং জেমিনি প্রো ভিশনের মাল্টিমোডালিটি পরীক্ষা করতে এটি ব্যবহার করুন।

ছবিগুলিকে 'পিআইএল'-এ লোড করুন এবং এটি প্রদর্শন করুন।

import PIL.Image

img = PIL.Image.open('images/photo-1.jpg')

img

আমাদের কাছে রুয়া অগাস্টা আর্চের একটি উচ্চ মানের ছবি রয়েছে।

কীভাবে বিনামূল্যে জেমিনি API অ্যাক্সেস এবং ব্যবহার করবেন

আসুন জেমিনি প্রো ভিশন মডেলটি লোড করি এবং এটি চিত্রের সাথে সরবরাহ করি।

model = genai.GenerativeModel('gemini-pro-vision')

response = model.generate_content(img)

Markdown(response.text)

মডেলটি সঠিকভাবে প্রাসাদটিকে চিহ্নিত করেছে এবং এর ইতিহাস এবং স্থাপত্য সম্পর্কে অতিরিক্ত তথ্য প্রদান করেছে।

কীভাবে বিনামূল্যে জেমিনি API অ্যাক্সেস এবং ব্যবহার করবেন

আসুন GPT-4-এ একই চিত্র প্রদান করি এবং চিত্রটি সম্পর্কে জিজ্ঞাসা করি। উভয় মডেল প্রায় অনুরূপ উত্তর প্রদান করেছে. কিন্তু আমি GPT-4 প্রতিক্রিয়া বেশি পছন্দ করি।

কীভাবে বিনামূল্যে জেমিনি API অ্যাক্সেস এবং ব্যবহার করবেন

আমরা এখন API এ পাঠ্য এবং চিত্র প্রদান করব। আমরা ভিশন মডেলকে রেফারেন্স হিসাবে ছবিটি ব্যবহার করে একটি ভ্রমণ ব্লগ লিখতে বলেছি।

response = model.generate_content(["Write a travel blog post using the image as reference.", img])

Markdown(response.text)

এটি আমাকে একটি ছোট ব্লগ প্রদান করেছে। আমি দীর্ঘ ফর্ম্যাট আশা করছিলাম.

কীভাবে বিনামূল্যে জেমিনি API অ্যাক্সেস এবং ব্যবহার করবেন

GPT-4 এর তুলনায়, জেমিনি প্রো ভিশন মডেলটি একটি দীর্ঘ-ফরম্যাট ব্লগ তৈরি করতে সংগ্রাম করেছে।

কীভাবে বিনামূল্যে জেমিনি API অ্যাক্সেস এবং ব্যবহার করবেন

আমরা সামনে-আগে চ্যাট সেশনের জন্য মডেল সেট আপ করতে পারি। এইভাবে, মডেল পূর্ববর্তী কথোপকথন ব্যবহার করে প্রসঙ্গ এবং প্রতিক্রিয়া মনে রাখে।

আমাদের ক্ষেত্রে, আমরা চ্যাট সেশন শুরু করেছি এবং মডেলকে বলেছি আমাকে Dota 2 গেমটি শুরু করতে সাহায্য করতে।

model = genai.GenerativeModel('gemini-pro')

chat = model.start_chat(history=[])

chat.send_message("Can you please guide me on how to start playing Dota 2?")

chat.history

আপনি দেখতে পাচ্ছেন, `চ্যাট` অবজেক্ট ব্যবহারকারী এবং মোড চ্যাটের ইতিহাস সংরক্ষণ করছে।

কীভাবে বিনামূল্যে জেমিনি API অ্যাক্সেস এবং ব্যবহার করবেন

কীভাবে বিনামূল্যে জেমিনি API অ্যাক্সেস এবং ব্যবহার করবেন

আমরা তাদের একটি মার্কডাউন শৈলীতে প্রদর্শন করতে পারি।

for message in chat.history:
    display(Markdown(f'**{message.role}**: {message.parts[0].text}'))

কীভাবে বিনামূল্যে জেমিনি API অ্যাক্সেস এবং ব্যবহার করবেন

এর ফলো আপ প্রশ্ন জিজ্ঞাসা করা যাক.

chat.send_message("Which Dota 2 heroes should I start with?")

for message in chat.history:
    display(Markdown(f'**{message.role}**: {message.parts[0].text}'))

আমরা নীচে স্ক্রোল করতে পারি এবং মডেলের সাথে পুরো সেশনটি দেখতে পারি।

কীভাবে বিনামূল্যে জেমিনি API অ্যাক্সেস এবং ব্যবহার করবেন

প্রসঙ্গ-সচেতন অ্যাপ্লিকেশনগুলির জন্য এমবেডিং মডেলগুলি ক্রমশ জনপ্রিয় হয়ে উঠছে৷ Gemini এম্বেডিং-001 মডেল শব্দ, বাক্য বা সম্পূর্ণ নথিকে ঘন ভেক্টর হিসাবে উপস্থাপন করার অনুমতি দেয় যা শব্দার্থগত অর্থ এনকোড করে। এই ভেক্টর উপস্থাপনাটি তাদের সংশ্লিষ্ট এমবেডিং ভেক্টরগুলির তুলনা করে পাঠ্যের বিভিন্ন অংশের মধ্যে সাদৃশ্য তুলনা করা সহজ করে তোলে।

আমরা বিষয়বস্তুকে `এম্বেড_কন্টেন্ট` প্রদান করতে পারি এবং পাঠ্যকে এম্বেডিং-এ রূপান্তর করতে পারি। এটা যে সহজ.

output = genai.embed_content(
    model="models/embedding-001",
    content="Can you please guide me on how to start playing Dota 2?",
    task_type="retrieval_document",
    title="Embedding of Dota 2 question")

print(output['embedding'][0:10])

[0.060604308, -0.023885584, -0.007826327, -0.070592545, 0.021225851, 0.043229062, 0.06876691, 0.049298503, 0.039964676, 0.08291664]

আমরা 'কন্টেন্ট' আর্গুমেন্টে স্ট্রিংগুলির একটি তালিকা পাস করে পাঠ্যের একাধিক অংশকে এমবেডিংয়ে রূপান্তর করতে পারি।

output = genai.embed_content(
    model="models/embedding-001",
    content=[
        "Can you please guide me on how to start playing Dota 2?",
        "Which Dota 2 heroes should I start with?",
    ],
    task_type="retrieval_document",
    title="Embedding of Dota 2 question")

for emb in output['embedding']:
    print(emb[:10])

[0.060604308, -0.023885584, -0.007826327, -0.070592545, 0.021225851, 0.043229062, 0.06876691, 0.049298503, 0.039964676, 0.08291664]

[0.04775657, -0.044990525, -0.014886052, -0.08473655, 0.04060122, 0.035374347, 0.031866882, 0.071754575, 0.042207796, 0.04577447]

আপনার যদি একই ফলাফল পুনরুত্পাদন করতে সমস্যা হয় তবে আমার দেখুন ডিপনোট ওয়ার্কস্পেস.

অনেক উন্নত ফাংশন আছে যা আমরা এই পরিচায়ক টিউটোরিয়ালে কভার করিনি। আপনি গিয়ে Gemini API সম্পর্কে আরও জানতে পারেন Gemini API: Python এর সাথে Quickstart.

এই টিউটোরিয়ালে, আমরা জেনেছি জেমিনি সম্পর্কে এবং কীভাবে প্রতিক্রিয়া তৈরি করতে পাইথন API অ্যাক্সেস করতে হয়। বিশেষ করে, আমরা টেক্সট জেনারেশন, ভিজ্যুয়াল বোঝাপড়া, স্ট্রিমিং, কথোপকথনের ইতিহাস, কাস্টম আউটপুট এবং এম্বেডিং সম্পর্কে শিখেছি। যাইহোক, এটি মিথুন কি করতে পারে তার উপরিভাগে স্ক্র্যাচ করে।

বিনামূল্যে Gemini API ব্যবহার করে আপনি যা তৈরি করেছেন তা নির্দ্বিধায় আমার সাথে ভাগ করুন৷ সম্ভাবনা সীমাহীন।

আবিদ আলী আওয়ান (@1 আবিদালিয়াওয়ান) একজন প্রত্যয়িত ডেটা সায়েন্টিস্ট পেশাদার যিনি মেশিন লার্নিং মডেল তৈরি করতে পছন্দ করেন। বর্তমানে, তিনি মেশিন লার্নিং এবং ডেটা সায়েন্স টেকনোলজিতে বিষয়বস্তু তৈরি এবং প্রযুক্তিগত ব্লগ লেখার উপর মনোযোগ নিবদ্ধ করছেন। আবিদ টেকনোলজি ম্যানেজমেন্টে স্নাতকোত্তর ডিগ্রি এবং টেলিকমিউনিকেশন ইঞ্জিনিয়ারিংয়ে স্নাতক ডিগ্রি অর্জন করেছেন। তার দৃষ্টিভঙ্গি মানসিক অসুস্থতার সাথে সংগ্রামরত শিক্ষার্থীদের জন্য একটি গ্রাফ নিউরাল নেটওয়ার্ক ব্যবহার করে একটি AI পণ্য তৈরি করা।