How To Access And Use Gemini API For Free - KDnuggets

افلاطون کے ذریعہ دوبارہ شائع کیا گیا۔

فالونگ: 0

مفت میں Gemini API تک رسائی اور استعمال کرنے کا طریقہ
مصنف کی طرف سے تصویر

جیمنی گوگل کی طرف سے تیار کردہ ایک نیا ماڈل ہے، اور بارڈ دوبارہ قابل استعمال ہو رہا ہے۔ جیمنی کے ساتھ، اب یہ ممکن ہے کہ آپ کے سوالات کے تقریباً کامل جوابات تصاویر، آڈیو اور متن فراہم کر کے حاصل کریں۔

اس ٹیوٹوریل میں، ہم Gemini API کے بارے میں اور اسے آپ کی مشین پر سیٹ اپ کرنے کا طریقہ سیکھیں گے۔ ہم مختلف Python API فنکشنز کو بھی دریافت کریں گے، بشمول ٹیکسٹ جنریشن اور امیج کو سمجھنا۔

جیمنی ایک نیا AI ماڈل ہے جسے Google کی ٹیموں کے درمیان تعاون کے ذریعے تیار کیا گیا ہے، بشمول Google Research اور Google DeepMind۔ اسے خاص طور پر ملٹی موڈل بنانے کے لیے بنایا گیا تھا، یعنی یہ متن، کوڈ، آڈیو، امیجز اور ویڈیو جیسے مختلف قسم کے ڈیٹا کو سمجھ اور کام کر سکتا ہے۔

جیمنی گوگل کے ذریعہ اب تک کا سب سے جدید اور سب سے بڑا AI ماڈل ہے۔ اسے انتہائی لچکدار بنانے کے لیے ڈیزائن کیا گیا ہے تاکہ یہ ڈیٹا سینٹرز سے لے کر موبائل ڈیوائسز تک وسیع پیمانے پر سسٹمز پر مؤثر طریقے سے کام کر سکے۔ اس کا مطلب یہ ہے کہ اس میں اس طریقے سے انقلاب لانے کی صلاحیت ہے جس میں کاروبار اور ڈویلپر AI ایپلی کیشنز کی تعمیر اور اسکیل کرسکتے ہیں۔

یہاں جیمنی ماڈل کے تین ورژن ہیں جو مختلف استعمال کے معاملات کے لیے بنائے گئے ہیں:

جیمنی الٹرا: سب سے بڑا اور جدید ترین AI پیچیدہ کام انجام دینے کے قابل ہے۔
جیمنی پرو: ایک متوازن ماڈل جس میں اچھی کارکردگی اور اسکیل ایبلٹی ہے۔
جیمنی نینو: موبائل آلات کے لیے سب سے زیادہ موثر۔

مفت میں Gemini API تک رسائی اور استعمال کرنے کا طریقہ
سے تصویر جیمنی کا تعارف

جیمنی الٹرا میں جدید ترین کارکردگی ہے، جو کئی میٹرکس پر GPT-4 کی کارکردگی سے زیادہ ہے۔ یہ ماسیو ملٹی ٹاسک لینگویج انڈرسٹینڈنگ بینچ مارک پر انسانی ماہرین کو پیچھے چھوڑنے والا پہلا ماڈل ہے، جو 57 متنوع مضامین میں عالمی علم اور مسائل کے حل کی جانچ کرتا ہے۔ یہ اس کی اعلی درجے کی تفہیم اور مسئلہ حل کرنے کی صلاحیتوں کو ظاہر کرتا ہے۔

API استعمال کرنے کے لیے، ہمیں پہلے ایک API کلید حاصل کرنی ہوگی جسے آپ یہاں سے حاصل کرسکتے ہیں: https://ai.google.dev/tutorials/setup

مفت میں Gemini API تک رسائی اور استعمال کرنے کا طریقہ

اس کے بعد "ایک API کلید حاصل کریں" بٹن پر کلک کریں اور پھر "نئے پروجیکٹ میں API کلید بنائیں" پر کلک کریں۔

مفت میں Gemini API تک رسائی اور استعمال کرنے کا طریقہ

API کلید کو کاپی کریں اور اسے ماحولیاتی متغیر کے طور پر سیٹ کریں۔ ہم ڈیپ نوٹ استعمال کر رہے ہیں اور "GEMINI_API_KEY" نام کے ساتھ کلید سیٹ کرنا ہمارے لیے کافی آسان ہے۔ بس انضمام پر جائیں، نیچے سکرول کریں اور ماحولیاتی متغیرات کو منتخب کریں۔

مفت میں Gemini API تک رسائی اور استعمال کرنے کا طریقہ

اگلے مرحلے میں، ہم PIP کا استعمال کرتے ہوئے Python API انسٹال کریں گے:

pip install -q -U google-generativeai

اس کے بعد، ہم API کلید کو گوگل کے GenAI پر سیٹ کریں گے اور مثال شروع کریں گے۔

import google.generativeai as genai
import os

gemini_api_key = os.environ["GEMINI_API_KEY"]
genai.configure(api_key = gemini_api_key)

API کلید کو ترتیب دینے کے بعد، مواد تیار کرنے کے لیے Gemini Pro ماڈل کا استعمال کرنا آسان ہے۔ 'generate_content' فنکشن کو ایک پرامپٹ فراہم کریں اور آؤٹ پٹ کو مارک ڈاؤن کے بطور ڈسپلے کریں۔

from IPython.display import Markdown

model = genai.GenerativeModel('gemini-pro')
response = model.generate_content("Who is the GOAT in the NBA?")

Markdown(response.text)

یہ حیرت انگیز ہے، لیکن میں اس فہرست سے متفق نہیں ہوں۔ تاہم، میں سمجھتا ہوں کہ یہ سب ذاتی ترجیح کے بارے میں ہے۔

مفت میں Gemini API تک رسائی اور استعمال کرنے کا طریقہ

جیمنی ایک پرامپٹ کے لیے متعدد ردعمل پیدا کر سکتا ہے، جسے امیدوار کہتے ہیں۔ آپ سب سے موزوں کو منتخب کر سکتے ہیں۔ ہمارے معاملے میں، ہمارے پاس صرف ایک ہی جواب تھا۔

response.candidates

مفت میں Gemini API تک رسائی اور استعمال کرنے کا طریقہ

آئیے اسے Python میں ایک سادہ گیم لکھنے کو کہتے ہیں۔

response = model.generate_content("Build a simple game in Python")

Markdown(response.text)

نتیجہ سادہ اور نقطہ نظر ہے. زیادہ تر ایل ایل ایم ازگر کوڈ لکھنے کے بجائے اسے سمجھانا شروع کر دیتے ہیں۔

مفت میں Gemini API تک رسائی اور استعمال کرنے کا طریقہ

آپ `generation_config` دلیل کا استعمال کرتے ہوئے اپنے جواب کو حسب ضرورت بنا سکتے ہیں۔ ہم امیدواروں کی تعداد کو 1 تک محدود کر رہے ہیں، سٹاپ لفظ "اسپیس" شامل کر رہے ہیں اور زیادہ سے زیادہ ٹوکن اور درجہ حرارت سیٹ کر رہے ہیں۔

response = model.generate_content(
    'Write a short story about aliens.',
    generation_config=genai.types.GenerationConfig(
        candidate_count=1,
        stop_sequences=['space'],
        max_output_tokens=200,
        temperature=0.7)
)

Markdown(response.text)

جیسا کہ آپ دیکھ سکتے ہیں، جواب لفظ "اسپیس" سے پہلے رک گیا۔ حیرت انگیز

مفت میں Gemini API تک رسائی اور استعمال کرنے کا طریقہ

آپ جواب کو اسٹریم کرنے کے لیے `سٹریم` دلیل بھی استعمال کر سکتے ہیں۔ یہ Anthropic اور OpenAI APIs کی طرح ہے لیکن تیز ہے۔

model = genai.GenerativeModel('gemini-pro')
response = model.generate_content("Write a Julia function for cleaning the data.", stream=True)

for chunk in response:
    print(chunk.text)

مفت میں Gemini API تک رسائی اور استعمال کرنے کا طریقہ

اس سیکشن میں، ہم لوڈ کریں گے مسعود اسلمی۔ تصویر بنائیں اور جیمنی پرو ویژن کی کثیر موڈیالٹی کو جانچنے کے لیے اس کا استعمال کریں۔

تصاویر کو 'PIL' میں لوڈ کریں اور اسے ڈسپلے کریں۔

import PIL.Image

img = PIL.Image.open('images/photo-1.jpg')

img

ہمارے پاس Rua Augusta Arch کی اعلیٰ معیار کی تصویر ہے۔

مفت میں Gemini API تک رسائی اور استعمال کرنے کا طریقہ

آئیے جیمنی پرو ویژن ماڈل کو لوڈ کریں اور اسے امیج فراہم کریں۔

model = genai.GenerativeModel('gemini-pro-vision')

response = model.generate_content(img)

Markdown(response.text)

ماڈل نے محل کی درست شناخت کی اور اس کی تاریخ اور فن تعمیر کے بارے میں اضافی معلومات فراہم کیں۔

مفت میں Gemini API تک رسائی اور استعمال کرنے کا طریقہ

آئیے وہی تصویر GPT-4 کو فراہم کریں اور اس سے تصویر کے بارے میں پوچھیں۔ دونوں ماڈلز نے تقریباً ایک جیسے جوابات فراہم کیے ہیں۔ لیکن مجھے GPT-4 جواب زیادہ پسند ہے۔

مفت میں Gemini API تک رسائی اور استعمال کرنے کا طریقہ

اب ہم API کو متن اور تصویر فراہم کریں گے۔ ہم نے وژن ماڈل سے کہا ہے کہ وہ تصویر کو بطور حوالہ استعمال کرتے ہوئے ایک سفری بلاگ لکھے۔

response = model.generate_content(["Write a travel blog post using the image as reference.", img])

Markdown(response.text)

اس نے مجھے ایک مختصر بلاگ فراہم کیا ہے۔ میں طویل فارمیٹ کی توقع کر رہا تھا۔

مفت میں Gemini API تک رسائی اور استعمال کرنے کا طریقہ

GPT-4 کے مقابلے میں، Gemini Pro Vision ماڈل نے طویل فارمیٹ کا بلاگ بنانے کے لیے جدوجہد کی ہے۔

مفت میں Gemini API تک رسائی اور استعمال کرنے کا طریقہ

ہم آگے پیچھے چیٹ سیشن کے لیے ماڈل ترتیب دے سکتے ہیں۔ اس طرح، ماڈل پچھلی بات چیت کا استعمال کرتے ہوئے سیاق و سباق اور جواب کو یاد رکھتا ہے۔

ہمارے معاملے میں، ہم نے چیٹ سیشن شروع کیا ہے اور ماڈل سے کہا ہے کہ وہ ڈوٹا 2 گیم شروع کرنے میں میری مدد کرے۔

model = genai.GenerativeModel('gemini-pro')

chat = model.start_chat(history=[])

chat.send_message("Can you please guide me on how to start playing Dota 2?")

chat.history

جیسا کہ آپ دیکھ سکتے ہیں، `چیٹ` آبجیکٹ صارف کی تاریخ اور موڈ چیٹ کو محفوظ کر رہا ہے۔

مفت میں Gemini API تک رسائی اور استعمال کرنے کا طریقہ

مفت میں Gemini API تک رسائی اور استعمال کرنے کا طریقہ

ہم انہیں مارک ڈاؤن اسٹائل میں بھی ڈسپلے کر سکتے ہیں۔

for message in chat.history:
    display(Markdown(f'**{message.role}**: {message.parts[0].text}'))

مفت میں Gemini API تک رسائی اور استعمال کرنے کا طریقہ

آئیے فالو اپ سوال پوچھیں۔

chat.send_message("Which Dota 2 heroes should I start with?")

for message in chat.history:
    display(Markdown(f'**{message.role}**: {message.parts[0].text}'))

ہم نیچے سکرول کر سکتے ہیں اور ماڈل کے ساتھ پورا سیشن دیکھ سکتے ہیں۔

مفت میں Gemini API تک رسائی اور استعمال کرنے کا طریقہ

سیاق و سباق سے آگاہ ایپلی کیشنز کے لیے سرایت کرنے والے ماڈل تیزی سے مقبول ہو رہے ہیں۔ Gemini embedding-001 ماڈل الفاظ، جملے، یا مکمل دستاویزات کو گھنے ویکٹر کے طور پر پیش کرنے کی اجازت دیتا ہے جو سیمنٹک معنی کو انکوڈ کرتے ہیں۔ یہ ویکٹر کی نمائندگی متن کے مختلف ٹکڑوں کے درمیان ان کے متعلقہ سرایت کرنے والے ویکٹروں کا موازنہ کرکے آسانی سے مماثلت کا موازنہ کرنا ممکن بناتی ہے۔

ہم مواد کو `embed_content` کو فراہم کر سکتے ہیں اور متن کو سرایت کرنے میں تبدیل کر سکتے ہیں۔ یہ اتنا ہی آسان ہے۔

output = genai.embed_content(
    model="models/embedding-001",
    content="Can you please guide me on how to start playing Dota 2?",
    task_type="retrieval_document",
    title="Embedding of Dota 2 question")

print(output['embedding'][0:10])

[0.060604308, -0.023885584, -0.007826327, -0.070592545, 0.021225851, 0.043229062, 0.06876691, 0.049298503, 0.039964676, 0.08291664]

ہم سٹرنگز کی فہرست کو 'مواد' دلیل میں منتقل کر کے متن کے متعدد حصوں کو ایمبیڈنگ میں تبدیل کر سکتے ہیں۔

output = genai.embed_content(
    model="models/embedding-001",
    content=[
        "Can you please guide me on how to start playing Dota 2?",
        "Which Dota 2 heroes should I start with?",
    ],
    task_type="retrieval_document",
    title="Embedding of Dota 2 question")

for emb in output['embedding']:
    print(emb[:10])

[0.060604308, -0.023885584, -0.007826327, -0.070592545, 0.021225851, 0.043229062, 0.06876691, 0.049298503, 0.039964676, 0.08291664]

[0.04775657, -0.044990525, -0.014886052, -0.08473655, 0.04060122, 0.035374347, 0.031866882, 0.071754575, 0.042207796, 0.04577447]

اگر آپ کو وہی نتیجہ دوبارہ پیش کرنے میں دشواری ہو رہی ہے، تو میرا چیک کریں۔ ڈیپ نوٹ ورک اسپیس.

بہت سارے جدید فنکشنز ہیں جن کا ہم نے اس تعارفی ٹیوٹوریل میں احاطہ نہیں کیا۔ آپ Gemini API کے بارے میں مزید جان سکتے ہیں۔ Gemini API: Python کے ساتھ کوئیک اسٹارٹ.

اس ٹیوٹوریل میں، ہم نے Gemini کے بارے میں اور جوابات پیدا کرنے کے لیے Python API تک رسائی حاصل کرنے کا طریقہ سیکھا ہے۔ خاص طور پر، ہم نے ٹیکسٹ جنریشن، بصری تفہیم، سلسلہ بندی، گفتگو کی تاریخ، حسب ضرورت آؤٹ پٹ، اور ایمبیڈنگز کے بارے میں سیکھا ہے۔ تاہم، یہ صرف اس سطح کو کھرچتا ہے کہ جیمنی کیا کر سکتا ہے۔

مفت Gemini API کا استعمال کرتے ہوئے آپ نے جو کچھ بنایا ہے اسے بلا جھجھک مجھ سے شیئر کریں۔ امکانات لامحدود ہیں۔

عابد علی اعوان (@1abidaliawan) ایک سرٹیفائیڈ ڈیٹا سائنٹسٹ پروفیشنل ہے جو مشین لرننگ ماڈل بنانا پسند کرتا ہے۔ فی الحال، وہ مشین لرننگ اور ڈیٹا سائنس ٹیکنالوجیز پر مواد کی تخلیق اور تکنیکی بلاگ لکھنے پر توجہ دے رہا ہے۔ عابد کے پاس ٹیکنالوجی مینجمنٹ میں ماسٹر ڈگری اور ٹیلی کمیونیکیشن انجینئرنگ میں بیچلر ڈگری ہے۔ اس کا وژن دماغی بیماری کے ساتھ جدوجہد کرنے والے طلباء کے لیے گراف نیورل نیٹ ورک کا استعمال کرتے ہوئے ایک AI پروڈکٹ بنانا ہے۔