مصنف کی طرف سے تصویر
جیمنی گوگل کی طرف سے تیار کردہ ایک نیا ماڈل ہے، اور بارڈ دوبارہ قابل استعمال ہو رہا ہے۔ جیمنی کے ساتھ، اب یہ ممکن ہے کہ آپ کے سوالات کے تقریباً کامل جوابات تصاویر، آڈیو اور متن فراہم کر کے حاصل کریں۔
اس ٹیوٹوریل میں، ہم Gemini API کے بارے میں اور اسے آپ کی مشین پر سیٹ اپ کرنے کا طریقہ سیکھیں گے۔ ہم مختلف Python API فنکشنز کو بھی دریافت کریں گے، بشمول ٹیکسٹ جنریشن اور امیج کو سمجھنا۔
جیمنی ایک نیا AI ماڈل ہے جسے Google کی ٹیموں کے درمیان تعاون کے ذریعے تیار کیا گیا ہے، بشمول Google Research اور Google DeepMind۔ اسے خاص طور پر ملٹی موڈل بنانے کے لیے بنایا گیا تھا، یعنی یہ متن، کوڈ، آڈیو، امیجز اور ویڈیو جیسے مختلف قسم کے ڈیٹا کو سمجھ اور کام کر سکتا ہے۔
جیمنی گوگل کے ذریعہ اب تک کا سب سے جدید اور سب سے بڑا AI ماڈل ہے۔ اسے انتہائی لچکدار بنانے کے لیے ڈیزائن کیا گیا ہے تاکہ یہ ڈیٹا سینٹرز سے لے کر موبائل ڈیوائسز تک وسیع پیمانے پر سسٹمز پر مؤثر طریقے سے کام کر سکے۔ اس کا مطلب یہ ہے کہ اس میں اس طریقے سے انقلاب لانے کی صلاحیت ہے جس میں کاروبار اور ڈویلپر AI ایپلی کیشنز کی تعمیر اور اسکیل کرسکتے ہیں۔
یہاں جیمنی ماڈل کے تین ورژن ہیں جو مختلف استعمال کے معاملات کے لیے بنائے گئے ہیں:
- جیمنی الٹرا: سب سے بڑا اور جدید ترین AI پیچیدہ کام انجام دینے کے قابل ہے۔
- جیمنی پرو: ایک متوازن ماڈل جس میں اچھی کارکردگی اور اسکیل ایبلٹی ہے۔
- جیمنی نینو: موبائل آلات کے لیے سب سے زیادہ موثر۔
سے تصویر جیمنی کا تعارف
جیمنی الٹرا میں جدید ترین کارکردگی ہے، جو کئی میٹرکس پر GPT-4 کی کارکردگی سے زیادہ ہے۔ یہ ماسیو ملٹی ٹاسک لینگویج انڈرسٹینڈنگ بینچ مارک پر انسانی ماہرین کو پیچھے چھوڑنے والا پہلا ماڈل ہے، جو 57 متنوع مضامین میں عالمی علم اور مسائل کے حل کی جانچ کرتا ہے۔ یہ اس کی اعلی درجے کی تفہیم اور مسئلہ حل کرنے کی صلاحیتوں کو ظاہر کرتا ہے۔
API استعمال کرنے کے لیے، ہمیں پہلے ایک API کلید حاصل کرنی ہوگی جسے آپ یہاں سے حاصل کرسکتے ہیں: https://ai.google.dev/tutorials/setup
اس کے بعد "ایک API کلید حاصل کریں" بٹن پر کلک کریں اور پھر "نئے پروجیکٹ میں API کلید بنائیں" پر کلک کریں۔
API کلید کو کاپی کریں اور اسے ماحولیاتی متغیر کے طور پر سیٹ کریں۔ ہم ڈیپ نوٹ استعمال کر رہے ہیں اور "GEMINI_API_KEY" نام کے ساتھ کلید سیٹ کرنا ہمارے لیے کافی آسان ہے۔ بس انضمام پر جائیں، نیچے سکرول کریں اور ماحولیاتی متغیرات کو منتخب کریں۔
اگلے مرحلے میں، ہم PIP کا استعمال کرتے ہوئے Python API انسٹال کریں گے:
pip install -q -U google-generativeai
اس کے بعد، ہم API کلید کو گوگل کے GenAI پر سیٹ کریں گے اور مثال شروع کریں گے۔
import google.generativeai as genai
import os
gemini_api_key = os.environ["GEMINI_API_KEY"]
genai.configure(api_key = gemini_api_key)
API کلید کو ترتیب دینے کے بعد، مواد تیار کرنے کے لیے Gemini Pro ماڈل کا استعمال کرنا آسان ہے۔ 'generate_content' فنکشن کو ایک پرامپٹ فراہم کریں اور آؤٹ پٹ کو مارک ڈاؤن کے بطور ڈسپلے کریں۔
from IPython.display import Markdown
model = genai.GenerativeModel('gemini-pro')
response = model.generate_content("Who is the GOAT in the NBA?")
Markdown(response.text)
یہ حیرت انگیز ہے، لیکن میں اس فہرست سے متفق نہیں ہوں۔ تاہم، میں سمجھتا ہوں کہ یہ سب ذاتی ترجیح کے بارے میں ہے۔
جیمنی ایک پرامپٹ کے لیے متعدد ردعمل پیدا کر سکتا ہے، جسے امیدوار کہتے ہیں۔ آپ سب سے موزوں کو منتخب کر سکتے ہیں۔ ہمارے معاملے میں، ہمارے پاس صرف ایک ہی جواب تھا۔
response.candidates
آئیے اسے Python میں ایک سادہ گیم لکھنے کو کہتے ہیں۔
response = model.generate_content("Build a simple game in Python")
Markdown(response.text)
نتیجہ سادہ اور نقطہ نظر ہے. زیادہ تر ایل ایل ایم ازگر کوڈ لکھنے کے بجائے اسے سمجھانا شروع کر دیتے ہیں۔
آپ `generation_config` دلیل کا استعمال کرتے ہوئے اپنے جواب کو حسب ضرورت بنا سکتے ہیں۔ ہم امیدواروں کی تعداد کو 1 تک محدود کر رہے ہیں، سٹاپ لفظ "اسپیس" شامل کر رہے ہیں اور زیادہ سے زیادہ ٹوکن اور درجہ حرارت سیٹ کر رہے ہیں۔
response = model.generate_content(
'Write a short story about aliens.',
generation_config=genai.types.GenerationConfig(
candidate_count=1,
stop_sequences=['space'],
max_output_tokens=200,
temperature=0.7)
)
Markdown(response.text)
جیسا کہ آپ دیکھ سکتے ہیں، جواب لفظ "اسپیس" سے پہلے رک گیا۔ حیرت انگیز
آپ جواب کو اسٹریم کرنے کے لیے `سٹریم` دلیل بھی استعمال کر سکتے ہیں۔ یہ Anthropic اور OpenAI APIs کی طرح ہے لیکن تیز ہے۔
model = genai.GenerativeModel('gemini-pro')
response = model.generate_content("Write a Julia function for cleaning the data.", stream=True)
for chunk in response:
print(chunk.text)
اس سیکشن میں، ہم لوڈ کریں گے مسعود اسلمی۔ تصویر بنائیں اور جیمنی پرو ویژن کی کثیر موڈیالٹی کو جانچنے کے لیے اس کا استعمال کریں۔
تصاویر کو 'PIL' میں لوڈ کریں اور اسے ڈسپلے کریں۔
import PIL.Image
img = PIL.Image.open('images/photo-1.jpg')
img
ہمارے پاس Rua Augusta Arch کی اعلیٰ معیار کی تصویر ہے۔
آئیے جیمنی پرو ویژن ماڈل کو لوڈ کریں اور اسے امیج فراہم کریں۔
model = genai.GenerativeModel('gemini-pro-vision')
response = model.generate_content(img)
Markdown(response.text)
ماڈل نے محل کی درست شناخت کی اور اس کی تاریخ اور فن تعمیر کے بارے میں اضافی معلومات فراہم کیں۔
آئیے وہی تصویر GPT-4 کو فراہم کریں اور اس سے تصویر کے بارے میں پوچھیں۔ دونوں ماڈلز نے تقریباً ایک جیسے جوابات فراہم کیے ہیں۔ لیکن مجھے GPT-4 جواب زیادہ پسند ہے۔
اب ہم API کو متن اور تصویر فراہم کریں گے۔ ہم نے وژن ماڈل سے کہا ہے کہ وہ تصویر کو بطور حوالہ استعمال کرتے ہوئے ایک سفری بلاگ لکھے۔
response = model.generate_content(["Write a travel blog post using the image as reference.", img])
Markdown(response.text)
اس نے مجھے ایک مختصر بلاگ فراہم کیا ہے۔ میں طویل فارمیٹ کی توقع کر رہا تھا۔
GPT-4 کے مقابلے میں، Gemini Pro Vision ماڈل نے طویل فارمیٹ کا بلاگ بنانے کے لیے جدوجہد کی ہے۔
ہم آگے پیچھے چیٹ سیشن کے لیے ماڈل ترتیب دے سکتے ہیں۔ اس طرح، ماڈل پچھلی بات چیت کا استعمال کرتے ہوئے سیاق و سباق اور جواب کو یاد رکھتا ہے۔
ہمارے معاملے میں، ہم نے چیٹ سیشن شروع کیا ہے اور ماڈل سے کہا ہے کہ وہ ڈوٹا 2 گیم شروع کرنے میں میری مدد کرے۔
model = genai.GenerativeModel('gemini-pro')
chat = model.start_chat(history=[])
chat.send_message("Can you please guide me on how to start playing Dota 2?")
chat.history
جیسا کہ آپ دیکھ سکتے ہیں، `چیٹ` آبجیکٹ صارف کی تاریخ اور موڈ چیٹ کو محفوظ کر رہا ہے۔
ہم انہیں مارک ڈاؤن اسٹائل میں بھی ڈسپلے کر سکتے ہیں۔
for message in chat.history:
display(Markdown(f'**{message.role}**: {message.parts[0].text}'))
آئیے فالو اپ سوال پوچھیں۔
chat.send_message("Which Dota 2 heroes should I start with?")
for message in chat.history:
display(Markdown(f'**{message.role}**: {message.parts[0].text}'))
ہم نیچے سکرول کر سکتے ہیں اور ماڈل کے ساتھ پورا سیشن دیکھ سکتے ہیں۔
سیاق و سباق سے آگاہ ایپلی کیشنز کے لیے سرایت کرنے والے ماڈل تیزی سے مقبول ہو رہے ہیں۔ Gemini embedding-001 ماڈل الفاظ، جملے، یا مکمل دستاویزات کو گھنے ویکٹر کے طور پر پیش کرنے کی اجازت دیتا ہے جو سیمنٹک معنی کو انکوڈ کرتے ہیں۔ یہ ویکٹر کی نمائندگی متن کے مختلف ٹکڑوں کے درمیان ان کے متعلقہ سرایت کرنے والے ویکٹروں کا موازنہ کرکے آسانی سے مماثلت کا موازنہ کرنا ممکن بناتی ہے۔
ہم مواد کو `embed_content` کو فراہم کر سکتے ہیں اور متن کو سرایت کرنے میں تبدیل کر سکتے ہیں۔ یہ اتنا ہی آسان ہے۔
output = genai.embed_content(
model="models/embedding-001",
content="Can you please guide me on how to start playing Dota 2?",
task_type="retrieval_document",
title="Embedding of Dota 2 question")
print(output['embedding'][0:10])
[0.060604308, -0.023885584, -0.007826327, -0.070592545, 0.021225851, 0.043229062, 0.06876691, 0.049298503, 0.039964676, 0.08291664]
ہم سٹرنگز کی فہرست کو 'مواد' دلیل میں منتقل کر کے متن کے متعدد حصوں کو ایمبیڈنگ میں تبدیل کر سکتے ہیں۔
output = genai.embed_content(
model="models/embedding-001",
content=[
"Can you please guide me on how to start playing Dota 2?",
"Which Dota 2 heroes should I start with?",
],
task_type="retrieval_document",
title="Embedding of Dota 2 question")
for emb in output['embedding']:
print(emb[:10])
[0.060604308, -0.023885584, -0.007826327, -0.070592545, 0.021225851, 0.043229062, 0.06876691, 0.049298503, 0.039964676, 0.08291664]
[0.04775657, -0.044990525, -0.014886052, -0.08473655, 0.04060122, 0.035374347, 0.031866882, 0.071754575, 0.042207796, 0.04577447]
اگر آپ کو وہی نتیجہ دوبارہ پیش کرنے میں دشواری ہو رہی ہے، تو میرا چیک کریں۔ ڈیپ نوٹ ورک اسپیس.
بہت سارے جدید فنکشنز ہیں جن کا ہم نے اس تعارفی ٹیوٹوریل میں احاطہ نہیں کیا۔ آپ Gemini API کے بارے میں مزید جان سکتے ہیں۔ Gemini API: Python کے ساتھ کوئیک اسٹارٹ.
اس ٹیوٹوریل میں، ہم نے Gemini کے بارے میں اور جوابات پیدا کرنے کے لیے Python API تک رسائی حاصل کرنے کا طریقہ سیکھا ہے۔ خاص طور پر، ہم نے ٹیکسٹ جنریشن، بصری تفہیم، سلسلہ بندی، گفتگو کی تاریخ، حسب ضرورت آؤٹ پٹ، اور ایمبیڈنگز کے بارے میں سیکھا ہے۔ تاہم، یہ صرف اس سطح کو کھرچتا ہے کہ جیمنی کیا کر سکتا ہے۔
مفت Gemini API کا استعمال کرتے ہوئے آپ نے جو کچھ بنایا ہے اسے بلا جھجھک مجھ سے شیئر کریں۔ امکانات لامحدود ہیں۔
عابد علی اعوان (@1abidaliawan) ایک سرٹیفائیڈ ڈیٹا سائنٹسٹ پروفیشنل ہے جو مشین لرننگ ماڈل بنانا پسند کرتا ہے۔ فی الحال، وہ مشین لرننگ اور ڈیٹا سائنس ٹیکنالوجیز پر مواد کی تخلیق اور تکنیکی بلاگ لکھنے پر توجہ دے رہا ہے۔ عابد کے پاس ٹیکنالوجی مینجمنٹ میں ماسٹر ڈگری اور ٹیلی کمیونیکیشن انجینئرنگ میں بیچلر ڈگری ہے۔ اس کا وژن دماغی بیماری کے ساتھ جدوجہد کرنے والے طلباء کے لیے گراف نیورل نیٹ ورک کا استعمال کرتے ہوئے ایک AI پروڈکٹ بنانا ہے۔
- SEO سے چلنے والا مواد اور PR کی تقسیم۔ آج ہی بڑھا دیں۔
- پلیٹو ڈیٹا ڈاٹ نیٹ ورک ورٹیکل جنریٹو اے آئی۔ اپنے آپ کو بااختیار بنائیں۔ یہاں تک رسائی حاصل کریں۔
- پلیٹوآئ اسٹریم۔ ویب 3 انٹیلی جنس۔ علم میں اضافہ۔ یہاں تک رسائی حاصل کریں۔
- پلیٹو ای ایس جی۔ کاربن، کلین ٹیک، توانائی ، ماحولیات، شمسی، ویسٹ مینجمنٹ یہاں تک رسائی حاصل کریں۔
- پلیٹو ہیلتھ۔ بائیوٹیک اینڈ کلینیکل ٹرائلز انٹیلی جنس۔ یہاں تک رسائی حاصل کریں۔
- ماخذ: https://www.kdnuggets.com/how-to-access-and-use-gemini-api-for-free?utm_source=rss&utm_medium=rss&utm_campaign=how-to-access-and-use-gemini-api-for-free
- : ہے
- : ہے
- $UP
- 1
- 10
- 12
- 13
- 14
- 17
- 27
- 7
- 8
- 9
- a
- ہمارے بارے میں
- تک رسائی حاصل
- درست طریقے سے
- کے پار
- انہوں نے مزید کہا
- ایڈیشنل
- اضافی معلومات
- اعلی درجے کی
- پھر
- AI
- ودیشیوں
- تمام
- کی اجازت دیتا ہے
- تقریبا
- بھی
- حیرت انگیز
- an
- اور
- جواب
- بشری
- اے پی آئی
- APIs
- ایپلی کیشنز
- فن تعمیر
- کیا
- دلیل
- AS
- پوچھنا
- At
- آڈیو
- متوازن
- BE
- بننے
- رہا
- اس سے پہلے
- معیار
- کے درمیان
- بلاگ
- بلاگز
- دونوں
- تعمیر
- عمارت
- تعمیر
- کاروبار
- لیکن
- بٹن
- by
- کہا جاتا ہے
- کر سکتے ہیں
- امیدوار
- امیدواروں
- صلاحیتوں
- صلاحیت رکھتا
- کیس
- مقدمات
- مراکز
- مصدقہ
- چیٹ
- چیک کریں
- صفائی
- کلک کریں
- کوڈ
- تعاون
- موازنہ
- موازنہ
- پیچیدہ
- مواد
- مواد کی تخلیق
- سیاق و سباق
- بات چیت
- مکالمات
- تبدیل
- اسی کے مطابق
- احاطہ
- مخلوق
- اس وقت
- اپنی مرضی کے
- اپنی مرضی کے مطابق
- اعداد و شمار
- ڈیٹا مراکز
- ڈیٹا سائنس
- ڈیٹا سائنسدان
- تاریخ
- Deepmind
- ڈگری
- گھنے
- ڈیزائن
- ترقی یافتہ
- ڈویلپرز
- کے الات
- نہیں کیا
- مختلف
- دکھائیں
- متنوع
- do
- دستاویزات
- ڈان
- ڈوٹا
- DOTA 2
- نیچے
- آسانی سے
- آسان
- ہنر
- مؤثر طریقے سے
- سرایت کرنا
- انجنیئرنگ
- پوری
- ماحولیات
- Ether (ETH)
- توقع
- ماہرین
- وضاحت
- تلاش
- تیز تر
- پہلا
- لچکدار
- توجہ مرکوز
- پر عمل کریں
- کے لئے
- فارمیٹ
- مفت
- سے
- تقریب
- افعال
- کھیل ہی کھیل میں
- جیمنی
- پیدا
- نسل
- حاصل
- GIF
- Go
- جا
- اچھا
- گوگل
- گوگل
- گراف
- گراف نیورل نیٹ ورک
- رہنمائی
- تھا
- ہے
- ہونے
- he
- مدد
- یہاں
- ہیرو
- ہائی
- انتہائی
- ان
- تاریخ
- کی ڈگری حاصل کی
- کس طرح
- کیسے
- تاہم
- HTTPS
- انسانی
- i
- کی نشاندہی
- بیماری
- تصویر
- تصاویر
- درآمد
- in
- سمیت
- دن بدن
- معلومات
- شروع
- انسٹال
- مثال کے طور پر
- کے بجائے
- انضمام
- میں
- تعارف
- IT
- میں
- فوٹو
- جلیا
- صرف
- KDnuggets
- کلیدی
- علم
- زبان
- سب سے بڑا
- جانیں
- سیکھا ہے
- سیکھنے
- کی طرح
- لا محدود
- لنکڈ
- لسٹ
- لوڈ
- اب
- سے محبت کرتا ہے
- مشین
- مشین لرننگ
- بناتا ہے
- انتظام
- بہت سے
- بڑے پیمانے پر
- ماسٹر
- میکس
- me
- مطلب
- کا مطلب ہے کہ
- ذہنی
- ذہنی بیماری
- پیمائش کا معیار
- موبائل
- موبائل آلات
- موڈ
- ماڈل
- ماڈل
- زیادہ
- سب سے زیادہ
- ایک سے زیادہ
- نام
- نینو
- NBA
- نیٹ ورک
- عصبی
- عصبی نیٹ ورک
- نئی
- اگلے
- اب
- اعتراض
- of
- on
- ایک
- صرف
- اوپنائی
- کام
- or
- OS
- ہمارے
- باہر
- باہر نکلنا
- پیداوار
- محل
- خاص طور پر
- پاسنگ
- کامل
- کارکردگی
- کارکردگی کا مظاہرہ
- ذاتی
- تصویر
- ٹکڑے ٹکڑے
- پلاٹا
- افلاطون ڈیٹا انٹیلی جنس
- پلیٹو ڈیٹا
- کھیل
- مہربانی کرکے
- پوائنٹ
- مقبول
- امکانات
- ممکن
- پوسٹ
- ممکنہ
- پچھلا
- فی
- مسئلہ
- مسائل کو حل کرنے
- مصنوعات
- پیشہ ورانہ
- فراہم
- فراہم
- فراہم کرنے
- ازگر
- معیار
- سوالات
- سوال
- بہت
- رینج
- RE
- حوالہ
- نمائندگی
- نمائندگی
- تحقیق
- جواب
- جوابات
- نتیجہ
- انقلاب
- s
- اسی
- بچت
- اسکیل ایبلٹی
- پیمانے
- پیمانہ ai
- سائنس
- سائنسدان
- سکرال
- سیکشن
- دیکھنا
- منتخب
- اجلاس
- مقرر
- قائم کرنے
- کئی
- سیکنڈ اور
- مختصر
- ہونا چاہئے
- اسی طرح
- سادہ
- ایک
- So
- حل کرنا۔
- خلا
- خاص طور پر
- شروع کریں
- شروع
- ریاستی آرٹ
- مرحلہ
- بند کرو
- بند کر دیا
- کہانی
- سٹریم
- محرومی
- جدوجہد
- طلباء
- سٹائل
- موزوں
- سطح
- سسٹمز
- T
- کاموں
- ٹیموں
- ٹیکنیکل
- ٹیکنالوجی
- ٹیکنالوجی
- ٹیلی مواصلات
- ٹیسٹ
- ٹیسٹ
- متن
- متن کی نسل
- کہ
- ۔
- ان
- ان
- تو
- اس
- تین
- کے ذریعے
- کرنے کے لئے
- ٹوکن
- سفر
- مصیبت
- سبق
- اقسام
- الٹرا
- سمجھ
- افہام و تفہیم
- us
- استعمال کے قابل
- استعمال کی شرائط
- رکن کا
- کا استعمال کرتے ہوئے
- متغیر
- مختلف
- ویڈیو
- نقطہ نظر
- بصری
- تھا
- راستہ..
- we
- کیا
- جس
- ڈبلیو
- وسیع
- وسیع رینج
- گے
- ساتھ
- لفظ
- الفاظ
- کام
- دنیا
- لکھنا
- تحریری طور پر
- آپ
- اور
- زیفیرنیٹ