How To Access And Use Gemini API For Free - KDnuggets

प्लेटो द्वारा पुनर्प्रकाशित

अनुयायियों: 0

जेमिनी एपीआई को निःशुल्क एक्सेस और उपयोग कैसे करें
लेखक द्वारा छवि

जेमिनी Google द्वारा विकसित एक नया मॉडल है, और बार्ड फिर से प्रयोग योग्य हो रहा है। जेमिनी के साथ, अब आपके प्रश्नों को चित्र, ऑडियो और टेक्स्ट प्रदान करके लगभग सटीक उत्तर प्राप्त करना संभव है।

इस ट्यूटोरियल में, हम जेमिनी एपीआई के बारे में जानेंगे और इसे अपनी मशीन पर कैसे सेट अप करेंगे। हम पाठ निर्माण और छवि समझ सहित विभिन्न पायथन एपीआई कार्यों का भी पता लगाएंगे।

मिथुन राशि यह एक नया AI मॉडल है जिसे Google रिसर्च और Google DeepMind सहित Google की टीमों के बीच सहयोग से विकसित किया गया है। इसे विशेष रूप से मल्टीमॉडल बनाने के लिए बनाया गया था, जिसका अर्थ है कि यह टेक्स्ट, कोड, ऑडियो, इमेज और वीडियो जैसे विभिन्न प्रकार के डेटा को समझ सकता है और उनके साथ काम कर सकता है।

जेमिनी Google द्वारा अब तक विकसित सबसे उन्नत और सबसे बड़ा AI मॉडल है। इसे अत्यधिक लचीला बनाने के लिए डिज़ाइन किया गया है ताकि यह डेटा केंद्रों से लेकर मोबाइल उपकरणों तक कई प्रकार की प्रणालियों पर कुशलतापूर्वक काम कर सके। इसका मतलब यह है कि इसमें व्यवसायों और डेवलपर्स के एआई अनुप्रयोगों को बनाने और स्केल करने के तरीके में क्रांतिकारी बदलाव लाने की क्षमता है।

विभिन्न उपयोग के मामलों के लिए डिज़ाइन किए गए जेमिनी मॉडल के तीन संस्करण यहां दिए गए हैं:

जेमिनी अल्ट्रा: सबसे बड़ा और सबसे उन्नत AI जटिल कार्य करने में सक्षम।
जेमिनी प्रो: एक संतुलित मॉडल जिसमें अच्छा प्रदर्शन और मापनीयता है।
जेमिनी नैनो: मोबाइल उपकरणों के लिए सबसे कुशल.

जेमिनी एपीआई को निःशुल्क एक्सेस और उपयोग कैसे करें
से छवि मिथुन का परिचय

जेमिनी अल्ट्रा का प्रदर्शन अत्याधुनिक है, जो कई मेट्रिक्स पर जीपीटी-4 के प्रदर्शन से बेहतर है। यह मैसिव मल्टीटास्क लैंग्वेज अंडरस्टैंडिंग बेंचमार्क पर मानव विशेषज्ञों से बेहतर प्रदर्शन करने वाला पहला मॉडल है, जो 57 विविध विषयों में विश्व ज्ञान और समस्या समाधान का परीक्षण करता है। यह इसकी उन्नत समझ और समस्या-समाधान क्षमताओं को प्रदर्शित करता है।

एपीआई का उपयोग करने के लिए, हमें पहले एक एपीआई कुंजी प्राप्त करनी होगी जिसे आप यहां से प्राप्त कर सकते हैं: https://ai.google.dev/tutorials/setup

जेमिनी एपीआई को निःशुल्क एक्सेस और उपयोग कैसे करें

इसके बाद “Get an API key” बटन पर क्लिक करें और फिर “Create API key in new project” पर क्लिक करें।

जेमिनी एपीआई को निःशुल्क एक्सेस और उपयोग कैसे करें

एपीआई कुंजी की प्रतिलिपि बनाएँ और इसे एक पर्यावरण चर के रूप में सेट करें। हम डीपनोट का उपयोग कर रहे हैं और हमारे लिए "GEMINI_API_KEY" नाम से कुंजी सेट करना काफी आसान है। बस एकीकरण पर जाएं, नीचे स्क्रॉल करें और पर्यावरण चर चुनें।

जेमिनी एपीआई को निःशुल्क एक्सेस और उपयोग कैसे करें

अगले चरण में, हम PIP का उपयोग करके Python API इंस्टॉल करेंगे:

pip install -q -U google-generativeai

उसके बाद, हम एपीआई कुंजी को Google के GenAI पर सेट करेंगे और इंस्टेंस आरंभ करेंगे।

import google.generativeai as genai
import os

gemini_api_key = os.environ["GEMINI_API_KEY"]
genai.configure(api_key = gemini_api_key)

एपीआई कुंजी स्थापित करने के बाद, सामग्री उत्पन्न करने के लिए जेमिनी प्रो मॉडल का उपयोग करना सरल है। `जेनरेट_कंटेंट` फ़ंक्शन के लिए एक संकेत प्रदान करें और आउटपुट को मार्कडाउन के रूप में प्रदर्शित करें।

from IPython.display import Markdown

model = genai.GenerativeModel('gemini-pro')
response = model.generate_content("Who is the GOAT in the NBA?")

Markdown(response.text)

यह आश्चर्यजनक है, लेकिन मैं इस सूची से सहमत नहीं हूं। हालाँकि, मैं समझता हूँ कि यह सब व्यक्तिगत पसंद के बारे में है।

जेमिनी एपीआई को निःशुल्क एक्सेस और उपयोग कैसे करें

मिथुन एक ही संकेत के लिए कई प्रतिक्रियाएं उत्पन्न कर सकता है, जिन्हें उम्मीदवार कहा जाता है। आप सबसे उपयुक्त का चयन कर सकते हैं. हमारे मामले में, हमारी केवल एक ही प्रतिक्रिया थी।

response.candidates

जेमिनी एपीआई को निःशुल्क एक्सेस और उपयोग कैसे करें

आइए इसे पायथन में एक सरल गेम लिखने के लिए कहें।

response = model.generate_content("Build a simple game in Python")

Markdown(response.text)

परिणाम सरल और सटीक है. अधिकांश एलएलएम पायथन कोड को लिखने के बजाय उसे समझाना शुरू करते हैं।

जेमिनी एपीआई को निःशुल्क एक्सेस और उपयोग कैसे करें

आप `जेनरेशन_कॉन्फिग` तर्क का उपयोग करके अपनी प्रतिक्रिया को अनुकूलित कर सकते हैं। हम उम्मीदवारों की संख्या को 1 तक सीमित कर रहे हैं, स्टॉप शब्द "स्पेस" जोड़ रहे हैं और अधिकतम टोकन और तापमान सेट कर रहे हैं।

response = model.generate_content(
    'Write a short story about aliens.',
    generation_config=genai.types.GenerationConfig(
        candidate_count=1,
        stop_sequences=['space'],
        max_output_tokens=200,
        temperature=0.7)
)

Markdown(response.text)

जैसा कि आप देख सकते हैं, प्रतिक्रिया "स्पेस" शब्द से पहले रुक गई। अद्भुत।

जेमिनी एपीआई को निःशुल्क एक्सेस और उपयोग कैसे करें

आप प्रतिक्रिया को स्ट्रीम करने के लिए `स्ट्रीम` तर्क का भी उपयोग कर सकते हैं। यह एंथ्रोपिक और ओपनएआई एपीआई के समान है लेकिन तेज़ है।

model = genai.GenerativeModel('gemini-pro')
response = model.generate_content("Write a Julia function for cleaning the data.", stream=True)

for chunk in response:
    print(chunk.text)

जेमिनी एपीआई को निःशुल्क एक्सेस और उपयोग कैसे करें

इस अनुभाग में, हम लोड करेंगे मसूद असलमी का फ़ोटो लें और जेमिनी प्रो विज़न की बहुविधता का परीक्षण करने के लिए इसका उपयोग करें।

छवियों को `पीआईएल` में लोड करें और इसे प्रदर्शित करें।

import PIL.Image

img = PIL.Image.open('images/photo-1.jpg')

img

हमारे पास रुआ ऑगस्टा आर्क की एक उच्च गुणवत्ता वाली तस्वीर है।

जेमिनी एपीआई को निःशुल्क एक्सेस और उपयोग कैसे करें

आइए जेमिनी प्रो विज़न मॉडल को लोड करें और इसे छवि प्रदान करें।

model = genai.GenerativeModel('gemini-pro-vision')

response = model.generate_content(img)

Markdown(response.text)

मॉडल ने महल की सटीक पहचान की और इसके इतिहास और वास्तुकला के बारे में अतिरिक्त जानकारी प्रदान की।

जेमिनी एपीआई को निःशुल्क एक्सेस और उपयोग कैसे करें

आइए GPT-4 को वही छवि प्रदान करें और उससे छवि के बारे में पूछें। दोनों मॉडलों ने लगभग समान उत्तर दिए हैं। लेकिन मुझे GPT-4 प्रतिक्रिया अधिक पसंद है.

जेमिनी एपीआई को निःशुल्क एक्सेस और उपयोग कैसे करें

अब हम एपीआई को टेक्स्ट और छवि प्रदान करेंगे। हमने विज़न मॉडल से छवि को संदर्भ के रूप में उपयोग करके एक यात्रा ब्लॉग लिखने के लिए कहा है।

response = model.generate_content(["Write a travel blog post using the image as reference.", img])

Markdown(response.text)

इसने मुझे एक छोटा ब्लॉग उपलब्ध कराया है। मैं लंबे प्रारूप की उम्मीद कर रहा था।

जेमिनी एपीआई को निःशुल्क एक्सेस और उपयोग कैसे करें

GPT-4 की तुलना में, जेमिनी प्रो विज़न मॉडल को एक लंबे प्रारूप वाला ब्लॉग बनाने में संघर्ष करना पड़ा है।

जेमिनी एपीआई को निःशुल्क एक्सेस और उपयोग कैसे करें

हम आगे-पीछे चैट सत्र के लिए मॉडल स्थापित कर सकते हैं। इस तरह, मॉडल पिछली बातचीत का उपयोग करके संदर्भ और प्रतिक्रिया को याद रखता है।

हमारे मामले में, हमने चैट सत्र शुरू कर दिया है और मॉडल से Dota 2 गेम शुरू करने में मेरी मदद करने के लिए कहा है।

model = genai.GenerativeModel('gemini-pro')

chat = model.start_chat(history=[])

chat.send_message("Can you please guide me on how to start playing Dota 2?")

chat.history

जैसा कि आप देख सकते हैं, `चैट` ऑब्जेक्ट उपयोगकर्ता और मोड चैट के इतिहास को सहेज रहा है।

जेमिनी एपीआई को निःशुल्क एक्सेस और उपयोग कैसे करें

जेमिनी एपीआई को निःशुल्क एक्सेस और उपयोग कैसे करें

हम उन्हें मार्कडाउन शैली में भी प्रदर्शित कर सकते हैं।

for message in chat.history:
    display(Markdown(f'**{message.role}**: {message.parts[0].text}'))

जेमिनी एपीआई को निःशुल्क एक्सेस और उपयोग कैसे करें

आइए अनुवर्ती प्रश्न पूछें।

chat.send_message("Which Dota 2 heroes should I start with?")

for message in chat.history:
    display(Markdown(f'**{message.role}**: {message.parts[0].text}'))

हम नीचे स्क्रॉल कर सकते हैं और मॉडल के साथ पूरा सत्र देख सकते हैं।

जेमिनी एपीआई को निःशुल्क एक्सेस और उपयोग कैसे करें

संदर्भ-जागरूक अनुप्रयोगों के लिए एंबेडिंग मॉडल तेजी से लोकप्रिय हो रहे हैं। जेमिनी एम्बेडिंग-001 मॉडल शब्दों, वाक्यों या संपूर्ण दस्तावेज़ों को घने वैक्टर के रूप में प्रस्तुत करने की अनुमति देता है जो अर्थपूर्ण अर्थ को कूटबद्ध करते हैं। यह वेक्टर प्रतिनिधित्व पाठ के विभिन्न टुकड़ों के बीच उनके संबंधित एम्बेडिंग वैक्टर की तुलना करके आसानी से समानता की तुलना करना संभव बनाता है।

हम `एम्बेड_कंटेंट` को सामग्री प्रदान कर सकते हैं और टेक्स्ट को एम्बेडिंग में परिवर्तित कर सकते हैं। यह इतना आसान है.

output = genai.embed_content(
    model="models/embedding-001",
    content="Can you please guide me on how to start playing Dota 2?",
    task_type="retrieval_document",
    title="Embedding of Dota 2 question")

print(output['embedding'][0:10])

[0.060604308, -0.023885584, -0.007826327, -0.070592545, 0.021225851, 0.043229062, 0.06876691, 0.049298503, 0.039964676, 0.08291664]

हम 'सामग्री' तर्क में स्ट्रिंग्स की एक सूची पास करके टेक्स्ट के कई हिस्सों को एम्बेडिंग में बदल सकते हैं।

output = genai.embed_content(
    model="models/embedding-001",
    content=[
        "Can you please guide me on how to start playing Dota 2?",
        "Which Dota 2 heroes should I start with?",
    ],
    task_type="retrieval_document",
    title="Embedding of Dota 2 question")

for emb in output['embedding']:
    print(emb[:10])

[0.060604308, -0.023885584, -0.007826327, -0.070592545, 0.021225851, 0.043229062, 0.06876691, 0.049298503, 0.039964676, 0.08291664]

[0.04775657, -0.044990525, -0.014886052, -0.08473655, 0.04060122, 0.035374347, 0.031866882, 0.071754575, 0.042207796, 0.04577447]

यदि आपको उसी परिणाम को पुन: प्रस्तुत करने में परेशानी हो रही है, तो मेरी जाँच करें डीपनोट कार्यक्षेत्र.

ऐसे कई उन्नत कार्य हैं जिन्हें हमने इस परिचयात्मक ट्यूटोरियल में शामिल नहीं किया है। आप जेमिनी एपीआई के बारे में अधिक जान सकते हैं जेमिनी एपीआई: पायथन के साथ क्विकस्टार्ट.

इस ट्यूटोरियल में, हमने जेमिनी के बारे में सीखा है और प्रतिक्रियाएँ उत्पन्न करने के लिए पायथन एपीआई तक कैसे पहुँचें। विशेष रूप से, हमने टेक्स्ट जेनरेशन, विज़ुअल समझ, स्ट्रीमिंग, वार्तालाप इतिहास, कस्टम आउटपुट और एम्बेडिंग के बारे में सीखा है। हालाँकि, यह सिर्फ मिथुन राशि वाले क्या कर सकते हैं इसकी सतह को खरोंच देता है।

निःशुल्क जेमिनी एपीआई का उपयोग करके आपने जो बनाया है उसे बेझिझक मेरे साथ साझा करें। संभावनाएं असीमित हैं.

आबिद अली अवनी (@1अबिदलियावान) एक प्रमाणित डेटा वैज्ञानिक पेशेवर है जो मशीन लर्निंग मॉडल बनाना पसंद करता है। वर्तमान में, वह सामग्री निर्माण और मशीन लर्निंग और डेटा विज्ञान प्रौद्योगिकियों पर तकनीकी ब्लॉग लिखने पर ध्यान केंद्रित कर रहा है। आबिद के पास प्रौद्योगिकी प्रबंधन में मास्टर डिग्री और दूरसंचार इंजीनियरिंग में स्नातक की डिग्री है। उनका दृष्टिकोण मानसिक बीमारी से जूझ रहे छात्रों के लिए ग्राफ न्यूरल नेटवर्क का उपयोग करके एआई उत्पाद बनाना है।