लेखक द्वारा छवि
जेमिनी Google द्वारा विकसित एक नया मॉडल है, और बार्ड फिर से प्रयोग योग्य हो रहा है। जेमिनी के साथ, अब आपके प्रश्नों को चित्र, ऑडियो और टेक्स्ट प्रदान करके लगभग सटीक उत्तर प्राप्त करना संभव है।
इस ट्यूटोरियल में, हम जेमिनी एपीआई के बारे में जानेंगे और इसे अपनी मशीन पर कैसे सेट अप करेंगे। हम पाठ निर्माण और छवि समझ सहित विभिन्न पायथन एपीआई कार्यों का भी पता लगाएंगे।
मिथुन राशि यह एक नया AI मॉडल है जिसे Google रिसर्च और Google DeepMind सहित Google की टीमों के बीच सहयोग से विकसित किया गया है। इसे विशेष रूप से मल्टीमॉडल बनाने के लिए बनाया गया था, जिसका अर्थ है कि यह टेक्स्ट, कोड, ऑडियो, इमेज और वीडियो जैसे विभिन्न प्रकार के डेटा को समझ सकता है और उनके साथ काम कर सकता है।
जेमिनी Google द्वारा अब तक विकसित सबसे उन्नत और सबसे बड़ा AI मॉडल है। इसे अत्यधिक लचीला बनाने के लिए डिज़ाइन किया गया है ताकि यह डेटा केंद्रों से लेकर मोबाइल उपकरणों तक कई प्रकार की प्रणालियों पर कुशलतापूर्वक काम कर सके। इसका मतलब यह है कि इसमें व्यवसायों और डेवलपर्स के एआई अनुप्रयोगों को बनाने और स्केल करने के तरीके में क्रांतिकारी बदलाव लाने की क्षमता है।
विभिन्न उपयोग के मामलों के लिए डिज़ाइन किए गए जेमिनी मॉडल के तीन संस्करण यहां दिए गए हैं:
- जेमिनी अल्ट्रा: सबसे बड़ा और सबसे उन्नत AI जटिल कार्य करने में सक्षम।
- जेमिनी प्रो: एक संतुलित मॉडल जिसमें अच्छा प्रदर्शन और मापनीयता है।
- जेमिनी नैनो: मोबाइल उपकरणों के लिए सबसे कुशल.
से छवि मिथुन का परिचय
जेमिनी अल्ट्रा का प्रदर्शन अत्याधुनिक है, जो कई मेट्रिक्स पर जीपीटी-4 के प्रदर्शन से बेहतर है। यह मैसिव मल्टीटास्क लैंग्वेज अंडरस्टैंडिंग बेंचमार्क पर मानव विशेषज्ञों से बेहतर प्रदर्शन करने वाला पहला मॉडल है, जो 57 विविध विषयों में विश्व ज्ञान और समस्या समाधान का परीक्षण करता है। यह इसकी उन्नत समझ और समस्या-समाधान क्षमताओं को प्रदर्शित करता है।
एपीआई का उपयोग करने के लिए, हमें पहले एक एपीआई कुंजी प्राप्त करनी होगी जिसे आप यहां से प्राप्त कर सकते हैं: https://ai.google.dev/tutorials/setup
इसके बाद “Get an API key” बटन पर क्लिक करें और फिर “Create API key in new project” पर क्लिक करें।
एपीआई कुंजी की प्रतिलिपि बनाएँ और इसे एक पर्यावरण चर के रूप में सेट करें। हम डीपनोट का उपयोग कर रहे हैं और हमारे लिए "GEMINI_API_KEY" नाम से कुंजी सेट करना काफी आसान है। बस एकीकरण पर जाएं, नीचे स्क्रॉल करें और पर्यावरण चर चुनें।
अगले चरण में, हम PIP का उपयोग करके Python API इंस्टॉल करेंगे:
pip install -q -U google-generativeai
उसके बाद, हम एपीआई कुंजी को Google के GenAI पर सेट करेंगे और इंस्टेंस आरंभ करेंगे।
import google.generativeai as genai
import os
gemini_api_key = os.environ["GEMINI_API_KEY"]
genai.configure(api_key = gemini_api_key)
एपीआई कुंजी स्थापित करने के बाद, सामग्री उत्पन्न करने के लिए जेमिनी प्रो मॉडल का उपयोग करना सरल है। `जेनरेट_कंटेंट` फ़ंक्शन के लिए एक संकेत प्रदान करें और आउटपुट को मार्कडाउन के रूप में प्रदर्शित करें।
from IPython.display import Markdown
model = genai.GenerativeModel('gemini-pro')
response = model.generate_content("Who is the GOAT in the NBA?")
Markdown(response.text)
यह आश्चर्यजनक है, लेकिन मैं इस सूची से सहमत नहीं हूं। हालाँकि, मैं समझता हूँ कि यह सब व्यक्तिगत पसंद के बारे में है।
मिथुन एक ही संकेत के लिए कई प्रतिक्रियाएं उत्पन्न कर सकता है, जिन्हें उम्मीदवार कहा जाता है। आप सबसे उपयुक्त का चयन कर सकते हैं. हमारे मामले में, हमारी केवल एक ही प्रतिक्रिया थी।
response.candidates
आइए इसे पायथन में एक सरल गेम लिखने के लिए कहें।
response = model.generate_content("Build a simple game in Python")
Markdown(response.text)
परिणाम सरल और सटीक है. अधिकांश एलएलएम पायथन कोड को लिखने के बजाय उसे समझाना शुरू करते हैं।
आप `जेनरेशन_कॉन्फिग` तर्क का उपयोग करके अपनी प्रतिक्रिया को अनुकूलित कर सकते हैं। हम उम्मीदवारों की संख्या को 1 तक सीमित कर रहे हैं, स्टॉप शब्द "स्पेस" जोड़ रहे हैं और अधिकतम टोकन और तापमान सेट कर रहे हैं।
response = model.generate_content(
'Write a short story about aliens.',
generation_config=genai.types.GenerationConfig(
candidate_count=1,
stop_sequences=['space'],
max_output_tokens=200,
temperature=0.7)
)
Markdown(response.text)
जैसा कि आप देख सकते हैं, प्रतिक्रिया "स्पेस" शब्द से पहले रुक गई। अद्भुत।
आप प्रतिक्रिया को स्ट्रीम करने के लिए `स्ट्रीम` तर्क का भी उपयोग कर सकते हैं। यह एंथ्रोपिक और ओपनएआई एपीआई के समान है लेकिन तेज़ है।
model = genai.GenerativeModel('gemini-pro')
response = model.generate_content("Write a Julia function for cleaning the data.", stream=True)
for chunk in response:
print(chunk.text)
इस अनुभाग में, हम लोड करेंगे मसूद असलमी का फ़ोटो लें और जेमिनी प्रो विज़न की बहुविधता का परीक्षण करने के लिए इसका उपयोग करें।
छवियों को `पीआईएल` में लोड करें और इसे प्रदर्शित करें।
import PIL.Image
img = PIL.Image.open('images/photo-1.jpg')
img
हमारे पास रुआ ऑगस्टा आर्क की एक उच्च गुणवत्ता वाली तस्वीर है।
आइए जेमिनी प्रो विज़न मॉडल को लोड करें और इसे छवि प्रदान करें।
model = genai.GenerativeModel('gemini-pro-vision')
response = model.generate_content(img)
Markdown(response.text)
मॉडल ने महल की सटीक पहचान की और इसके इतिहास और वास्तुकला के बारे में अतिरिक्त जानकारी प्रदान की।
आइए GPT-4 को वही छवि प्रदान करें और उससे छवि के बारे में पूछें। दोनों मॉडलों ने लगभग समान उत्तर दिए हैं। लेकिन मुझे GPT-4 प्रतिक्रिया अधिक पसंद है.
अब हम एपीआई को टेक्स्ट और छवि प्रदान करेंगे। हमने विज़न मॉडल से छवि को संदर्भ के रूप में उपयोग करके एक यात्रा ब्लॉग लिखने के लिए कहा है।
response = model.generate_content(["Write a travel blog post using the image as reference.", img])
Markdown(response.text)
इसने मुझे एक छोटा ब्लॉग उपलब्ध कराया है। मैं लंबे प्रारूप की उम्मीद कर रहा था।
GPT-4 की तुलना में, जेमिनी प्रो विज़न मॉडल को एक लंबे प्रारूप वाला ब्लॉग बनाने में संघर्ष करना पड़ा है।
हम आगे-पीछे चैट सत्र के लिए मॉडल स्थापित कर सकते हैं। इस तरह, मॉडल पिछली बातचीत का उपयोग करके संदर्भ और प्रतिक्रिया को याद रखता है।
हमारे मामले में, हमने चैट सत्र शुरू कर दिया है और मॉडल से Dota 2 गेम शुरू करने में मेरी मदद करने के लिए कहा है।
model = genai.GenerativeModel('gemini-pro')
chat = model.start_chat(history=[])
chat.send_message("Can you please guide me on how to start playing Dota 2?")
chat.history
जैसा कि आप देख सकते हैं, `चैट` ऑब्जेक्ट उपयोगकर्ता और मोड चैट के इतिहास को सहेज रहा है।
हम उन्हें मार्कडाउन शैली में भी प्रदर्शित कर सकते हैं।
for message in chat.history:
display(Markdown(f'**{message.role}**: {message.parts[0].text}'))
आइए अनुवर्ती प्रश्न पूछें।
chat.send_message("Which Dota 2 heroes should I start with?")
for message in chat.history:
display(Markdown(f'**{message.role}**: {message.parts[0].text}'))
हम नीचे स्क्रॉल कर सकते हैं और मॉडल के साथ पूरा सत्र देख सकते हैं।
संदर्भ-जागरूक अनुप्रयोगों के लिए एंबेडिंग मॉडल तेजी से लोकप्रिय हो रहे हैं। जेमिनी एम्बेडिंग-001 मॉडल शब्दों, वाक्यों या संपूर्ण दस्तावेज़ों को घने वैक्टर के रूप में प्रस्तुत करने की अनुमति देता है जो अर्थपूर्ण अर्थ को कूटबद्ध करते हैं। यह वेक्टर प्रतिनिधित्व पाठ के विभिन्न टुकड़ों के बीच उनके संबंधित एम्बेडिंग वैक्टर की तुलना करके आसानी से समानता की तुलना करना संभव बनाता है।
हम `एम्बेड_कंटेंट` को सामग्री प्रदान कर सकते हैं और टेक्स्ट को एम्बेडिंग में परिवर्तित कर सकते हैं। यह इतना आसान है.
output = genai.embed_content(
model="models/embedding-001",
content="Can you please guide me on how to start playing Dota 2?",
task_type="retrieval_document",
title="Embedding of Dota 2 question")
print(output['embedding'][0:10])
[0.060604308, -0.023885584, -0.007826327, -0.070592545, 0.021225851, 0.043229062, 0.06876691, 0.049298503, 0.039964676, 0.08291664]
हम 'सामग्री' तर्क में स्ट्रिंग्स की एक सूची पास करके टेक्स्ट के कई हिस्सों को एम्बेडिंग में बदल सकते हैं।
output = genai.embed_content(
model="models/embedding-001",
content=[
"Can you please guide me on how to start playing Dota 2?",
"Which Dota 2 heroes should I start with?",
],
task_type="retrieval_document",
title="Embedding of Dota 2 question")
for emb in output['embedding']:
print(emb[:10])
[0.060604308, -0.023885584, -0.007826327, -0.070592545, 0.021225851, 0.043229062, 0.06876691, 0.049298503, 0.039964676, 0.08291664]
[0.04775657, -0.044990525, -0.014886052, -0.08473655, 0.04060122, 0.035374347, 0.031866882, 0.071754575, 0.042207796, 0.04577447]
यदि आपको उसी परिणाम को पुन: प्रस्तुत करने में परेशानी हो रही है, तो मेरी जाँच करें डीपनोट कार्यक्षेत्र.
ऐसे कई उन्नत कार्य हैं जिन्हें हमने इस परिचयात्मक ट्यूटोरियल में शामिल नहीं किया है। आप जेमिनी एपीआई के बारे में अधिक जान सकते हैं जेमिनी एपीआई: पायथन के साथ क्विकस्टार्ट.
इस ट्यूटोरियल में, हमने जेमिनी के बारे में सीखा है और प्रतिक्रियाएँ उत्पन्न करने के लिए पायथन एपीआई तक कैसे पहुँचें। विशेष रूप से, हमने टेक्स्ट जेनरेशन, विज़ुअल समझ, स्ट्रीमिंग, वार्तालाप इतिहास, कस्टम आउटपुट और एम्बेडिंग के बारे में सीखा है। हालाँकि, यह सिर्फ मिथुन राशि वाले क्या कर सकते हैं इसकी सतह को खरोंच देता है।
निःशुल्क जेमिनी एपीआई का उपयोग करके आपने जो बनाया है उसे बेझिझक मेरे साथ साझा करें। संभावनाएं असीमित हैं.
आबिद अली अवनी (@1अबिदलियावान) एक प्रमाणित डेटा वैज्ञानिक पेशेवर है जो मशीन लर्निंग मॉडल बनाना पसंद करता है। वर्तमान में, वह सामग्री निर्माण और मशीन लर्निंग और डेटा विज्ञान प्रौद्योगिकियों पर तकनीकी ब्लॉग लिखने पर ध्यान केंद्रित कर रहा है। आबिद के पास प्रौद्योगिकी प्रबंधन में मास्टर डिग्री और दूरसंचार इंजीनियरिंग में स्नातक की डिग्री है। उनका दृष्टिकोण मानसिक बीमारी से जूझ रहे छात्रों के लिए ग्राफ न्यूरल नेटवर्क का उपयोग करके एआई उत्पाद बनाना है।
- एसईओ संचालित सामग्री और पीआर वितरण। आज ही प्रवर्धित हो जाओ।
- प्लेटोडेटा.नेटवर्क वर्टिकल जेनरेटिव एआई। स्वयं को शक्तिवान बनाएं। यहां पहुंचें।
- प्लेटोआईस्ट्रीम। Web3 इंटेलिजेंस। ज्ञान प्रवर्धित। यहां पहुंचें।
- प्लेटोईएसजी. कार्बन, क्लीनटेक, ऊर्जा, पर्यावरण, सौर, कचरा प्रबंधन। यहां पहुंचें।
- प्लेटोहेल्थ। बायोटेक और क्लिनिकल परीक्षण इंटेलिजेंस। यहां पहुंचें।
- स्रोत: https://www.kdnuggets.com/how-to-access-and-use-gemini-api-for-free?utm_source=rss&utm_medium=rss&utm_campaign=how-to-access-and-use-gemini-api-for-free
- :हैस
- :है
- $यूपी
- 1
- 10
- 12
- 13
- 14
- 17
- 27
- 7
- 8
- 9
- a
- About
- पहुँच
- सही रूप में
- के पार
- जोड़ने
- अतिरिक्त
- अतिरिक्त जानकारी
- उन्नत
- फिर
- AI
- एलियंस
- सब
- की अनुमति देता है
- लगभग
- भी
- अद्भुत
- an
- और
- जवाब
- anthropic
- एपीआई
- एपीआई
- अनुप्रयोगों
- स्थापत्य
- हैं
- तर्क
- AS
- पूछना
- At
- ऑडियो
- संतुलित
- BE
- बनने
- किया गया
- से पहले
- बेंचमार्क
- के बीच
- ब्लॉग
- ब्लॉग
- के छात्रों
- निर्माण
- इमारत
- बनाया गया
- व्यवसायों
- लेकिन
- बटन
- by
- बुलाया
- कर सकते हैं
- उम्मीदवार
- उम्मीदवारों
- क्षमताओं
- सक्षम
- मामला
- मामलों
- केंद्र
- प्रमाणित
- बातचीत
- चेक
- सफाई
- क्लिक करें
- कोड
- सहयोग
- तुलना
- की तुलना
- जटिल
- सामग्री
- सामग्री निर्माण
- प्रसंग
- कन्वर्सेशन (Conversation)
- बातचीत
- बदलना
- इसी
- आवरण
- निर्माण
- वर्तमान में
- रिवाज
- अनुकूलित
- तिथि
- डेटा केन्द्रों
- डेटा विज्ञान
- आँकड़े वाला वैज्ञानिक
- तारीख
- Deepmind
- डिग्री
- घना
- बनाया गया
- विकसित
- डेवलपर्स
- डिवाइस
- नहीं था
- विभिन्न
- डिस्प्ले
- कई
- do
- दस्तावेजों
- डॉन
- DotA
- Dota 2
- नीचे
- आसानी
- आसान
- कुशल
- कुशलता
- embedding
- अभियांत्रिकी
- संपूर्ण
- वातावरण
- ईथर (ईटीएच)
- उम्मीद
- विशेषज्ञों
- समझाना
- का पता लगाने
- और तेज
- प्रथम
- लचीला
- ध्यान केंद्रित
- का पालन करें
- के लिए
- प्रारूप
- मुक्त
- से
- समारोह
- कार्यों
- खेल
- मिथुन राशि
- उत्पन्न
- पीढ़ी
- मिल
- gif
- Go
- जा
- अच्छा
- गूगल
- गूगल की
- ग्राफ
- ग्राफ तंत्रिका नेटवर्क
- गाइड
- था
- है
- होने
- he
- मदद
- यहाँ उत्पन्न करें
- हीरोज
- हाई
- अत्यधिक
- उसके
- इतिहास
- रखती है
- कैसे
- How To
- तथापि
- HTTPS
- मानव
- i
- पहचान
- बीमारी
- की छवि
- छवियों
- आयात
- in
- सहित
- तेजी
- करें-
- आरंभ
- स्थापित
- उदाहरण
- बजाय
- एकीकरण
- में
- परिचयात्मक
- IT
- आईटी इस
- जेपीजी
- जूलिया
- केवल
- केडनगेट्स
- कुंजी
- ज्ञान
- भाषा
- सबसे बड़ा
- जानें
- सीखा
- सीख रहा हूँ
- पसंद
- असीम
- लिंक्डइन
- सूची
- भार
- लंबे समय तक
- प्यार करता है
- मशीन
- यंत्र अधिगम
- बनाता है
- प्रबंध
- बहुत
- विशाल
- मास्टर
- मैक्स
- me
- अर्थ
- साधन
- मानसिक
- मानसिक बीमारी
- मेट्रिक्स
- मोबाइल
- मोबाइल उपकरणों
- मोड
- आदर्श
- मॉडल
- अधिक
- अधिकांश
- विभिन्न
- नाम
- नैनो
- एनबीए
- नेटवर्क
- तंत्रिका
- तंत्रिका नेटवर्क
- नया
- अगला
- अभी
- वस्तु
- of
- on
- ONE
- केवल
- OpenAI
- संचालित
- or
- OS
- हमारी
- आउट
- मात करना
- उत्पादन
- महल
- विशेष
- पासिंग
- उत्तम
- प्रदर्शन
- प्रदर्शन
- स्टाफ़
- फ़ोटो
- टुकड़े
- प्लेटो
- प्लेटो डेटा इंटेलिजेंस
- प्लेटोडाटा
- खेल
- कृप्या अ
- बिन्दु
- लोकप्रिय
- संभावनाओं
- संभव
- पद
- संभावित
- पिछला
- प्रति
- मुसीबत
- समस्या को सुलझाना
- एस्ट्रो मॉल
- पेशेवर
- प्रदान करना
- बशर्ते
- प्रदान कर
- अजगर
- गुणवत्ता
- प्रश्नों
- प्रश्न
- बिल्कुल
- रेंज
- RE
- संदर्भ
- प्रतिनिधित्व
- प्रतिनिधित्व
- अनुसंधान
- प्रतिक्रिया
- प्रतिक्रियाएं
- परिणाम
- क्रांतिकारी बदलाव
- s
- वही
- बचत
- अनुमापकता
- स्केल
- स्केल एआई
- विज्ञान
- वैज्ञानिक
- स्क्रॉल
- अनुभाग
- देखना
- चयन
- सत्र
- सेट
- की स्थापना
- कई
- Share
- कम
- चाहिए
- समान
- सरल
- एक
- So
- सुलझाने
- अंतरिक्ष
- विशेष रूप से
- प्रारंभ
- शुरू
- राज्य के-the-कला
- कदम
- रुकें
- रोक
- कहानी
- धारा
- स्ट्रीमिंग
- संघर्ष
- छात्र
- अंदाज
- उपयुक्त
- सतह
- सिस्टम
- T
- कार्य
- टीमों
- तकनीकी
- टेक्नोलॉजीज
- टेक्नोलॉजी
- दूरसंचार
- परीक्षण
- परीक्षण
- टेक्स्ट
- पाठ पीढ़ी
- कि
- RSI
- लेकिन हाल ही
- उन
- फिर
- इसका
- तीन
- यहाँ
- सेवा मेरे
- टोकन
- यात्रा
- मुसीबत
- ट्यूटोरियल
- प्रकार
- अति
- समझना
- समझ
- us
- प्रयोग करने योग्य
- उपयोग
- उपयोगकर्ता
- का उपयोग
- परिवर्तनशील
- विभिन्न
- वीडियो
- दृष्टि
- दृश्य
- था
- मार्ग..
- we
- क्या
- कौन कौन से
- कौन
- चौड़ा
- विस्तृत श्रृंखला
- मर्जी
- साथ में
- शब्द
- शब्द
- काम
- विश्व
- लिखना
- लिख रहे हैं
- इसलिए आप
- आपका
- जेफिरनेट