כיצד לגשת ולהשתמש ב-Gemini API בחינם - KDnuggets

כיצד לגשת ולהשתמש ב-Gemini API בחינם - KDnuggets

צומת המקור: 3033824

כיצד לגשת ולהשתמש ב-Gemini API בחינם
תמונה מאת המחבר 

Gemini הוא דגם חדש שפותח על ידי גוגל, ובארד הופך להיות שמיש שוב. עם Gemini, ניתן כעת לקבל תשובות כמעט מושלמות לשאילתות שלך על ידי מתן תמונות, אודיו וטקסט.

במדריך זה, נלמד על ה-API של Gemini וכיצד להגדיר אותו במחשב שלך. כמו כן, נחקור פונקציות שונות של Python API, כולל יצירת טקסט והבנת תמונה.

מזל תאומים הוא מודל AI חדש שפותח באמצעות שיתוף פעולה בין צוותים בגוגל, כולל Google Research ו-Google DeepMind. הוא נבנה במיוחד כדי להיות מולטי-מודאלי, כלומר הוא יכול להבין ולעבוד עם סוגים שונים של נתונים כמו טקסט, קוד, אודיו, תמונות ווידאו.

Gemini הוא דגם הבינה המלאכותית המתקדם והגדול ביותר שפותחה על ידי גוגל עד כה. הוא תוכנן להיות גמיש ביותר כך שהוא יכול לפעול ביעילות במגוון רחב של מערכות, ממרכזי נתונים ועד מכשירים ניידים. המשמעות היא שיש לה פוטנציאל לחולל מהפכה בדרך שבה עסקים ומפתחים יכולים לבנות ולהרחיב יישומי AI.

להלן שלוש גרסאות של דגם Gemini המיועדות למקרי שימוש שונים:

  • Gemini Ultra: AI הגדול והמתקדם ביותר המסוגל לבצע משימות מורכבות.
  • GeminiPro: דגם מאוזן בעל ביצועים טובים ומדרגיות.
  • תאומים ננו: היעיל ביותר עבור מכשירים ניידים.

 

כיצד לגשת ולהשתמש ב-Gemini API בחינם
תמונה מתוך היכרות עם תאומים
 

ל-Gemini Ultra יש ביצועים עדכניים, העולים על הביצועים של GPT-4 במספר מדדים. זהו המודל הראשון שעובר על מומחים אנושיים במדד הבנת השפה הרב-משימות המסיבי, שבודק ידע ופתרון בעיות בעולם ב-57 נושאים מגוונים. זה מציג את ההבנה המתקדמות שלו ואת יכולות פתרון הבעיות שלו.

כדי להשתמש ב-API, עלינו לקבל תחילה מפתח API שתוכלו מכאן: https://ai.google.dev/tutorials/setup

 
כיצד לגשת ולהשתמש ב-Gemini API בחינם

כיצד לגשת ולהשתמש ב-Gemini API בחינם
 

לאחר מכן לחץ על כפתור "קבל מפתח API" ולאחר מכן לחץ על "צור מפתח API בפרויקט חדש".

 
כיצד לגשת ולהשתמש ב-Gemini API בחינם

כיצד לגשת ולהשתמש ב-Gemini API בחינם
 

העתק את מפתח ה-API והגדר אותו כמשתנה סביבה. אנו משתמשים ב-Deepnote ודי קל לנו להגדיר את המפתח עם השם "GEMINI_API_KEY". פשוט עבור לאינטגרציה, גלול מטה ובחר משתני סביבה.

 
כיצד לגשת ולהשתמש ב-Gemini API בחינם

כיצד לגשת ולהשתמש ב-Gemini API בחינם
 

בשלב הבא, נתקין את ה-API של Python באמצעות PIP:

pip install -q -U google-generativeai

לאחר מכן, נגדיר את מפתח ה-API ל-GenAI של גוגל ונתחיל את המופע.

import google.generativeai as genai
import os

gemini_api_key = os.environ["GEMINI_API_KEY"]
genai.configure(api_key = gemini_api_key)

לאחר הגדרת מפתח ה-API, השימוש במודל Gemini Pro ליצירת תוכן הוא פשוט. ספק הנחיה לפונקציית `generate_content` והצג את הפלט כ-Markdown.

from IPython.display import Markdown

model = genai.GenerativeModel('gemini-pro')
response = model.generate_content("Who is the GOAT in the NBA?")

Markdown(response.text)

זה מדהים, אבל אני לא מסכים עם הרשימה. עם זאת, אני מבין שזה הכל עניין של העדפה אישית.

 
כיצד לגשת ולהשתמש ב-Gemini API בחינם

כיצד לגשת ולהשתמש ב-Gemini API בחינם
 

מזל תאומים יכול ליצור מספר תגובות, הנקראות מועמדים, עבור הנחיה אחת. אתה יכול לבחור את המתאים ביותר. במקרה שלנו הייתה לנו רק תגובה אחת.

response.candidates

כיצד לגשת ולהשתמש ב-Gemini API בחינם

כיצד לגשת ולהשתמש ב-Gemini API בחינם
 

בואו נבקש ממנו לכתוב משחק פשוט בפייתון.

response = model.generate_content("Build a simple game in Python")

Markdown(response.text)

התוצאה פשוטה ועניינית. רוב ה-LLMs מתחילים להסביר את קוד Python במקום לכתוב אותו.

כיצד לגשת ולהשתמש ב-Gemini API בחינם

כיצד לגשת ולהשתמש ב-Gemini API בחינם

אתה יכול להתאים אישית את התגובה שלך באמצעות הארגומנט `generation_config`. אנו מגבילים את ספירת המועמדים ל-1, מוסיפים את מילת העצירה "רווח", ומגדירים אסימונים וטמפרטורה מקסימלית.

response = model.generate_content(
    'Write a short story about aliens.',
    generation_config=genai.types.GenerationConfig(
        candidate_count=1,
        stop_sequences=['space'],
        max_output_tokens=200,
        temperature=0.7)
)

Markdown(response.text)

כפי שאתה יכול לראות, התגובה נעצרה לפני המילה "רווח". מדהים.

 
כיצד לגשת ולהשתמש ב-Gemini API בחינם

כיצד לגשת ולהשתמש ב-Gemini API בחינם

אתה יכול גם להשתמש בארגומנט 'זרם' כדי להזרים את התגובה. זה דומה לממשקי API של Anthropic ו-OpenAI אבל מהיר יותר.

model = genai.GenerativeModel('gemini-pro')
response = model.generate_content("Write a Julia function for cleaning the data.", stream=True)

for chunk in response:
    print(chunk.text)

כיצד לגשת ולהשתמש ב-Gemini API בחינם

כיצד לגשת ולהשתמש ב-Gemini API בחינם

בחלק זה, נטען של מסעוד אסלאמי צילום והשתמש בו כדי לבדוק את הרב-מודאליות של Gemini Pro Vision.

טען את התמונות ל-'PIL' והצג אותו.

import PIL.Image

img = PIL.Image.open('images/photo-1.jpg')

img

יש לנו תמונה באיכות גבוהה של Rua Augusta Arch.

 
כיצד לגשת ולהשתמש ב-Gemini API בחינם

כיצד לגשת ולהשתמש ב-Gemini API בחינם
 

בואו נטען את דגם Gemini Pro Vision ונספק לו את התמונה.

model = genai.GenerativeModel('gemini-pro-vision')

response = model.generate_content(img)

Markdown(response.text)

הדגם זיהה במדויק את הארמון וסיפק מידע נוסף על ההיסטוריה והארכיטקטורה שלו.

 
כיצד לגשת ולהשתמש ב-Gemini API בחינם

כיצד לגשת ולהשתמש ב-Gemini API בחינם
 

בואו נספק את אותה תמונה ל-GPT-4 ונשאל אותו על התמונה. שני הדגמים סיפקו תשובות כמעט דומות. אבל אני אוהב יותר את תגובת GPT-4.

 
כיצד לגשת ולהשתמש ב-Gemini API בחינם

כיצד לגשת ולהשתמש ב-Gemini API בחינם
 

כעת נספק טקסט ותמונה ל-API. ביקשנו ממודל החזון לכתוב בלוג טיולים תוך שימוש בתמונה כעיון.

response = model.generate_content(["Write a travel blog post using the image as reference.", img])

Markdown(response.text)

זה סיפק לי בלוג קצר. ציפיתי לפורמט ארוך יותר.

 
כיצד לגשת ולהשתמש ב-Gemini API בחינם

כיצד לגשת ולהשתמש ב-Gemini API בחינם
 

בהשוואה ל-GPT-4, מודל Gemini Pro Vision התקשה ליצור בלוג בפורמט ארוך.

 
כיצד לגשת ולהשתמש ב-Gemini API בחינם

כיצד לגשת ולהשתמש ב-Gemini API בחינם

אנחנו יכולים להגדיר את המודל להפעלת צ'אט הלוך ושוב. כך, המודל זוכר את ההקשר והתגובה באמצעות השיחות הקודמות.

במקרה שלנו, התחלנו את סשן הצ'אט וביקשנו מהדגם לעזור לי להתחיל עם המשחק Dota 2.

model = genai.GenerativeModel('gemini-pro')

chat = model.start_chat(history=[])

chat.send_message("Can you please guide me on how to start playing Dota 2?")

chat.history

כפי שאתה יכול לראות, האובייקט 'צ'אט' שומר את ההיסטוריה של המשתמש והצ'אט במצב.

 
כיצד לגשת ולהשתמש ב-Gemini API בחינם

כיצד לגשת ולהשתמש ב-Gemini API בחינם
 
אנחנו יכולים גם להציג אותם בסגנון Markdown.

for message in chat.history:
    display(Markdown(f'**{message.role}**: {message.parts[0].text}'))

כיצד לגשת ולהשתמש ב-Gemini API בחינם

כיצד לגשת ולהשתמש ב-Gemini API בחינם
 

בואו נשאל את שאלת ההמשך.

chat.send_message("Which Dota 2 heroes should I start with?")

for message in chat.history:
    display(Markdown(f'**{message.role}**: {message.parts[0].text}'))

נוכל לגלול למטה ולראות את כל הפגישה עם הדגם.

 
כיצד לגשת ולהשתמש ב-Gemini API בחינם

כיצד לגשת ולהשתמש ב-Gemini API בחינם

דגמי הטבעה הופכים פופולריים יותר ויותר עבור יישומים מודעים להקשר. מודל ה-Gemini embedding-001 מאפשר ייצוג של מילים, משפטים או מסמכים שלמים בתור וקטורים צפופים המקודדים משמעות סמנטית. ייצוג וקטור זה מאפשר להשוות בקלות את הדמיון בין חלקי טקסט שונים על ידי השוואה של וקטורי הטבעה המתאימים להם.

אנחנו יכולים לספק את התוכן ל-'embed_content' ולהמיר את הטקסט להטמעות. זה כל כך פשוט.

output = genai.embed_content(
    model="models/embedding-001",
    content="Can you please guide me on how to start playing Dota 2?",
    task_type="retrieval_document",
    title="Embedding of Dota 2 question")

print(output['embedding'][0:10])
[0.060604308, -0.023885584, -0.007826327, -0.070592545, 0.021225851, 0.043229062, 0.06876691, 0.049298503, 0.039964676, 0.08291664]

אנו יכולים להמיר חלקי טקסט מרובים להטמעות על ידי העברת רשימה של מחרוזות לארגומנט 'תוכן'.

output = genai.embed_content(
    model="models/embedding-001",
    content=[
        "Can you please guide me on how to start playing Dota 2?",
        "Which Dota 2 heroes should I start with?",
    ],
    task_type="retrieval_document",
    title="Embedding of Dota 2 question")

for emb in output['embedding']:
    print(emb[:10])
[0.060604308, -0.023885584, -0.007826327, -0.070592545, 0.021225851, 0.043229062, 0.06876691, 0.049298503, 0.039964676, 0.08291664]

[0.04775657, -0.044990525, -0.014886052, -0.08473655, 0.04060122, 0.035374347, 0.031866882, 0.071754575, 0.042207796, 0.04577447]

אם אתה מתקשה לשחזר את אותה תוצאה, בדוק את שלי סביבת עבודה עמוקה.

יש כל כך הרבה פונקציות מתקדמות שלא כיסינו במדריך המבוא הזה. תוכל ללמוד עוד על ה-API של Gemini על ידי מעבר אל Gemini API: התחלה מהירה עם Python.

במדריך זה, למדנו על Gemini וכיצד לגשת ל-API של Python כדי ליצור תגובות. בפרט, למדנו על יצירת טקסט, הבנה ויזואלית, סטרימינג, היסטוריית שיחות, פלט מותאם אישית והטמעות. עם זאת, זה רק מגרד את פני השטח של מה שתאומים יכולים לעשות.

אתה מוזמן לשתף אותי במה שבנית באמצעות ה-API החינמי של Gemini. האפשרויות הן בלתי מוגבלות.

 
 

עביד עלי אוואן (@1abidaliawan) הוא איש מקצוע מוסמך של מדען נתונים שאוהב לבנות מודלים של למידת מכונה. נכון לעכשיו, הוא מתמקד ביצירת תוכן וכתיבת בלוגים טכניים על למידת מכונה וטכנולוגיות מדעי נתונים. עביד הוא בעל תואר שני בניהול טכנולוגיה ותואר ראשון בהנדסת טלקומוניקציה. החזון שלו הוא לבנות מוצר בינה מלאכותית באמצעות רשת עצבית גרפית עבור תלמידים הנאבקים במחלות נפש.

בול זמן:

עוד מ KDnuggets