תמונה מאת המחבר
Gemini הוא דגם חדש שפותח על ידי גוגל, ובארד הופך להיות שמיש שוב. עם Gemini, ניתן כעת לקבל תשובות כמעט מושלמות לשאילתות שלך על ידי מתן תמונות, אודיו וטקסט.
במדריך זה, נלמד על ה-API של Gemini וכיצד להגדיר אותו במחשב שלך. כמו כן, נחקור פונקציות שונות של Python API, כולל יצירת טקסט והבנת תמונה.
מזל תאומים הוא מודל AI חדש שפותח באמצעות שיתוף פעולה בין צוותים בגוגל, כולל Google Research ו-Google DeepMind. הוא נבנה במיוחד כדי להיות מולטי-מודאלי, כלומר הוא יכול להבין ולעבוד עם סוגים שונים של נתונים כמו טקסט, קוד, אודיו, תמונות ווידאו.
Gemini הוא דגם הבינה המלאכותית המתקדם והגדול ביותר שפותחה על ידי גוגל עד כה. הוא תוכנן להיות גמיש ביותר כך שהוא יכול לפעול ביעילות במגוון רחב של מערכות, ממרכזי נתונים ועד מכשירים ניידים. המשמעות היא שיש לה פוטנציאל לחולל מהפכה בדרך שבה עסקים ומפתחים יכולים לבנות ולהרחיב יישומי AI.
להלן שלוש גרסאות של דגם Gemini המיועדות למקרי שימוש שונים:
- Gemini Ultra: AI הגדול והמתקדם ביותר המסוגל לבצע משימות מורכבות.
- GeminiPro: דגם מאוזן בעל ביצועים טובים ומדרגיות.
- תאומים ננו: היעיל ביותר עבור מכשירים ניידים.
תמונה מתוך היכרות עם תאומים
ל-Gemini Ultra יש ביצועים עדכניים, העולים על הביצועים של GPT-4 במספר מדדים. זהו המודל הראשון שעובר על מומחים אנושיים במדד הבנת השפה הרב-משימות המסיבי, שבודק ידע ופתרון בעיות בעולם ב-57 נושאים מגוונים. זה מציג את ההבנה המתקדמות שלו ואת יכולות פתרון הבעיות שלו.
כדי להשתמש ב-API, עלינו לקבל תחילה מפתח API שתוכלו מכאן: https://ai.google.dev/tutorials/setup
לאחר מכן לחץ על כפתור "קבל מפתח API" ולאחר מכן לחץ על "צור מפתח API בפרויקט חדש".
העתק את מפתח ה-API והגדר אותו כמשתנה סביבה. אנו משתמשים ב-Deepnote ודי קל לנו להגדיר את המפתח עם השם "GEMINI_API_KEY". פשוט עבור לאינטגרציה, גלול מטה ובחר משתני סביבה.
בשלב הבא, נתקין את ה-API של Python באמצעות PIP:
pip install -q -U google-generativeai
לאחר מכן, נגדיר את מפתח ה-API ל-GenAI של גוגל ונתחיל את המופע.
import google.generativeai as genai
import os
gemini_api_key = os.environ["GEMINI_API_KEY"]
genai.configure(api_key = gemini_api_key)
לאחר הגדרת מפתח ה-API, השימוש במודל Gemini Pro ליצירת תוכן הוא פשוט. ספק הנחיה לפונקציית `generate_content` והצג את הפלט כ-Markdown.
from IPython.display import Markdown
model = genai.GenerativeModel('gemini-pro')
response = model.generate_content("Who is the GOAT in the NBA?")
Markdown(response.text)
זה מדהים, אבל אני לא מסכים עם הרשימה. עם זאת, אני מבין שזה הכל עניין של העדפה אישית.
מזל תאומים יכול ליצור מספר תגובות, הנקראות מועמדים, עבור הנחיה אחת. אתה יכול לבחור את המתאים ביותר. במקרה שלנו הייתה לנו רק תגובה אחת.
response.candidates
בואו נבקש ממנו לכתוב משחק פשוט בפייתון.
response = model.generate_content("Build a simple game in Python")
Markdown(response.text)
התוצאה פשוטה ועניינית. רוב ה-LLMs מתחילים להסביר את קוד Python במקום לכתוב אותו.
אתה יכול להתאים אישית את התגובה שלך באמצעות הארגומנט `generation_config`. אנו מגבילים את ספירת המועמדים ל-1, מוסיפים את מילת העצירה "רווח", ומגדירים אסימונים וטמפרטורה מקסימלית.
response = model.generate_content(
'Write a short story about aliens.',
generation_config=genai.types.GenerationConfig(
candidate_count=1,
stop_sequences=['space'],
max_output_tokens=200,
temperature=0.7)
)
Markdown(response.text)
כפי שאתה יכול לראות, התגובה נעצרה לפני המילה "רווח". מדהים.
אתה יכול גם להשתמש בארגומנט 'זרם' כדי להזרים את התגובה. זה דומה לממשקי API של Anthropic ו-OpenAI אבל מהיר יותר.
model = genai.GenerativeModel('gemini-pro')
response = model.generate_content("Write a Julia function for cleaning the data.", stream=True)
for chunk in response:
print(chunk.text)
בחלק זה, נטען של מסעוד אסלאמי צילום והשתמש בו כדי לבדוק את הרב-מודאליות של Gemini Pro Vision.
טען את התמונות ל-'PIL' והצג אותו.
import PIL.Image
img = PIL.Image.open('images/photo-1.jpg')
img
יש לנו תמונה באיכות גבוהה של Rua Augusta Arch.
בואו נטען את דגם Gemini Pro Vision ונספק לו את התמונה.
model = genai.GenerativeModel('gemini-pro-vision')
response = model.generate_content(img)
Markdown(response.text)
הדגם זיהה במדויק את הארמון וסיפק מידע נוסף על ההיסטוריה והארכיטקטורה שלו.
בואו נספק את אותה תמונה ל-GPT-4 ונשאל אותו על התמונה. שני הדגמים סיפקו תשובות כמעט דומות. אבל אני אוהב יותר את תגובת GPT-4.
כעת נספק טקסט ותמונה ל-API. ביקשנו ממודל החזון לכתוב בלוג טיולים תוך שימוש בתמונה כעיון.
response = model.generate_content(["Write a travel blog post using the image as reference.", img])
Markdown(response.text)
זה סיפק לי בלוג קצר. ציפיתי לפורמט ארוך יותר.
בהשוואה ל-GPT-4, מודל Gemini Pro Vision התקשה ליצור בלוג בפורמט ארוך.
אנחנו יכולים להגדיר את המודל להפעלת צ'אט הלוך ושוב. כך, המודל זוכר את ההקשר והתגובה באמצעות השיחות הקודמות.
במקרה שלנו, התחלנו את סשן הצ'אט וביקשנו מהדגם לעזור לי להתחיל עם המשחק Dota 2.
model = genai.GenerativeModel('gemini-pro')
chat = model.start_chat(history=[])
chat.send_message("Can you please guide me on how to start playing Dota 2?")
chat.history
כפי שאתה יכול לראות, האובייקט 'צ'אט' שומר את ההיסטוריה של המשתמש והצ'אט במצב.
אנחנו יכולים גם להציג אותם בסגנון Markdown.
for message in chat.history:
display(Markdown(f'**{message.role}**: {message.parts[0].text}'))
בואו נשאל את שאלת ההמשך.
chat.send_message("Which Dota 2 heroes should I start with?")
for message in chat.history:
display(Markdown(f'**{message.role}**: {message.parts[0].text}'))
נוכל לגלול למטה ולראות את כל הפגישה עם הדגם.
דגמי הטבעה הופכים פופולריים יותר ויותר עבור יישומים מודעים להקשר. מודל ה-Gemini embedding-001 מאפשר ייצוג של מילים, משפטים או מסמכים שלמים בתור וקטורים צפופים המקודדים משמעות סמנטית. ייצוג וקטור זה מאפשר להשוות בקלות את הדמיון בין חלקי טקסט שונים על ידי השוואה של וקטורי הטבעה המתאימים להם.
אנחנו יכולים לספק את התוכן ל-'embed_content' ולהמיר את הטקסט להטמעות. זה כל כך פשוט.
output = genai.embed_content(
model="models/embedding-001",
content="Can you please guide me on how to start playing Dota 2?",
task_type="retrieval_document",
title="Embedding of Dota 2 question")
print(output['embedding'][0:10])
[0.060604308, -0.023885584, -0.007826327, -0.070592545, 0.021225851, 0.043229062, 0.06876691, 0.049298503, 0.039964676, 0.08291664]
אנו יכולים להמיר חלקי טקסט מרובים להטמעות על ידי העברת רשימה של מחרוזות לארגומנט 'תוכן'.
output = genai.embed_content(
model="models/embedding-001",
content=[
"Can you please guide me on how to start playing Dota 2?",
"Which Dota 2 heroes should I start with?",
],
task_type="retrieval_document",
title="Embedding of Dota 2 question")
for emb in output['embedding']:
print(emb[:10])
[0.060604308, -0.023885584, -0.007826327, -0.070592545, 0.021225851, 0.043229062, 0.06876691, 0.049298503, 0.039964676, 0.08291664]
[0.04775657, -0.044990525, -0.014886052, -0.08473655, 0.04060122, 0.035374347, 0.031866882, 0.071754575, 0.042207796, 0.04577447]
אם אתה מתקשה לשחזר את אותה תוצאה, בדוק את שלי סביבת עבודה עמוקה.
יש כל כך הרבה פונקציות מתקדמות שלא כיסינו במדריך המבוא הזה. תוכל ללמוד עוד על ה-API של Gemini על ידי מעבר אל Gemini API: התחלה מהירה עם Python.
במדריך זה, למדנו על Gemini וכיצד לגשת ל-API של Python כדי ליצור תגובות. בפרט, למדנו על יצירת טקסט, הבנה ויזואלית, סטרימינג, היסטוריית שיחות, פלט מותאם אישית והטמעות. עם זאת, זה רק מגרד את פני השטח של מה שתאומים יכולים לעשות.
אתה מוזמן לשתף אותי במה שבנית באמצעות ה-API החינמי של Gemini. האפשרויות הן בלתי מוגבלות.
עביד עלי אוואן (@1abidaliawan) הוא איש מקצוע מוסמך של מדען נתונים שאוהב לבנות מודלים של למידת מכונה. נכון לעכשיו, הוא מתמקד ביצירת תוכן וכתיבת בלוגים טכניים על למידת מכונה וטכנולוגיות מדעי נתונים. עביד הוא בעל תואר שני בניהול טכנולוגיה ותואר ראשון בהנדסת טלקומוניקציה. החזון שלו הוא לבנות מוצר בינה מלאכותית באמצעות רשת עצבית גרפית עבור תלמידים הנאבקים במחלות נפש.
- הפצת תוכן ויחסי ציבור מופעל על ידי SEO. קבל הגברה היום.
- PlatoData.Network Vertical Generative Ai. העצים את עצמך. גישה כאן.
- PlatoAiStream. Web3 Intelligence. הידע מוגבר. גישה כאן.
- PlatoESG. פחמן, קלינטק, אנרגיה, סביבה, שמש, ניהול פסולת. גישה כאן.
- PlatoHealth. מודיעין ביוטכנולוגיה וניסויים קליניים. גישה כאן.
- מקור: https://www.kdnuggets.com/how-to-access-and-use-gemini-api-for-free?utm_source=rss&utm_medium=rss&utm_campaign=how-to-access-and-use-gemini-api-for-free
- :יש ל
- :הוא
- $ למעלה
- 1
- 10
- 12
- 13
- 14
- 17
- 27
- 7
- 8
- 9
- a
- אודות
- גישה
- במדויק
- לרוחב
- מוסיף
- נוסף
- מידע נוסף
- מתקדם
- שוב
- AI
- חייזרים
- תעשיות
- מאפשר
- כמעט
- גם
- מדהים
- an
- ו
- תשובות
- אנתרופי
- API
- ממשקי API
- יישומים
- ארכיטקטורה
- ARE
- טענה
- AS
- לשאול
- At
- אודיו
- מאוזן
- BE
- התהוות
- היה
- לפני
- בנצ 'מרק
- בֵּין
- בלוג
- בלוגים
- שניהם
- לִבנוֹת
- בִּניָן
- נבנה
- עסקים
- אבל
- לַחְצָן
- by
- נקרא
- CAN
- מועמד
- מועמדים
- יכולות
- מסוגל
- מקרה
- מקרים
- מרכזים
- מוסמך
- צ'אט
- לבדוק
- ניקוי
- קליק
- קוד
- שיתוף פעולה
- לְהַשְׁווֹת
- השוואה
- מורכב
- תוכן
- יצירת תוכן
- הקשר
- שיחה
- שיחות
- להמיר
- תוֹאֵם
- לכסות
- יצירה
- כיום
- מנהג
- אישית
- נתונים
- מרכז נתונים
- מדע נתונים
- מדען נתונים
- תַאֲרִיך
- Deepmind
- תואר
- צפוף
- מעוצב
- מפותח
- מפתחים
- התקנים
- לא
- אחר
- לְהַצִיג
- שונה
- do
- מסמכים
- דון
- דוטה
- Dota 2
- מטה
- בקלות
- קל
- יעיל
- יעילות
- הטבעה
- הנדסה
- שלם
- סביבה
- Ether (ETH)
- מצפה
- מומחים
- להסביר
- לחקור
- מהר יותר
- ראשון
- גמיש
- התמקדות
- לעקוב
- בעד
- פוּרמָט
- חופשי
- החל מ-
- פונקציה
- פונקציות
- מִשְׂחָק
- מזל תאומים
- ליצור
- דור
- לקבל
- gif
- Go
- הולך
- טוב
- גוגל
- גרף
- גרף רשת עצבית
- מדריך
- היה
- יש
- יש
- he
- לעזור
- כאן
- גיבורים
- גָבוֹהַ
- מאוד
- שֶׁלוֹ
- היסטוריה
- מחזיק
- איך
- איך
- אולם
- HTTPS
- בן אנוש
- i
- מזוהה
- מחלה
- תמונה
- תמונות
- לייבא
- in
- כולל
- יותר ויותר
- מידע
- ליזום
- להתקין
- למשל
- במקום
- השתלבות
- אל תוך
- מבוא
- IT
- שֶׁלָה
- jpg
- ג'וליה
- רק
- KDnuggets
- מפתח
- ידע
- שפה
- הגדול ביותר
- לִלמוֹד
- למד
- למידה
- כמו
- בלתי מוגבלות
- לינקדין
- רשימה
- לִטעוֹן
- עוד
- אוהב
- מכונה
- למידת מכונה
- עושה
- ניהול
- רב
- מסיבי
- אב
- מקסימום
- me
- משמעות
- אומר
- נפשי
- מחלת נפש
- מדדים
- סלולרי
- מכשירים ניידים
- מצב
- מודל
- מודלים
- יותר
- רוב
- מספר
- שם
- ננו
- ה-NBA
- רשת
- עצביים
- רשת עצבית
- חדש
- הבא
- עַכשָׁיו
- אובייקט
- of
- on
- ONE
- רק
- OpenAI
- להפעיל
- or
- OS
- שלנו
- הַחוּצָה
- ביצועים טובים יותר
- תפוקה
- אַרְמוֹן
- מסוים
- חולף
- ביצועים
- ביצוע
- אישי
- צילום
- חתיכות
- אפלטון
- מודיעין אפלטון
- אפלטון נתונים
- משחק
- אנא
- נקודה
- פופולרי
- אפשרויות
- אפשרי
- הודעה
- פוטנציאל
- קודם
- מִקצוֹעָן
- בעיה
- פתרון בעיות
- המוצר
- מקצועי
- לספק
- ובלבד
- מתן
- פיתון
- איכות
- שאילתות
- שאלה
- דַי
- רכס
- RE
- הפניה
- נציגות
- מיוצג
- מחקר
- תגובה
- תגובות
- תוצאה
- לְחוֹלֵל מַהְפֵּכָה
- s
- אותו
- חסכת
- בקרת מערכות ותקשורת
- סולם
- סולם ai
- מדע
- מַדְעָן
- לגלול
- סעיף
- לִרְאוֹת
- בחר
- מושב
- סט
- הצבה
- כמה
- שיתוף
- קצר
- צריך
- דומה
- פָּשׁוּט
- יחיד
- So
- פותר
- מֶרחָב
- במיוחד
- התחלה
- החל
- מדינה-of-the-art
- שלב
- עצור
- נעצר
- סיפור
- זרם
- נהירה
- נאבק
- סטודנטים
- סגנון
- מַתְאִים
- משטח
- מערכות
- T
- משימות
- צוותי
- טכני
- טכנולוגיות
- טכנולוגיה
- טֵלֵקוֹמוּנִיקַציָה
- מבחן
- בדיקות
- טֶקסט
- דור טקסט
- זֶה
- השמיים
- שֶׁלָהֶם
- אותם
- אז
- זֶה
- שְׁלוֹשָׁה
- דרך
- ל
- מטבעות
- נסיעות
- צרה
- הדרכה
- סוגים
- Ultra
- להבין
- הבנה
- us
- שָׁמִישׁ
- להשתמש
- משתמש
- באמצעות
- משתנה
- שונים
- וִידֵאוֹ
- חזון
- חזותי
- היה
- דֶרֶך..
- we
- מה
- אשר
- מי
- רָחָב
- טווח רחב
- יצטרך
- עם
- Word
- מילים
- תיק עבודות
- עוֹלָם
- לכתוב
- כתיבה
- אתה
- זפירנט