Зображення автора
Gemini — це нова модель, розроблена Google, і Bard знову стає доступною для використання. З Gemini тепер можна отримати майже ідеальні відповіді на ваші запити, надаючи їм зображення, аудіо та текст.
У цьому підручнику ми дізнаємося про Gemini API і як налаштувати його на вашій машині. Ми також вивчимо різні функції Python API, включаючи генерацію тексту та розуміння зображень.
Близнюки це нова модель штучного інтелекту, розроблена завдяки співпраці між командами Google, зокрема Google Research і Google DeepMind. Його було створено спеціально для мультимодального режиму, тобто він може розуміти та працювати з різними типами даних, такими як текст, код, аудіо, зображення та відео.
Gemini — це найдосконаліша та найбільша модель ШІ, розроблена Google на сьогодні. Він був розроблений як дуже гнучкий, щоб він міг ефективно працювати в широкому діапазоні систем, від центрів обробки даних до мобільних пристроїв. Це означає, що він має потенціал революціонізувати спосіб, за допомогою якого компанії та розробники можуть створювати та масштабувати програми ШІ.
Ось три версії моделі Gemini, розроблені для різних випадків використання:
- Gemini Ultra: Найбільший і найдосконаліший ШІ, здатний виконувати складні завдання.
- GeminiPro: Збалансована модель, яка має хорошу продуктивність і масштабованість.
- Gemini Nano: Найбільш ефективний для мобільних пристроїв.
Зображення з Знайомство з Близнюками
Gemini Ultra має сучасну продуктивність, що перевищує продуктивність GPT-4 за кількома показниками. Це перша модель, яка перевершує експертів-людей у тесті Massive Multitask Language Understanding, який перевіряє знання світу та вирішення проблем у 57 різних предметах. Це демонструє його передові можливості розуміння та вирішення проблем.
Щоб використовувати API, ми маємо спочатку отримати ключ API, який ви можете звідси: https://ai.google.dev/tutorials/setup
Після цього натисніть кнопку «Отримати ключ API», а потім натисніть «Створити ключ API в новому проекті».
Скопіюйте ключ API та встановіть його як змінну середовища. Ми використовуємо Deepnote, і нам досить легко встановити ключ із назвою «GEMINI_API_KEY». Просто перейдіть до інтеграції, прокрутіть вниз і виберіть змінні середовища.
На наступному кроці ми встановимо API Python за допомогою PIP:
pip install -q -U google-generativeai
Після цього ми встановимо ключ API для GenAI Google і запустимо екземпляр.
import google.generativeai as genai
import os
gemini_api_key = os.environ["GEMINI_API_KEY"]
genai.configure(api_key = gemini_api_key)
Після налаштування ключа API використання моделі Gemini Pro для створення вмісту стає простим. Надайте підказку функції `generate_content` і відобразіть результат як Markdown.
from IPython.display import Markdown
model = genai.GenerativeModel('gemini-pro')
response = model.generate_content("Who is the GOAT in the NBA?")
Markdown(response.text)
Це дивно, але я не погоджуюся зі списком. Однак я розумію, що все залежить від особистих переваг.
Gemini може генерувати кілька відповідей, які називаються кандидатами, на одну підказку. Ви можете вибрати найбільш підходящий. У нашому випадку у нас була лише одна відповідь.
response.candidates
Давайте попросимо його написати просту гру на Python.
response = model.generate_content("Build a simple game in Python")
Markdown(response.text)
Результат простий і по суті. Більшість LLM починають пояснювати код Python замість того, щоб писати його.
Ви можете налаштувати свою відповідь за допомогою аргументу `generation_config`. Ми обмежуємо кількість кандидатів до 1, додаємо стоп-слово «пробіл» і встановлюємо максимальну кількість маркерів і температуру.
response = model.generate_content(
'Write a short story about aliens.',
generation_config=genai.types.GenerationConfig(
candidate_count=1,
stop_sequences=['space'],
max_output_tokens=200,
temperature=0.7)
)
Markdown(response.text)
Як бачимо, відповідь зупинилася перед словом «пробіл». Дивовижний.
Ви також можете використовувати аргумент `потік` для потокової передачі відповіді. Він схожий на API Anthropic і OpenAI, але швидший.
model = genai.GenerativeModel('gemini-pro')
response = model.generate_content("Write a Julia function for cleaning the data.", stream=True)
for chunk in response:
print(chunk.text)
У цьому розділі ми будемо завантажувати Масуда Асламі фотографію та використовуйте її, щоб перевірити мультимодальність Gemini Pro Vision.
Завантажте зображення в `PIL` і відобразіть його.
import PIL.Image
img = PIL.Image.open('images/photo-1.jpg')
img
У нас є високоякісна фотографія Rua Augusta Arch.
Давайте завантажимо модель Gemini Pro Vision і надамо їй зображення.
model = genai.GenerativeModel('gemini-pro-vision')
response = model.generate_content(img)
Markdown(response.text)
Макет точно ідентифікував палац і надав додаткову інформацію про його історію та архітектуру.
Давайте надамо те саме зображення GPT-4 і запитаємо його про зображення. Обидві моделі дали майже однакові відповіді. Але мені більше подобається відповідь GPT-4.
Тепер ми надамо текст і зображення API. Ми попросили модель бачення написати блог про подорожі, використовуючи зображення як посилання.
response = model.generate_content(["Write a travel blog post using the image as reference.", img])
Markdown(response.text)
Він надав мені короткий блог. Я очікував довшого формату.
У порівнянні з GPT-4 моделі Gemini Pro Vision було складно створити довгоформатний блог.
Ми можемо налаштувати модель для сеансу зворотнього чату. Таким чином, модель запам’ятовує контекст і відповідь, використовуючи попередні розмови.
У нашому випадку ми розпочали сеанс чату та попросили модель допомогти мені почати роботу з грою Dota 2.
model = genai.GenerativeModel('gemini-pro')
chat = model.start_chat(history=[])
chat.send_message("Can you please guide me on how to start playing Dota 2?")
chat.history
Як бачите, об’єкт `chat` зберігає історію користувача та режиму чату.
Ми також можемо відобразити їх у стилі Markdown.
for message in chat.history:
display(Markdown(f'**{message.role}**: {message.parts[0].text}'))
Давайте поставимо наступне запитання.
chat.send_message("Which Dota 2 heroes should I start with?")
for message in chat.history:
display(Markdown(f'**{message.role}**: {message.parts[0].text}'))
Ми можемо прокрутити вниз і переглянути весь сеанс із моделлю.
Моделі вбудовування стають все більш популярними для контекстно-орієнтованих програм. Модель Gemini embedding-001 дозволяє представляти слова, речення або цілі документи у вигляді щільних векторів, які кодують семантичне значення. Це векторне представлення дає змогу легко порівнювати подібність між різними фрагментами тексту шляхом порівняння їхніх відповідних векторів вбудовування.
Ми можемо надати вміст у `embed_content` і перетворити текст на вбудовування. Це так просто.
output = genai.embed_content(
model="models/embedding-001",
content="Can you please guide me on how to start playing Dota 2?",
task_type="retrieval_document",
title="Embedding of Dota 2 question")
print(output['embedding'][0:10])
[0.060604308, -0.023885584, -0.007826327, -0.070592545, 0.021225851, 0.043229062, 0.06876691, 0.049298503, 0.039964676, 0.08291664]
Ми можемо перетворити кілька фрагментів тексту на вбудовування, передавши список рядків аргументу «content».
output = genai.embed_content(
model="models/embedding-001",
content=[
"Can you please guide me on how to start playing Dota 2?",
"Which Dota 2 heroes should I start with?",
],
task_type="retrieval_document",
title="Embedding of Dota 2 question")
for emb in output['embedding']:
print(emb[:10])
[0.060604308, -0.023885584, -0.007826327, -0.070592545, 0.021225851, 0.043229062, 0.06876691, 0.049298503, 0.039964676, 0.08291664]
[0.04775657, -0.044990525, -0.014886052, -0.08473655, 0.04060122, 0.035374347, 0.031866882, 0.071754575, 0.042207796, 0.04577447]
Якщо у вас виникли проблеми з відтворенням того самого результату, перегляньте мій Робоча область Deepnote.
Існує так багато розширених функцій, які ми не розглянули в цьому вступному посібнику. Ви можете дізнатися більше про Gemini API, перейшовши на API Gemini: швидкий початок роботи з Python.
У цьому посібнику ми дізналися про Gemini та про те, як отримати доступ до API Python для створення відповідей. Зокрема, ми дізналися про генерацію тексту, візуальне розуміння, потокове передавання, історію розмов, користувацький вихід і вбудовування. Однак це лише поверхня того, що можуть зробити Близнюки.
Не соромтеся поділитися зі мною тим, що ви створили за допомогою безкоштовного Gemini API. Можливості безмежні.
Абід Алі Аван (@1abidaliawan) є сертифікованим фахівцем із дослідження даних, який любить створювати моделі машинного навчання. Зараз він зосереджується на створенні контенту та написанні технічних блогів про технології машинного навчання та науки про дані. Абід має ступінь магістра з управління технологіями та ступінь бакалавра в галузі телекомунікаційної інженерії. Його бачення полягає в тому, щоб створити продукт AI з використанням нейронної мережі графа для студентів, які борються з психічними захворюваннями.
- Розповсюдження контенту та PR на основі SEO. Отримайте посилення сьогодні.
- PlatoData.Network Vertical Generative Ai. Додайте собі сили. Доступ тут.
- PlatoAiStream. Web3 Intelligence. Розширення знань. Доступ тут.
- ПлатонЕСГ. вуглець, CleanTech, Енергія, Навколишнє середовище, Сонячна, Поводження з відходами. Доступ тут.
- PlatoHealth. Розвідка про біотехнології та клінічні випробування. Доступ тут.
- джерело: https://www.kdnuggets.com/how-to-access-and-use-gemini-api-for-free?utm_source=rss&utm_medium=rss&utm_campaign=how-to-access-and-use-gemini-api-for-free
- : має
- :є
- $UP
- 1
- 10
- 12
- 13
- 14
- 17
- 27
- 7
- 8
- 9
- a
- МЕНЮ
- доступ
- точно
- через
- додати
- Додатковий
- Додаткова інформація
- просунутий
- знову
- AI
- іноземців
- ВСІ
- дозволяє
- майже
- Також
- дивовижний
- an
- та
- Відповіді
- Антропний
- API
- Інтерфейси
- застосування
- архітектура
- ЕСТЬ
- аргумент
- AS
- запитати
- At
- аудіо
- Збалансований
- BE
- становлення
- було
- перед тим
- еталонний тест
- між
- Блог
- блоги
- обидва
- будувати
- Створюємо
- побудований
- підприємства
- але
- button
- by
- званий
- CAN
- кандидат
- кандидатів
- можливості
- здатний
- випадок
- випадків
- Центри
- Сертифікований
- чат
- перевірка
- Очищення
- клацання
- код
- співробітництво
- порівняти
- порівняння
- комплекс
- зміст
- контент-створення
- контекст
- Розмова
- розмови
- конвертувати
- Відповідний
- обкладинка
- створення
- В даний час
- виготовлений на замовлення
- налаштувати
- дані
- центрів обробки даних
- наука про дані
- вчений даних
- Дата
- Deepmind
- Ступінь
- щільний
- призначений
- розвиненою
- розробників
- прилади
- А не було
- різний
- дисплей
- Різне
- do
- документація
- Дон
- dota
- Dota 2
- вниз
- легко
- легко
- ефективний
- продуктивно
- вбудовування
- Машинобудування
- Весь
- Навколишнє середовище
- Ефір (ETH)
- очікував
- experts
- Пояснювати
- дослідити
- швидше
- Перший
- гнучкий
- фокусування
- стежити
- для
- формат
- Безкоштовна
- від
- функція
- Функції
- гра
- Близнюки
- породжувати
- покоління
- отримати
- GIF
- Go
- буде
- добре
- Google,
- графік
- Графік нейронної мережі
- керівництво
- було
- Мати
- має
- he
- допомога
- тут
- Герої
- Високий
- дуже
- його
- історія
- тримає
- Як
- How To
- Однак
- HTTPS
- людина
- i
- ідентифікований
- хвороба
- зображення
- зображень
- імпорт
- in
- У тому числі
- все більше і більше
- інформація
- ініціювати
- встановлювати
- екземпляр
- замість
- інтеграція
- в
- вступний
- IT
- ЙОГО
- JPG
- Юлія
- просто
- KDnuggets
- ключ
- знання
- мова
- найбільших
- УЧИТЬСЯ
- вчений
- вивчення
- як
- безмежний
- список
- загрузка
- довше
- любить
- машина
- навчання за допомогою машини
- РОБОТИ
- управління
- багато
- масивний
- майстер
- Макс
- me
- сенс
- засоби
- психічний
- Психічні розлади
- Метрика
- Mobile
- мобільні пристрої
- режим
- модель
- Моделі
- більше
- найбільш
- множинний
- ім'я
- нано
- NBA
- мережу
- Нейронний
- нейронної мережі
- Нові
- наступний
- зараз
- об'єкт
- of
- on
- ONE
- тільки
- OpenAI
- працювати
- or
- OS
- наші
- з
- Вищі результати
- вихід
- Palace
- приватність
- Проходження
- ідеальний
- продуктивність
- виконанні
- персонал
- фото
- частин
- plato
- Інформація про дані Платона
- PlatoData
- ігри
- будь ласка
- точка
- популярний
- можливостей
- це можливо
- пошта
- потенціал
- попередній
- Pro
- Проблема
- вирішення проблем
- Product
- професійний
- забезпечувати
- за умови
- забезпечення
- Python
- якість
- запити
- питання
- досить
- діапазон
- RE
- посилання
- подання
- представлений
- дослідження
- відповідь
- відповіді
- результат
- здійснити революцію
- s
- то ж
- економія
- масштабованість
- шкала
- масштаб ai
- наука
- вчений
- прокрутки
- розділ
- побачити
- вибрати
- Сесія
- комплект
- установка
- кілька
- Поділитись
- Короткий
- Повинен
- аналогічний
- простий
- один
- So
- Розв’язування
- Простір
- конкретно
- старт
- почалася
- впроваджений
- Крок
- Стоп
- зупинений
- Історія
- потік
- потоковий
- Бореться
- Студентам
- стиль
- підходящий
- поверхню
- Systems
- T
- завдання
- команди
- технічний
- Технології
- Технологія
- телекомунікації
- тест
- Тести
- текст
- генерація тексту
- Що
- Команда
- їх
- Їх
- потім
- це
- три
- через
- до
- Жетони
- подорожувати
- біда
- підручник
- Типи
- Ультра
- розуміти
- розуміння
- us
- корисний
- використання
- користувач
- використання
- змінна
- різний
- Відео
- бачення
- візуальний
- було
- шлях..
- we
- Що
- який
- ВООЗ
- широкий
- Широкий діапазон
- волі
- з
- слово
- слова
- Work
- світ
- запис
- лист
- ви
- вашу
- зефірнет