ภาพโดยผู้เขียน
Gemini เป็นโมเดลใหม่ที่พัฒนาโดย Google และ Bard ก็กลับมาใช้งานได้อีกครั้ง ด้วย Gemini คุณสามารถได้รับคำตอบที่เกือบจะสมบูรณ์แบบสำหรับคำถามของคุณโดยการระบุรูปภาพ เสียง และข้อความ
ในบทช่วยสอนนี้ เราจะเรียนรู้เกี่ยวกับ Gemini API และวิธีการตั้งค่าบนเครื่องของคุณ นอกจากนี้เรายังจะสำรวจฟังก์ชัน Python API ต่างๆ รวมถึงการสร้างข้อความและการทำความเข้าใจรูปภาพ
เมถุน เป็นโมเดล AI ใหม่ที่พัฒนาผ่านการทำงานร่วมกันระหว่างทีมงานของ Google รวมถึง Google Research และ Google DeepMind สร้างขึ้นเป็นพิเศษเพื่อให้เป็นแบบหลายรูปแบบ ซึ่งหมายความว่าสามารถเข้าใจและทำงานกับข้อมูลประเภทต่างๆ ได้ เช่น ข้อความ โค้ด เสียง รูปภาพ และวิดีโอ
Gemini เป็นโมเดล AI ที่ทันสมัยและใหญ่ที่สุดที่พัฒนาโดย Google จนถึงปัจจุบัน ได้รับการออกแบบให้มีความยืดหยุ่นสูงเพื่อให้สามารถทำงานได้อย่างมีประสิทธิภาพบนระบบที่หลากหลาย ตั้งแต่ศูนย์ข้อมูลไปจนถึงอุปกรณ์เคลื่อนที่ ซึ่งหมายความว่ามีศักยภาพที่จะปฏิวัติวิธีที่ธุรกิจและนักพัฒนาสามารถสร้างและปรับขนาดแอปพลิเคชัน AI ได้
นี่คือรุ่น Gemini สามเวอร์ชันที่ออกแบบมาสำหรับกรณีการใช้งานที่แตกต่างกัน:
- ราศีเมถุนอัลตร้า: AI ที่ใหญ่ที่สุดและทันสมัยที่สุดที่สามารถทำงานที่ซับซ้อนได้
- ราศีเมถุนโปร: โมเดลที่สมดุลซึ่งมีประสิทธิภาพที่ดีและสามารถปรับขนาดได้
- ราศีเมถุนนาโน: มีประสิทธิภาพสูงสุดสำหรับอุปกรณ์พกพา
ภาพจาก แนะนำราศีเมถุน
Gemini Ultra มีประสิทธิภาพที่ล้ำสมัย ซึ่งเหนือกว่าประสิทธิภาพของ GPT-4 ในหลายตัวชี้วัด เป็นโมเดลแรกที่มีประสิทธิภาพเหนือกว่าผู้เชี่ยวชาญที่เป็นมนุษย์ในเกณฑ์มาตรฐานการทำความเข้าใจภาษาแบบมัลติทาสก์ขนาดใหญ่ ซึ่งทดสอบความรู้ระดับโลกและการแก้ปัญหาใน 57 วิชาที่หลากหลาย สิ่งนี้แสดงให้เห็นถึงความเข้าใจขั้นสูงและความสามารถในการแก้ไขปัญหา
หากต้องการใช้ API เราต้องได้รับคีย์ API ที่คุณสามารถทำได้จากที่นี่ก่อน: https://ai.google.dev/tutorials/setup
หลังจากนั้นคลิกที่ปุ่ม "รับคีย์ API" จากนั้นคลิกที่ "สร้างคีย์ API ในโครงการใหม่"
คัดลอกคีย์ API และตั้งค่าเป็นตัวแปรสภาพแวดล้อม เรากำลังใช้ Deepnote และการตั้งค่าคีย์ด้วยชื่อ "GEMINI_API_KEY" ค่อนข้างง่าย เพียงไปที่การบูรณาการ เลื่อนลงและเลือกตัวแปรสภาพแวดล้อม
ในขั้นตอนถัดไป เราจะติดตั้ง Python API โดยใช้ PIP:
pip install -q -U google-generativeai
หลังจากนั้น เราจะตั้งค่าคีย์ API เป็น GenAI ของ Google และเริ่มต้นอินสแตนซ์
import google.generativeai as genai
import os
gemini_api_key = os.environ["GEMINI_API_KEY"]
genai.configure(api_key = gemini_api_key)
หลังจากตั้งค่าคีย์ API แล้ว การใช้โมเดล Gemini Pro เพื่อสร้างเนื้อหาก็เป็นเรื่องง่าย ระบุข้อความแจ้งไปยังฟังก์ชัน `generate_content` และแสดงเอาต์พุตเป็น Markdown
from IPython.display import Markdown
model = genai.GenerativeModel('gemini-pro')
response = model.generate_content("Who is the GOAT in the NBA?")
Markdown(response.text)
น่าทึ่งมาก แต่ฉันไม่เห็นด้วยกับรายการ อย่างไรก็ตาม ฉันเข้าใจว่ามันเป็นเรื่องของความชอบส่วนบุคคล
ราศีเมถุนสามารถสร้างคำตอบได้หลายรายการ เรียกว่าผู้สมัครรับข้อความในข้อความเดียว คุณสามารถเลือกสิ่งที่เหมาะสมที่สุดได้ ในกรณีของเรา เรามีคำตอบเดียวเท่านั้น
response.candidates
เรามาขอให้มันเขียนเกมง่ายๆ ใน Python กันดีกว่า
response = model.generate_content("Build a simple game in Python")
Markdown(response.text)
ผลลัพธ์นั้นง่ายและตรงประเด็น LLM ส่วนใหญ่เริ่มอธิบายโค้ด Python แทนที่จะเขียนมัน
คุณสามารถปรับแต่งการตอบสนองของคุณได้โดยใช้อาร์กิวเมนต์ `generic_config` เรากำลังจำกัดการนับผู้สมัครไว้ที่ 1 โดยเพิ่มคำว่า "ช่องว่าง" และตั้งค่าโทเค็นและอุณหภูมิสูงสุด
response = model.generate_content(
'Write a short story about aliens.',
generation_config=genai.types.GenerationConfig(
candidate_count=1,
stop_sequences=['space'],
max_output_tokens=200,
temperature=0.7)
)
Markdown(response.text)
อย่างที่คุณเห็น การตอบสนองหยุดลงก่อนคำว่า "ช่องว่าง" อัศจรรย์.
คุณยังสามารถใช้อาร์กิวเมนต์ "สตรีม" เพื่อสตรีมการตอบกลับได้ คล้ายกับ Anthropic และ OpenAI API แต่เร็วกว่า
model = genai.GenerativeModel('gemini-pro')
response = model.generate_content("Write a Julia function for cleaning the data.", stream=True)
for chunk in response:
print(chunk.text)
ในส่วนนี้เราจะโหลด ของมาซูด อัสลามี ถ่ายภาพและใช้เพื่อทดสอบความหลากหลายของ Gemini Pro Vision
โหลดภาพไปที่ `PIL` และแสดง
import PIL.Image
img = PIL.Image.open('images/photo-1.jpg')
img
เรามีภาพถ่ายคุณภาพสูงของ Rua Augusta Arch
มาโหลดโมเดล Gemini Pro Vision แล้วแนบไปกับรูปภาพกัน
model = genai.GenerativeModel('gemini-pro-vision')
response = model.generate_content(img)
Markdown(response.text)
แบบจำลองระบุพระราชวังได้อย่างแม่นยำและให้ข้อมูลเพิ่มเติมเกี่ยวกับประวัติศาสตร์และสถาปัตยกรรม
เรามาจัดเตรียมรูปภาพเดียวกันให้กับ GPT-4 และถามเกี่ยวกับรูปภาพนั้นกัน ทั้งสองรุ่นให้คำตอบที่เกือบจะคล้ายกัน แต่ฉันชอบการตอบสนองของ GPT-4 มากกว่า
ตอนนี้เราจะจัดเตรียมข้อความและรูปภาพให้กับ API เราได้ขอให้ Vision Model เขียนบล็อกท่องเที่ยวโดยใช้รูปภาพเป็นข้อมูลอ้างอิง
response = model.generate_content(["Write a travel blog post using the image as reference.", img])
Markdown(response.text)
มันทำให้ฉันมีบล็อกสั้น ๆ ฉันคาดหวังรูปแบบที่ยาวกว่านี้
เมื่อเปรียบเทียบกับ GPT-4 โมเดล Gemini Pro Vision ประสบปัญหาในการสร้างบล็อกที่มีรูปแบบยาว
เราสามารถตั้งค่าโมเดลให้มีการสนทนาไปมาได้ ด้วยวิธีนี้ โมเดลจะจดจำบริบทและการตอบกลับโดยใช้การสนทนาก่อนหน้านี้
ในกรณีของเรา เราได้เริ่มเซสชันการแชทแล้วและขอให้โมเดลช่วยฉันในการเริ่มต้นเล่นเกม Dota 2
model = genai.GenerativeModel('gemini-pro')
chat = model.start_chat(history=[])
chat.send_message("Can you please guide me on how to start playing Dota 2?")
chat.history
อย่างที่คุณเห็น ออบเจ็กต์ "แชท" กำลังบันทึกประวัติของผู้ใช้และโหมดแชท
นอกจากนี้เรายังสามารถแสดงในรูปแบบ Markdown ได้อีกด้วย
for message in chat.history:
display(Markdown(f'**{message.role}**: {message.parts[0].text}'))
ลองถามคำถามติดตามผล
chat.send_message("Which Dota 2 heroes should I start with?")
for message in chat.history:
display(Markdown(f'**{message.role}**: {message.parts[0].text}'))
เราสามารถเลื่อนลงไปดูเซสชันทั้งหมดพร้อมกับโมเดลได้
โมเดลการฝังกำลังได้รับความนิยมมากขึ้นสำหรับแอปพลิเคชันแบบ Context-Aware โมเดล Gemini embedding-001 ช่วยให้คำ ประโยค หรือเอกสารทั้งหมดสามารถแสดงเป็นเวกเตอร์หนาแน่นที่เข้ารหัสความหมายเชิงความหมายได้ การแสดงเวกเตอร์นี้ทำให้สามารถเปรียบเทียบความคล้ายคลึงกันระหว่างส่วนต่างๆ ของข้อความได้อย่างง่ายดาย โดยการเปรียบเทียบเวกเตอร์ที่ฝังไว้ที่สอดคล้องกัน
เราสามารถจัดเตรียมเนื้อหาเป็น `embed_content` และแปลงข้อความเป็นการฝังได้ มันง่ายมาก
output = genai.embed_content(
model="models/embedding-001",
content="Can you please guide me on how to start playing Dota 2?",
task_type="retrieval_document",
title="Embedding of Dota 2 question")
print(output['embedding'][0:10])
[0.060604308, -0.023885584, -0.007826327, -0.070592545, 0.021225851, 0.043229062, 0.06876691, 0.049298503, 0.039964676, 0.08291664]
เราสามารถแปลงข้อความหลายชิ้นเป็นการฝังโดยส่งรายการสตริงไปยังอาร์กิวเมนต์ 'เนื้อหา'
output = genai.embed_content(
model="models/embedding-001",
content=[
"Can you please guide me on how to start playing Dota 2?",
"Which Dota 2 heroes should I start with?",
],
task_type="retrieval_document",
title="Embedding of Dota 2 question")
for emb in output['embedding']:
print(emb[:10])
[0.060604308, -0.023885584, -0.007826327, -0.070592545, 0.021225851, 0.043229062, 0.06876691, 0.049298503, 0.039964676, 0.08291664]
[0.04775657, -0.044990525, -0.014886052, -0.08473655, 0.04060122, 0.035374347, 0.031866882, 0.071754575, 0.042207796, 0.04577447]
หากคุณมีปัญหาในการสร้างผลลัพธ์เดียวกัน ลองดูของฉัน พื้นที่ทำงาน Deepnote.
มีฟังก์ชันขั้นสูงมากมายที่เราไม่ได้กล่าวถึงในบทช่วยสอนเบื้องต้นนี้ คุณสามารถเรียนรู้เพิ่มเติมเกี่ยวกับ Gemini API ได้โดยไปที่ Gemini API: เริ่มต้นอย่างรวดเร็วด้วย Python.
ในบทช่วยสอนนี้ เราได้เรียนรู้เกี่ยวกับ Gemini และวิธีเข้าถึง Python API เพื่อสร้างการตอบกลับ โดยเฉพาะอย่างยิ่ง เราได้เรียนรู้เกี่ยวกับการสร้างข้อความ การทำความเข้าใจด้วยภาพ การสตรีม ประวัติการสนทนา เอาต์พุตแบบกำหนดเอง และการฝัง อย่างไรก็ตาม นี่เป็นเพียงการขีดข่วนสิ่งที่ชาวราศีเมถุนสามารถทำได้เท่านั้น
โปรดแบ่งปันกับฉันถึงสิ่งที่คุณสร้างขึ้นโดยใช้ Gemini API ฟรี ความเป็นไปได้นั้นไร้ขีดจำกัด
อาบิด อาลี อาวัน (@1อบีดาลิวัน) เป็นนักวิทยาศาสตร์ข้อมูลที่ได้รับการรับรองมืออาชีพที่รักการสร้างแบบจำลองการเรียนรู้ของเครื่อง ปัจจุบันเขามุ่งเน้นไปที่การสร้างเนื้อหาและการเขียนบล็อกทางเทคนิคเกี่ยวกับการเรียนรู้ของเครื่องและเทคโนโลยีวิทยาศาสตร์ข้อมูล อาบิดสำเร็จการศึกษาระดับปริญญาโทด้านการจัดการเทคโนโลยีและปริญญาตรีสาขาวิศวกรรมโทรคมนาคม วิสัยทัศน์ของเขาคือการสร้างผลิตภัณฑ์ AI โดยใช้โครงข่ายประสาทเทียมแบบกราฟสำหรับนักเรียนที่ป่วยเป็นโรคทางจิต
- เนื้อหาที่ขับเคลื่อนด้วย SEO และการเผยแพร่ประชาสัมพันธ์ รับการขยายวันนี้
- PlatoData.Network Vertical Generative Ai เพิ่มพลังให้กับตัวเอง เข้าถึงได้ที่นี่.
- เพลโตไอสตรีม. Web3 อัจฉริยะ ขยายความรู้ เข้าถึงได้ที่นี่.
- เพลโตESG. คาร์บอน, คลีนเทค, พลังงาน, สิ่งแวดล้อม แสงอาทิตย์, การจัดการของเสีย. เข้าถึงได้ที่นี่.
- เพลโตสุขภาพ เทคโนโลยีชีวภาพและข่าวกรองการทดลองทางคลินิก เข้าถึงได้ที่นี่.
- ที่มา: https://www.kdnuggets.com/how-to-access-and-use-gemini-api-for-free?utm_source=rss&utm_medium=rss&utm_campaign=how-to-access-and-use-gemini-api-for-free
- :มี
- :เป็น
- $ ขึ้น
- 1
- 10
- 12
- 13
- 14
- 17
- 27
- 7
- 8
- 9
- a
- เกี่ยวกับเรา
- เข้า
- แม่นยำ
- ข้าม
- เพิ่ม
- เพิ่มเติม
- ข้อมูลเพิ่มเติม
- สูง
- อีกครั้ง
- AI
- มนุษย์ต่างดาว
- ทั้งหมด
- ช่วยให้
- เกือบจะ
- ด้วย
- น่าอัศจรรย์
- an
- และ
- คำตอบ
- มานุษยวิทยา
- API
- APIs
- การใช้งาน
- สถาปัตยกรรม
- เป็น
- อาร์กิวเมนต์
- AS
- ถาม
- At
- เสียง
- สมดุลย์
- BE
- สมควร
- รับ
- ก่อน
- มาตรฐาน
- ระหว่าง
- บล็อก
- Blog
- ทั้งสอง
- สร้าง
- การก่อสร้าง
- สร้าง
- ธุรกิจ
- แต่
- ปุ่ม
- by
- ที่เรียกว่า
- CAN
- ผู้สมัคร
- ผู้สมัคร
- ความสามารถในการ
- สามารถ
- กรณี
- กรณี
- ศูนย์
- มีมาตรฐาน
- พูดคุย
- ตรวจสอบ
- การทำความสะอาด
- คลิก
- รหัส
- การทำงานร่วมกัน
- เปรียบเทียบ
- เปรียบเทียบ
- ซับซ้อน
- เนื้อหา
- การสร้างเนื้อหา
- สิ่งแวดล้อม
- การสนทนา
- การสนทนา
- แปลง
- ตรงกัน
- หน้าปก
- การสร้าง
- ขณะนี้
- ประเพณี
- ปรับแต่ง
- ข้อมูล
- ศูนย์ข้อมูล
- วิทยาศาสตร์ข้อมูล
- นักวิทยาศาสตร์ข้อมูล
- วันที่
- Deepmind
- องศา
- หนาแน่น
- ได้รับการออกแบบ
- พัฒนา
- นักพัฒนา
- อุปกรณ์
- didn
- ต่าง
- แสดง
- หลาย
- do
- เอกสาร
- สวม
- dota
- Dota 2
- ลง
- อย่างง่ายดาย
- ง่าย
- ที่มีประสิทธิภาพ
- อย่างมีประสิทธิภาพ
- การฝัง
- ชั้นเยี่ยม
- ทั้งหมด
- สิ่งแวดล้อม
- อีเธอร์ (ETH)
- คาดหวังว่า
- ผู้เชี่ยวชาญ
- อธิบาย
- สำรวจ
- เร็วขึ้น
- ชื่อจริง
- มีความยืดหยุ่น
- โดยมุ่งเน้น
- ปฏิบัติตาม
- สำหรับ
- รูป
- ฟรี
- ราคาเริ่มต้นที่
- ฟังก์ชัน
- ฟังก์ชั่น
- เกม
- เมถุน
- สร้าง
- รุ่น
- ได้รับ
- GIF
- Go
- ไป
- ดี
- ของ Google
- กราฟ
- กราฟโครงข่ายประสาท
- ให้คำแนะนำ
- มี
- มี
- มี
- he
- ช่วย
- โปรดคลิกที่นี่เพื่ออ่านรายละเอียดเพิ่มเติม
- วีรบุรุษ
- จุดสูง
- อย่างสูง
- ของเขา
- ประวัติ
- ถือ
- สรุป ความน่าเชื่อถือของ Olymp Trade?
- ทำอย่างไร
- อย่างไรก็ตาม
- HTTPS
- เป็นมนุษย์
- i
- ระบุ
- การเจ็บป่วย
- ภาพ
- ภาพ
- นำเข้า
- in
- รวมทั้ง
- ขึ้น
- ข้อมูล
- เริ่มต้น
- ติดตั้ง
- ตัวอย่าง
- แทน
- บูรณาการ
- เข้าไป
- เบื้องต้น
- IT
- ITS
- jpg
- จูเลีย
- เพียงแค่
- KD นักเก็ต
- คีย์
- ความรู้
- ภาษา
- ใหญ่ที่สุด
- เรียนรู้
- ได้เรียนรู้
- การเรียนรู้
- กดไลก์
- ไม่ จำกัด
- รายการ
- โหลด
- อีกต่อไป
- รัก
- เครื่อง
- เรียนรู้เครื่อง
- ทำให้
- การจัดการ
- หลาย
- มาก
- เจ้านาย
- แม็กซ์
- me
- ความหมาย
- วิธี
- จิต
- จิตเภท
- ตัวชี้วัด
- โทรศัพท์มือถือ
- อุปกรณ์มือถือ
- โหมด
- แบบ
- โมเดล
- ข้อมูลเพิ่มเติม
- มากที่สุด
- หลาย
- ชื่อ
- นาโน
- เอ็นบีเอ
- เครือข่าย
- ประสาท
- เครือข่ายประสาท
- ใหม่
- ถัดไป
- ตอนนี้
- วัตถุ
- of
- on
- ONE
- เพียง
- OpenAI
- ทำงาน
- or
- OS
- ของเรา
- ออก
- แนะ
- เอาท์พุต
- พระราชวัง
- ในสิ่งที่สนใจ
- ที่ผ่านไป
- สมบูรณ์
- การปฏิบัติ
- ที่มีประสิทธิภาพ
- ส่วนบุคคล
- ภาพถ่าย
- ชิ้น
- เพลโต
- เพลโตดาต้าอินเทลลิเจนซ์
- เพลโตดาต้า
- เล่น
- กรุณา
- จุด
- ยอดนิยม
- ความเป็นไปได้
- เป็นไปได้
- โพสต์
- ที่มีศักยภาพ
- ก่อน
- มือโปร
- ปัญหา
- การแก้ปัญหา
- ผลิตภัณฑ์
- มืออาชีพ
- ให้
- ให้
- การให้
- หลาม
- คุณภาพ
- คำสั่ง
- คำถาม
- ทีเดียว
- พิสัย
- RE
- การอ้างอิง
- การแสดง
- เป็นตัวแทนของ
- การวิจัย
- คำตอบ
- การตอบสนอง
- ผล
- ปฏิวัติ
- s
- เดียวกัน
- ประหยัด
- scalability
- ขนาด
- ขนาดไอ
- วิทยาศาสตร์
- นักวิทยาศาสตร์
- เลื่อน
- Section
- เห็น
- เลือก
- เซสชั่น
- ชุด
- การตั้งค่า
- หลาย
- Share
- สั้น
- น่า
- คล้ายคลึงกัน
- ง่าย
- เดียว
- So
- การแก้
- ช่องว่าง
- เฉพาะ
- เริ่มต้น
- ข้อความที่เริ่ม
- รัฐของศิลปะ
- ขั้นตอน
- หยุด
- หยุด
- เรื่องราว
- กระแส
- ที่พริ้ว
- การดิ้นรน
- นักเรียน
- สไตล์
- เหมาะสม
- พื้นผิว
- ระบบ
- T
- งาน
- ทีม
- วิชาการ
- เทคโนโลยี
- เทคโนโลยี
- การสื่อสารโทรคมนาคม
- ทดสอบ
- การทดสอบ
- ข้อความ
- การสร้างข้อความ
- ที่
- พื้นที่
- ของพวกเขา
- พวกเขา
- แล้วก็
- นี้
- สาม
- ตลอด
- ไปยัง
- ราชสกุล
- การเดินทาง
- ปัญหา
- เกี่ยวกับการสอน
- ชนิด
- รุนแรง
- เข้าใจ
- ความเข้าใจ
- us
- ใช้ได้
- ใช้
- ผู้ใช้งาน
- การใช้
- ตัวแปร
- ต่างๆ
- วีดีโอ
- วิสัยทัศน์
- ภาพ
- คือ
- ทาง..
- we
- อะไร
- ที่
- WHO
- กว้าง
- ช่วงกว้าง
- จะ
- กับ
- คำ
- คำ
- งาน
- โลก
- เขียน
- การเขียน
- เธอ
- ของคุณ
- ลมทะเล