การดึงข้อมูล-การสร้างเสริมและเวิร์กโฟลว์ RAG

เผยแพร่ซ้ำโดยเพลโต

ผู้ติดตาม: 0

บทนำ

การดึงข้อมูล Augmented Generation หรือ RAG เป็นกลไกที่ช่วยให้โมเดลภาษาขนาดใหญ่ (LLM) เช่น GPT มีประโยชน์และมีความรู้มากขึ้น โดยการดึงข้อมูลจากที่จัดเก็บข้อมูลที่เป็นประโยชน์ เหมือนกับการดึงหนังสือจากห้องสมุด นี่คือวิธีที่ RAG สร้างความมหัศจรรย์ด้วยเวิร์กโฟลว์ AI ที่เรียบง่าย:

ฐานความรู้ (อินพุต): คิดว่านี่เป็นห้องสมุดขนาดใหญ่ที่เต็มไปด้วยสิ่งที่มีประโยชน์ เช่น คำถามที่พบบ่อย คู่มือ เอกสาร ฯลฯ เมื่อมีคำถามปรากฏขึ้น ระบบจะค้นหาคำตอบที่นี่
ทริกเกอร์/แบบสอบถาม (อินพุต): นี่คือจุดเริ่มต้น โดยปกติแล้ว มันเป็นคำถามหรือคำขอจากผู้ใช้ที่บอกระบบว่า “เฮ้ ฉันต้องการให้คุณทำอะไรสักอย่าง!”
งาน/การดำเนินการ (เอาท์พุต): เมื่อระบบได้รับทริกเกอร์ ระบบก็จะเริ่มทำงาน หากเป็นคำถามก็จะขุดคำตอบ หากเป็นการร้องขอให้ทำอะไรสักอย่าง สิ่งนั้นก็จะสำเร็จ

ตอนนี้ เรามาแบ่งกลไก RAG ออกเป็นขั้นตอนง่ายๆ กัน:

การแก้ไข: ก่อนอื่น เมื่อมีคำถามหรือคำขอเข้ามา RAG จะสำรวจฐานความรู้เพื่อค้นหาข้อมูลที่เกี่ยวข้อง
การขยาย: ต่อไปจะนำข้อมูลนี้มาผสมกับคำถามหรือคำขอเดิม เหมือนกับการเพิ่มรายละเอียดเพิ่มเติมให้กับคำขอพื้นฐานเพื่อให้แน่ใจว่าระบบเข้าใจอย่างถ่องแท้
รุ่น: สุดท้ายนี้ ด้วยข้อมูลที่สมบูรณ์ทั้งหมดนี้ ระบบจะป้อนเข้าสู่โมเดลภาษาขนาดใหญ่ จากนั้นจึงประดิษฐ์คำตอบที่มีข้อมูลครบถ้วนหรือดำเนินการตามที่จำเป็น

โดยสรุป RAG ก็เหมือนกับการมีผู้ช่วยอัจฉริยะที่ค้นหาข้อมูลที่เป็นประโยชน์ก่อน แล้วผสมผสานกับคำถามที่มีอยู่ จากนั้นให้คำตอบที่รอบด้านหรือทำงานตามที่จำเป็น ด้วยวิธีนี้ RAG ช่วยให้ระบบ AI ของคุณไม่เพียงแค่ถ่ายภาพในที่มืดเท่านั้น มีฐานข้อมูลที่มั่นคงในการทำงาน ทำให้เชื่อถือได้และเป็นประโยชน์มากขึ้น

พวกเขาแก้ปัญหาอะไร?

การเชื่อมช่องว่างความรู้

Generative AI ซึ่งขับเคลื่อนโดย LLM มีความเชี่ยวชาญในการวางไข่ตอบกลับข้อความโดยอิงตามข้อมูลจำนวนมหาศาลที่ได้รับการฝึกฝน แม้ว่าการฝึกอบรมนี้จะทำให้สามารถสร้างข้อความที่อ่านได้และมีรายละเอียด แต่ลักษณะคงที่ของข้อมูลการฝึกอบรมถือเป็นข้อจำกัดที่สำคัญ ข้อมูลภายในโมเดลจะล้าสมัยเมื่อเวลาผ่านไป และในสถานการณ์แบบไดนามิก เช่น แชทบอทขององค์กร การไม่มีข้อมูลแบบเรียลไทม์หรือข้อมูลเฉพาะองค์กรอาจนำไปสู่การตอบสนองที่ไม่ถูกต้องหรือทำให้เข้าใจผิดได้ สถานการณ์นี้เป็นอันตรายเนื่องจากจะบ่อนทำลายความไว้วางใจของผู้ใช้ในเทคโนโลยี ทำให้เกิดความท้าทายที่สำคัญ โดยเฉพาะอย่างยิ่งในแอปพลิเคชันที่เน้นลูกค้าเป็นศูนย์กลางหรือมีความสำคัญต่อภารกิจ

โซลูชั่น RAG

RAG เข้ามาช่วยเหลือด้วยการผสมผสานความสามารถในการสร้างของ LLM เข้ากับการดึงข้อมูลแบบกำหนดเป้าหมายแบบเรียลไทม์ โดยไม่ต้องเปลี่ยนแปลงโมเดลพื้นฐาน การผสมผสานนี้ทำให้ระบบ AI สามารถให้การตอบสนองที่ไม่เพียงแต่เหมาะสมกับบริบทเท่านั้น แต่ยังอิงตามข้อมูลล่าสุดอีกด้วย ตัวอย่างเช่น ในสถานการณ์ลีกกีฬา ในขณะที่ LLM สามารถให้ข้อมูลทั่วไปเกี่ยวกับกีฬาหรือทีมได้ แต่ RAG ก็ให้อำนาจ AI ในการส่งมอบการอัปเดตแบบเรียลไทม์เกี่ยวกับเกมล่าสุดหรือการบาดเจ็บของผู้เล่นโดยการเข้าถึงแหล่งข้อมูลภายนอก เช่น ฐานข้อมูล ฟีดข่าว หรือ แม้แต่ที่เก็บข้อมูลของลีกเอง

ข้อมูลที่เป็นปัจจุบันอยู่เสมอ

สาระสำคัญของ RAG อยู่ที่ความสามารถในการเพิ่ม LLM ด้วยข้อมูลเฉพาะโดเมนที่สดใหม่ การอัปเดตคลังความรู้อย่างต่อเนื่องใน RAG เป็นวิธีที่คุ้มค่าเพื่อให้แน่ใจว่า AI ที่สร้างยังคงเป็นปัจจุบัน ยิ่งไปกว่านั้น ยังให้บริบทอีกชั้นหนึ่งที่ LLM ทั่วไปขาด ซึ่งจะช่วยปรับปรุงคุณภาพของการตอบสนอง ความสามารถในการระบุ แก้ไข หรือลบข้อมูลที่ไม่ถูกต้องภายในคลังความรู้ของ RAG ช่วยเพิ่มความน่าสนใจยิ่งขึ้น ทำให้มั่นใจได้ถึงกลไกการแก้ไขด้วยตนเองเพื่อการดึงข้อมูลที่แม่นยำยิ่งขึ้น

ตัวอย่างของเวิร์กโฟลว์ RAG

ในขอบเขตการพัฒนาของปัญญาประดิษฐ์ การดึงข้อมูล-Augmented Generation (RAG) กำลังสร้างผลกระทบอย่างมากในภาคธุรกิจต่างๆ โดยการเพิ่มขีดความสามารถของโมเดลภาษาขนาดใหญ่ (LLM) อย่างมีนัยสำคัญ ให้เราดูตัวอย่างบางส่วนเพื่อทำความเข้าใจว่าเวิร์กโฟลว์ RAG ทำให้งานต่างๆ เป็นแบบอัตโนมัติได้อย่างไร

การสืบค้นและแบ่งปันความรู้ภายในทีม:
1. สถานการณ์สมมติ: บริษัทข้ามชาติที่มีผลงานโครงการที่หลากหลายมักเผชิญกับความท้าทายในการแบ่งปันความรู้และข้อมูลเชิงลึกระหว่างทีมอย่างมีประสิทธิภาพ เพื่อบรรเทาปัญหานี้ บริษัทจึงใช้แพลตฟอร์มเสริม RAG เพื่อปรับปรุงการดึงและแบ่งปันความรู้ภายใน
2. ขั้นตอนการทำงาน:
  1. การแก้ไข:
    1. ตัวอย่างคำถาม: ผู้จัดการโครงการถามว่า “เราเคยทำงานในโครงการที่เกี่ยวข้องกับพลังงานทดแทนในช่วง XNUMX ปีที่ผ่านมาหรือไม่”
    2. กลไก RAG จะค้นหาฐานข้อมูลภายใน รายงานโครงการที่ผ่านมา และที่เก็บข้อมูลอื่นๆ ที่เกี่ยวข้องทันทีเพื่อดึงข้อมูลเกี่ยวกับการมีส่วนร่วมของบริษัทในโครงการพลังงานทดแทนในช่วงเวลาที่กำหนด
  2. การขยาย:
    1. ข้อมูลที่ดึงมาประกอบด้วยชื่อโครงการ บุคลากรหลัก การส่งมอบขั้นสุดท้าย และผลลัพธ์ของแต่ละโครงการ
    2. นอกจากนี้ยังอาจดึงลิงก์ไปยังการสื่อสาร การนำเสนอ หรือเอกสารที่เกี่ยวข้องที่มีการแชร์ภายในระหว่างโครงการเหล่านี้
  3. รุ่น:
    1. ตัวอย่างคำตอบ: ระบบสร้างการตอบสนองที่ครอบคลุม:
      “ใช่ ในช่วงสามปีที่ผ่านมา เราได้มีส่วนร่วมในโครงการพลังงานหมุนเวียนที่สำคัญสามโครงการ โครงการ 'Solar Innovations' นำโดย Sarah Johnson จากทีมความยั่งยืน และได้ข้อสรุปในเดือนธันวาคม 2021 ด้วยการพัฒนาต้นแบบสถานีชาร์จพลังงานแสงอาทิตย์ โครงการ 'ประสิทธิภาพพลังงานลม' นำโดย Mark D'Souza มุ่งเป้าไปที่การเพิ่มประสิทธิภาพกังหันลม และแล้วเสร็จในเดือนมิถุนายน 2022 สุดท้ายนี้ 'การสนับสนุนนโยบายพลังงานทดแทน' เป็นความคิดริเริ่มข้ามแผนกซึ่งสรุปในเดือนกันยายน 2022 โดยสร้างข้อเสนอเชิงนโยบาย เพื่อส่งเสริมการใช้พลังงานหมุนเวียนภายในชุมชนท้องถิ่น สามารถเข้าถึงเอกสาร รายงาน และการนำเสนอที่เกี่ยวข้องได้ผ่านลิงก์ที่ให้ไว้”
แคมเปญการตลาดอัตโนมัติ:
- สถานการณ์: เอเจนซี่การตลาดดิจิทัลใช้ RAG เพื่อสร้างและปรับใช้แคมเปญการตลาดโดยอัตโนมัติตามแนวโน้มของตลาดแบบเรียลไทม์และพฤติกรรมผู้บริโภค
- Workflow:
  - การแก้ไข: เมื่อใดก็ตามที่ลูกค้าเป้าหมายใหม่เข้ามาในระบบ กลไก RAG จะดึงรายละเอียดที่เกี่ยวข้องของลูกค้าเป้าหมายและองค์กรของพวกเขา และทริกเกอร์การเริ่มต้นเวิร์กโฟลว์
  - การขยาย: โดยจะรวมข้อมูลนี้เข้ากับวัตถุประสงค์ทางการตลาด หลักเกณฑ์ของแบรนด์ และข้อมูลประชากรเป้าหมายของลูกค้า
  - การปฏิบัติงาน: ระบบจะออกแบบและปรับใช้แคมเปญการตลาดที่ปรับแต่งตามความต้องการในช่องทางดิจิทัลต่างๆ โดยอัตโนมัติ เพื่อใช้ประโยชน์จากแนวโน้มที่ระบุ ติดตามประสิทธิภาพของแคมเปญแบบเรียลไทม์เพื่อการปรับเปลี่ยนที่เป็นไปได้
การวิจัยทางกฎหมายและการเตรียมคดี:
- สถานการณ์: สำนักงานกฎหมายรวม RAG เพื่อเร่งการวิจัยทางกฎหมายและการเตรียมคดี
- Workflow:
  - การแก้ไข: เมื่อได้รับข้อมูลเกี่ยวกับคดีใหม่ ระบบจะดึงตัวอย่างทางกฎหมาย กฎเกณฑ์ และการตัดสินล่าสุดที่เกี่ยวข้องขึ้นมา
  - การขยาย: มันเชื่อมโยงข้อมูลนี้กับรายละเอียดเคส
  - รุ่น: ระบบจะร่างบทสรุปคดีเบื้องต้น ซึ่งช่วยลดเวลาที่ทนายความใช้ในการค้นคว้าเบื้องต้นได้อย่างมาก
การเพิ่มประสิทธิภาพการบริการลูกค้า:
- สถานการณ์: บริษัทโทรคมนาคมใช้แชทบอทเสริม RAG เพื่อจัดการข้อสงสัยของลูกค้าเกี่ยวกับรายละเอียดแผน การเรียกเก็บเงิน และการแก้ไขปัญหาทั่วไป
- Workflow:
  - การแก้ไข: เมื่อได้รับคำถามเกี่ยวกับค่าเผื่อข้อมูลของแผนเฉพาะ ระบบจะอ้างอิงแผนและข้อเสนอล่าสุดจากฐานข้อมูล
  - การขยาย: โดยจะรวมข้อมูลที่ดึงมานี้เข้ากับรายละเอียดแผนปัจจุบันของลูกค้า (จากโปรไฟล์ลูกค้า) และการสอบถามดั้งเดิม
  - รุ่น: ระบบจะสร้างการตอบสนองที่ปรับให้เหมาะสม โดยอธิบายความแตกต่างของค่าเผื่อข้อมูลระหว่างแผนปัจจุบันของลูกค้าและแผนที่สอบถาม
การจัดการสินค้าคงคลังและการเรียงลำดับใหม่:
1. สถานการณ์สมมติ: บริษัทอีคอมเมิร์ซใช้ระบบเสริม RAG เพื่อจัดการสินค้าคงคลังและเรียงลำดับผลิตภัณฑ์ใหม่โดยอัตโนมัติเมื่อระดับสต็อกต่ำกว่าเกณฑ์ที่กำหนดไว้
2. ขั้นตอนการทำงาน:
  1. การดึงข้อมูล: เมื่อสต็อกสินค้าถึงระดับต่ำ ระบบจะตรวจสอบประวัติการขาย ความผันผวนของอุปสงค์ตามฤดูกาล และแนวโน้มของตลาดในปัจจุบันจากฐานข้อมูล
  2. เสริม: เมื่อรวมข้อมูลที่ดึงมาเข้ากับความถี่ในการสั่งซื้อใหม่ เวลาในการผลิต และรายละเอียดของซัพพลายเออร์ จะเป็นตัวกำหนดปริมาณที่เหมาะสมที่สุดในการสั่งซื้อใหม่
  3. การปฏิบัติงาน: จากนั้นระบบจะเชื่อมต่อกับซอฟต์แวร์จัดซื้อจัดจ้างของบริษัทเพื่อส่งคำสั่งซื้อกับซัพพลายเออร์โดยอัตโนมัติ เพื่อให้มั่นใจว่าแพลตฟอร์มอีคอมเมิร์ซจะไม่มีวันหมดผลิตภัณฑ์ยอดนิยม
การเตรียมความพร้อมของพนักงานและการตั้งค่าด้านไอที:
1. สถานการณ์สมมติ: บริษัทข้ามชาติแห่งหนึ่งใช้ระบบที่ขับเคลื่อนด้วย RAG เพื่อปรับปรุงกระบวนการเตรียมความพร้อมสำหรับพนักงานใหม่ เพื่อให้มั่นใจว่าข้อกำหนดด้านไอทีทั้งหมดได้รับการตั้งค่าก่อนวันแรกของพนักงาน
2. ขั้นตอนการทำงาน:
  1. การดึงข้อมูล: เมื่อได้รับรายละเอียดการจ้างงานใหม่ ระบบจะปรึกษาฐานข้อมูล HR เพื่อกำหนดบทบาท แผนก และสถานที่ตั้งของพนักงาน
  2. เสริม: โดยเชื่อมโยงข้อมูลนี้กับนโยบายด้านไอทีของบริษัท การกำหนดซอฟต์แวร์ ฮาร์ดแวร์ และสิทธิ์การเข้าถึงที่พนักงานใหม่จะต้องมี
  3. การปฏิบัติงาน: จากนั้นระบบจะสื่อสารกับระบบตั๋วของแผนก IT สร้างตั๋วโดยอัตโนมัติเพื่อตั้งค่าเวิร์กสเตชันใหม่ ติดตั้งซอฟต์แวร์ที่จำเป็น และให้สิทธิ์การเข้าถึงระบบที่เหมาะสม สิ่งนี้ทำให้มั่นใจได้ว่าเมื่อพนักงานใหม่เริ่มทำงาน เวิร์กสเตชันของพวกเขาจะพร้อม และพวกเขาสามารถดำดิ่งไปสู่ความรับผิดชอบได้ทันที

ตัวอย่างเหล่านี้เน้นย้ำถึงความคล่องตัวและประโยชน์เชิงปฏิบัติของการใช้เวิร์กโฟลว์ RAG ในการจัดการกับความท้าทายทางธุรกิจแบบเรียลไทม์ที่ซับซ้อนในโดเมนต่างๆ มากมาย

เชื่อมต่อข้อมูลและแอปของคุณด้วย Nanonets AI Assistant เพื่อแชทกับข้อมูล ปรับใช้แชทบอทและตัวแทนแบบกำหนดเอง และสร้างเวิร์กโฟลว์ RAG

จะสร้างเวิร์กโฟลว์ RAG ของคุณเองได้อย่างไร

กระบวนการสร้างเวิร์กโฟลว์ RAG

กระบวนการสร้างเวิร์กโฟลว์การดึงข้อมูล Augmented Generation (RAG) สามารถแบ่งออกเป็นขั้นตอนสำคัญได้หลายขั้นตอน ขั้นตอนเหล่านี้สามารถแบ่งได้เป็นสามกระบวนการหลัก: การนำเข้าไปในร่างกาย, การแก้ไขและ รุ่นตลอดจนการเตรียมการเพิ่มเติมบางประการ:

1. การเตรียม:

การเตรียมฐานความรู้: เตรียมพื้นที่เก็บข้อมูลหรือฐานความรู้โดยการนำเข้าข้อมูลจากแหล่งต่างๆ เช่น แอพ เอกสาร ฐานข้อมูล ข้อมูลนี้ควรได้รับการจัดรูปแบบเพื่อให้สามารถค้นหาได้อย่างมีประสิทธิภาพ ซึ่งโดยทั่วไปหมายความว่าข้อมูลนี้ควรได้รับการจัดรูปแบบให้เป็นการแสดงออบเจ็กต์ 'เอกสาร' แบบครบวงจร

2. กระบวนการกลืนกิน:

การตั้งค่าฐานข้อมูลเวกเตอร์: ใช้ฐานข้อมูลเวกเตอร์เป็นฐานความรู้ โดยใช้อัลกอริธึมการจัดทำดัชนีต่างๆ เพื่อจัดระเบียบเวกเตอร์ที่มีมิติสูง ทำให้สามารถสืบค้นได้อย่างรวดเร็วและมีประสิทธิภาพ
- การดึงข้อมูล: แยกข้อมูลจากเอกสารเหล่านี้
- การแยกส่วนข้อมูล: แบ่งเอกสารออกเป็นส่วนๆ ของข้อมูล
- การฝังข้อมูล: แปลงชิ้นส่วนเหล่านี้เป็นการฝังโดยใช้โมเดลการฝังแบบเดียวกับที่ OpenAI มอบให้
พัฒนากลไกในการนำเข้าข้อความค้นหาผู้ใช้ของคุณ นี่อาจเป็นอินเทอร์เฟซผู้ใช้หรือเวิร์กโฟลว์ที่ใช้ API

3. กระบวนการดึงข้อมูล:

การฝังแบบสอบถาม: รับการฝังข้อมูลสำหรับการค้นหาของผู้ใช้
การดึงข้อมูลก้อน: ทำการค้นหาแบบไฮบริดเพื่อค้นหาชิ้นส่วนที่จัดเก็บที่เกี่ยวข้องมากที่สุดในฐานข้อมูลเวกเตอร์โดยยึดตามการสืบค้นที่ฝังไว้
การดึงเนื้อหา: ดึงเนื้อหาที่เกี่ยวข้องมากที่สุดจากฐานความรู้ของคุณมาสู่บริบทของคุณ

4. กระบวนการสร้าง:

การสร้างพรอมต์: รวมข้อมูลที่ดึงมาเข้ากับแบบสอบถามต้นฉบับเพื่อสร้างพร้อมท์ ตอนนี้คุณสามารถดำเนินการ-
- การสร้างการตอบสนอง: ส่งข้อความพร้อมท์รวมไปยัง LLM (โมเดลภาษาขนาดใหญ่) เพื่อสร้างการตอบกลับที่มีข้อมูลครบถ้วน
- การปฏิบัติงาน: ส่งข้อความพร้อมท์แบบรวมไปยังตัวแทนข้อมูล LLM ของคุณ ซึ่งจะอนุมานงานที่ถูกต้องที่จะดำเนินการตามคำค้นหาของคุณและดำเนินการ ตัวอย่างเช่น คุณสามารถสร้างตัวแทนข้อมูล Gmail จากนั้นแจ้งให้ “ส่งอีเมลส่งเสริมการขายไปยังโอกาสในการขาย Hubspot ล่าสุด” และตัวแทนข้อมูลจะ –

5. การกำหนดค่าและการเพิ่มประสิทธิภาพ:

การปรับแต่ง: ปรับแต่งเวิร์กโฟลว์ให้เหมาะกับความต้องการเฉพาะ ซึ่งอาจรวมถึงการปรับโฟลว์การนำเข้า เช่น การประมวลผลล่วงหน้า การแยกส่วน และการเลือกโมเดลการฝัง
การเพิ่มประสิทธิภาพ: ใช้กลยุทธ์การปรับให้เหมาะสมเพื่อปรับปรุงคุณภาพการดึงข้อมูลและลดจำนวนโทเค็นในการประมวลผล ซึ่งอาจนำไปสู่ประสิทธิภาพและการเพิ่มประสิทธิภาพต้นทุนในวงกว้าง

การดำเนินการด้วยตนเอง

การใช้เวิร์กโฟลว์การเรียกข้อมูล Augmented Generation (RAG) ถือเป็นงานที่ซับซ้อนซึ่งเกี่ยวข้องกับขั้นตอนมากมายและความเข้าใจที่ดีเกี่ยวกับอัลกอริธึมและระบบพื้นฐาน ด้านล่างนี้คือความท้าทายและขั้นตอนสำคัญในการเอาชนะสำหรับผู้ที่ต้องการนำเวิร์กโฟลว์ RAG ไปใช้:

ความท้าทายในการสร้างเวิร์กโฟลว์ RAG ของคุณเอง:

ความแปลกใหม่และการขาดแนวทางปฏิบัติที่เป็นที่ยอมรับ: RAG เป็นเทคโนโลยีที่ค่อนข้างใหม่ ซึ่งนำเสนอครั้งแรกในปี 2020 และนักพัฒนายังคงค้นหาแนวทางปฏิบัติที่ดีที่สุดในการใช้กลไกการดึงข้อมูลใน generative AI
ค่าใช้จ่าย: การใช้ RAG จะมีราคาแพงกว่าการใช้ Large Language Model (LLM) เพียงอย่างเดียว อย่างไรก็ตาม มีต้นทุนน้อยกว่าการฝึกอบรม LLM บ่อยครั้ง
โครงสร้างข้อมูล: การกำหนดวิธีสร้างแบบจำลองข้อมูลที่มีโครงสร้างและไม่มีโครงสร้างภายในคลังความรู้และฐานข้อมูลเวกเตอร์ให้ดีที่สุดถือเป็นความท้าทายที่สำคัญ
การป้อนข้อมูลส่วนเพิ่ม: การพัฒนากระบวนการสำหรับการป้อนข้อมูลเพิ่มเติมเข้าสู่ระบบ RAG เป็นสิ่งสำคัญ
การจัดการกับความไม่ถูกต้อง: จำเป็นต้องมีการวางกระบวนการเพื่อจัดการรายงานความไม่ถูกต้อง และเพื่อแก้ไขหรือลบแหล่งข้อมูลเหล่านั้นในระบบ RAG

วิธีเริ่มต้นสร้างเวิร์กโฟลว์ RAG ของคุณเอง:

การนำเวิร์กโฟลว์ RAG ไปใช้ต้องอาศัยการผสมผสานความรู้ด้านเทคนิค เครื่องมือที่เหมาะสม ตลอดจนการเรียนรู้และการเพิ่มประสิทธิภาพอย่างต่อเนื่อง เพื่อให้มั่นใจถึงประสิทธิภาพและประสิทธิผลในการบรรลุวัตถุประสงค์ของคุณ สำหรับผู้ที่ต้องการใช้เวิร์กโฟลว์ RAG ด้วยตนเอง เราได้รวบรวมรายการคำแนะนำแบบลงมือปฏิบัติจริงที่ครอบคลุมซึ่งจะแนะนำคุณตลอดกระบวนการนำไปใช้โดยละเอียด –

บทช่วยสอนแต่ละบทมาพร้อมกับแนวทางหรือแพลตฟอร์มที่เป็นเอกลักษณ์เพื่อให้บรรลุการใช้งานตามที่ต้องการในหัวข้อที่ระบุ

หากคุณต้องการเจาะลึกการสร้างเวิร์กโฟลว์ RAG ของคุณเอง เราขอแนะนำให้อ่านบทความทั้งหมดที่ระบุไว้ข้างต้นเพื่อทำความเข้าใจแบบองค์รวมที่จำเป็นในการเริ่มต้นการเดินทางของคุณ

ใช้เวิร์กโฟลว์ RAG โดยใช้แพลตฟอร์ม ML

แม้ว่าเสน่ห์ของการสร้างเวิร์กโฟลว์การเรียกข้อมูล Augmented Generation (RAG) จากพื้นฐานจะทำให้รู้สึกถึงความสำเร็จและการปรับแต่ง แต่ก็เป็นความพยายามที่ซับซ้อนอย่างปฏิเสธไม่ได้ ธุรกิจหลายแห่งได้ก้าวไปข้างหน้าโดยตระหนักถึงความซับซ้อนและความท้าทาย โดยนำเสนอแพลตฟอร์มและบริการพิเศษเพื่อทำให้กระบวนการนี้ง่ายขึ้น การใช้ประโยชน์จากแพลตฟอร์มเหล่านี้ไม่เพียงแต่ช่วยประหยัดเวลาและทรัพยากรอันมีค่าเท่านั้น แต่ยังช่วยให้มั่นใจได้ว่าการใช้งานนั้นเป็นไปตามแนวทางปฏิบัติที่ดีที่สุดในอุตสาหกรรมและได้รับการปรับให้เหมาะสมที่สุดเพื่อประสิทธิภาพ

สำหรับองค์กรหรือบุคคลที่อาจไม่มีแบนด์วิดท์หรือความเชี่ยวชาญในการสร้างระบบ RAG ตั้งแต่เริ่มต้น แพลตฟอร์ม ML เหล่านี้นำเสนอโซลูชันที่ใช้งานได้ เมื่อเลือกใช้แพลตฟอร์มเหล่านี้ เราสามารถ:

ข้ามความซับซ้อนทางเทคนิค: หลีกเลี่ยงขั้นตอนที่ซับซ้อนของกระบวนการจัดโครงสร้างข้อมูล การฝัง และการดึงข้อมูล แพลตฟอร์มเหล่านี้มักมาพร้อมกับโซลูชันและเฟรมเวิร์กที่สร้างไว้ล่วงหน้าซึ่งปรับแต่งสำหรับเวิร์กโฟลว์ RAG
ใช้ประโยชน์จากความเชี่ยวชาญ: รับประโยชน์จากความเชี่ยวชาญของผู้เชี่ยวชาญที่มีความเข้าใจอย่างลึกซึ้งเกี่ยวกับระบบ RAG และได้จัดการกับความท้าทายหลายประการที่เกี่ยวข้องกับการใช้งานแล้ว
scalability: แพลตฟอร์มเหล่านี้มักได้รับการออกแบบโดยคำนึงถึงความสามารถในการปรับขนาด เพื่อให้มั่นใจว่าเมื่อข้อมูลของคุณเพิ่มขึ้นหรือความต้องการของคุณเปลี่ยนแปลงไป ระบบจะสามารถปรับตัวได้โดยไม่ต้องยกเครื่องใหม่ทั้งหมด
ลดค่าใช้จ่าย: แม้ว่าจะมีต้นทุนที่เกี่ยวข้องกับการใช้แพลตฟอร์ม แต่ก็อาจพิสูจน์ได้ว่าคุ้มค่ากว่าในระยะยาว โดยเฉพาะอย่างยิ่งเมื่อพิจารณาต้นทุนในการแก้ไขปัญหา การเพิ่มประสิทธิภาพ และการใช้งานซ้ำที่อาจเกิดขึ้น

เรามาดูแพลตฟอร์มที่นำเสนอความสามารถในการสร้างเวิร์กโฟลว์ RAG กัน

นาโนเน็ต

Nanonets นำเสนอผู้ช่วย AI, แชทบอท และเวิร์กโฟลว์ RAG ที่ปลอดภัยซึ่งขับเคลื่อนโดยข้อมูลของบริษัทของคุณ ช่วยให้สามารถซิงโครไนซ์ข้อมูลแบบเรียลไทม์ระหว่างแหล่งข้อมูลต่างๆ อำนวยความสะดวกในการเรียกค้นข้อมูลที่ครอบคลุมสำหรับทีม แพลตฟอร์มดังกล่าวช่วยให้สามารถสร้างแชทบอทพร้อมกับปรับใช้เวิร์กโฟลว์ที่ซับซ้อนผ่านภาษาธรรมชาติ ซึ่งขับเคลื่อนโดย Large Language Models (LLM) นอกจากนี้ยังมีตัวเชื่อมต่อข้อมูลเพื่ออ่านและเขียนข้อมูลในแอปของคุณ และความสามารถในการใช้ตัวแทน LLM เพื่อดำเนินการกับแอปภายนอกได้โดยตรง

หน้าผลิตภัณฑ์ผู้ช่วย AI ของ Nanonets

AWS เจเนอเรทีฟ AI

AWS นำเสนอบริการและเครื่องมือที่หลากหลายภายใต้กลุ่ม Generative AI เพื่อตอบสนองความต้องการทางธุรกิจที่แตกต่างกัน ช่วยให้สามารถเข้าถึงโมเดลพื้นฐานชั้นนำของอุตสาหกรรมที่หลากหลายจากผู้ให้บริการหลายรายผ่าน Amazon Bedrock ผู้ใช้สามารถปรับแต่งโมเดลพื้นฐานเหล่านี้ด้วยข้อมูลของตนเองเพื่อสร้างประสบการณ์ที่เป็นส่วนตัวและแตกต่างมากขึ้น AWS เน้นความปลอดภัยและความเป็นส่วนตัว เพื่อให้มั่นใจในการปกป้องข้อมูลเมื่อปรับแต่งโมเดลพื้นฐาน นอกจากนี้ยังเน้นโครงสร้างพื้นฐานที่คุ้มค่าสำหรับการปรับขนาด AI ที่สร้างด้วยตัวเลือกต่างๆ เช่น AWS Trainium, AWS Inferentia และ NVIDIA GPU เพื่อให้ได้ประสิทธิภาพตามราคาที่ดีที่สุด นอกจากนี้ AWS ยังอำนวยความสะดวกในการสร้าง การฝึกอบรม และการปรับใช้โมเดลพื้นฐานบน Amazon SageMaker ซึ่งขยายประสิทธิภาพของโมเดลพื้นฐานไปยังกรณีการใช้งานเฉพาะของผู้ใช้

หน้าผลิตภัณฑ์ AWS Generative AI

AI กำเนิดบน Google Cloud

Generative AI ของ Google Cloud มอบชุดเครื่องมือที่มีประสิทธิภาพสำหรับการพัฒนาโมเดล AI ปรับปรุงการค้นหา และเปิดใช้งานการสนทนาที่ขับเคลื่อนด้วย AI มีความเป็นเลิศในการวิเคราะห์ความรู้สึก การประมวลผลภาษา เทคโนโลยีคำพูด และการจัดการเอกสารอัตโนมัติ นอกจากนี้ยังสามารถสร้างเวิร์กโฟลว์ RAG และตัวแทน LLM เพื่อรองรับความต้องการทางธุรกิจที่หลากหลายด้วยแนวทางหลายภาษา ทำให้เป็นโซลูชันที่ครอบคลุมสำหรับความต้องการต่างๆ ขององค์กร

AI เจนเนอเรชั่นของ Google Cloud

ออราเคิลเจเนอเรทีฟ AI

Generative AI ของ Oracle (OCI Generative AI) ได้รับการปรับแต่งสำหรับองค์กร โดยนำเสนอโมเดลที่เหนือกว่าผสมผสานกับการจัดการข้อมูลที่ยอดเยี่ยม โครงสร้างพื้นฐาน AI และแอปพลิเคชันทางธุรกิจ ช่วยให้ปรับแต่งโมเดลโดยใช้ข้อมูลของผู้ใช้โดยไม่ต้องแชร์กับผู้ให้บริการโมเดลภาษาขนาดใหญ่หรือลูกค้ารายอื่น จึงมั่นใจในความปลอดภัยและความเป็นส่วนตัว แพลตฟอร์มดังกล่าวช่วยให้สามารถปรับใช้โมเดลบนคลัสเตอร์ AI เฉพาะเพื่อประสิทธิภาพและราคาที่คาดการณ์ได้ OCI Generative AI มอบกรณีการใช้งานที่หลากหลาย เช่น การสรุปข้อความ การสร้างสำเนา การสร้างแชทบอท การแปลงรูปแบบ การจัดหมวดหมู่ข้อความ และการค้นหาข้อมูล เพื่อตอบสนองความต้องการที่หลากหลายขององค์กร โดยจะประมวลผลอินพุตของผู้ใช้ ซึ่งอาจรวมถึงภาษาธรรมชาติ ตัวอย่างอินพุต/เอาท์พุต และคำแนะนำ เพื่อสร้าง สรุป แปลง แยกข้อมูล หรือจัดประเภทข้อความตามคำขอของผู้ใช้ โดยส่งการตอบกลับในรูปแบบที่ระบุ

ออราเคิลเจเนอเรทีฟ AI

Cloudera

ในขอบเขตของ Generative AI นั้น Cloudera กลายเป็นพันธมิตรที่น่าเชื่อถือสำหรับองค์กรต่างๆ เลคเฮาส์ข้อมูลแบบเปิดซึ่งสามารถเข้าถึงได้ทั้งบนคลาวด์สาธารณะและคลาวด์ส่วนตัวถือเป็นรากฐานที่สำคัญ พวกเขานำเสนอบริการข้อมูลที่ช่วยเหลือตลอดวงจรชีวิตของข้อมูลตั้งแต่ Edge ไปจนถึง AI ความสามารถของพวกเขาขยายไปสู่การสตรีมข้อมูลแบบเรียลไทม์ การจัดเก็บและการวิเคราะห์ข้อมูลในเลคเฮาส์แบบเปิด และการปรับใช้และการตรวจสอบโมเดลการเรียนรู้ของเครื่องผ่าน Cloudera Data Platform สิ่งสำคัญอย่างยิ่งคือ Cloudera ช่วยให้สามารถสร้างเวิร์กโฟลว์การดึงข้อมูล Augmented Generation ได้ โดยผสมผสานการผสมผสานอันทรงพลังของความสามารถในการดึงข้อมูลและการสร้างสำหรับแอปพลิเคชัน AI ที่ได้รับการปรับปรุง

หน้าบล็อกของ Cloudera

รวบรวม

Glean ใช้ AI เพื่อปรับปรุงการค้นหาสถานที่ทำงานและการค้นพบความรู้ โดยใช้ประโยชน์จากการค้นหาแบบเวกเตอร์และโมเดลภาษาขนาดใหญ่ที่ใช้การเรียนรู้เชิงลึกเพื่อการทำความเข้าใจความหมายของข้อความค้นหา และปรับปรุงความเกี่ยวข้องในการค้นหาอย่างต่อเนื่อง นอกจากนี้ยังมีผู้ช่วย Generative AI สำหรับการตอบคำถามและสรุปข้อมูลในเอกสาร ตั๋ว และอื่นๆ อีกมากมาย แพลตฟอร์มดังกล่าวให้ผลการค้นหาส่วนบุคคลและแนะนำข้อมูลตามกิจกรรมและแนวโน้มของผู้ใช้ นอกเหนือจากการอำนวยความสะดวกในการตั้งค่าและบูรณาการที่ง่ายดายด้วยตัวเชื่อมต่อมากกว่า 100 รายการไปยังแอปต่างๆ

หน้าแรกของ Glean

แลนด์บอท

Landbot นำเสนอชุดเครื่องมือสำหรับสร้างประสบการณ์การสนทนา อำนวยความสะดวกในการสร้างโอกาสในการขาย การมีส่วนร่วมของลูกค้า และการสนับสนุนผ่านแชทบอทบนเว็บไซต์หรือ WhatsApp ผู้ใช้สามารถออกแบบ ปรับใช้ และปรับขนาดแชทบอทด้วยเครื่องมือสร้างที่ไม่มีโค้ด และรวมเข้ากับแพลตฟอร์มยอดนิยม เช่น Slack และ Messenger นอกจากนี้ยังมีเทมเพลตที่หลากหลายสำหรับกรณีการใช้งานที่แตกต่างกัน เช่น การสร้างลูกค้าเป้าหมาย การสนับสนุนลูกค้า และการส่งเสริมการขายผลิตภัณฑ์

หน้าแรกของ Landbot.io

แชทเบส

Chatbase เป็นแพลตฟอร์มสำหรับปรับแต่ง ChatGPT ให้สอดคล้องกับบุคลิกภาพของแบรนด์และรูปลักษณ์เว็บไซต์ ช่วยให้สามารถรวบรวมลูกค้าเป้าหมาย สรุปการสนทนารายวัน และบูรณาการกับเครื่องมืออื่นๆ เช่น Zapier, Slack และ Messenger แพลตฟอร์มดังกล่าวได้รับการออกแบบมาเพื่อมอบประสบการณ์แชทบอทส่วนตัวสำหรับธุรกิจ

หน้าผลิตภัณฑ์ Chatbase

ปรับขนาด AI

Scale AI จัดการกับปัญหาคอขวดของข้อมูลในการพัฒนาแอปพลิเคชัน AI โดยนำเสนอการปรับแต่งอย่างละเอียดและ RLHF สำหรับการปรับโมเดลพื้นฐานให้เหมาะกับความต้องการทางธุรกิจเฉพาะ โดยบูรณาการหรือเป็นพันธมิตรกับโมเดล AI ชั้นนำ ช่วยให้องค์กรต่างๆ สามารถรวมข้อมูลของตนเพื่อสร้างความแตกต่างเชิงกลยุทธ์ได้ เมื่อรวมกับความสามารถในการสร้างเวิร์กโฟลว์ RAG และตัวแทน LLM แล้ว Scale AI ก็มอบแพลตฟอร์ม AI ที่สร้างเต็มสแตกสำหรับการพัฒนาแอปพลิเคชัน AI ที่รวดเร็ว

ปรับขนาดโฮมเพจ AI

Shakudo – โซลูชั่น LLM

Shakudo นำเสนอโซลูชันแบบครบวงจรสำหรับการปรับใช้ Large Language Models (LLM) การจัดการฐานข้อมูลเวกเตอร์ และการสร้างไปป์ไลน์ข้อมูลที่มีประสิทธิภาพ ช่วยเพิ่มความคล่องตัวในการเปลี่ยนจากการสาธิตในท้องถิ่นไปเป็นบริการ LLM ระดับการผลิตด้วยการตรวจสอบแบบเรียลไทม์และการจัดการอัตโนมัติ แพลตฟอร์มดังกล่าวรองรับการดำเนินงาน Generative AI ที่ยืดหยุ่น ฐานข้อมูลเวกเตอร์ที่มีปริมาณงานสูง และมอบเครื่องมือ LLMOps เฉพาะทางที่หลากหลาย ซึ่งช่วยเพิ่มความสมบูรณ์ทางการทำงานของกลุ่มเทคโนโลยีที่มีอยู่

หน้าผลิตภัณฑ์เวิร์กโฟลว์ Shakundo RAG

แต่ละแพลตฟอร์ม/ธุรกิจที่กล่าวถึงมีชุดคุณลักษณะและความสามารถเฉพาะตัวของตัวเอง และสามารถสำรวจเพิ่มเติมเพื่อทำความเข้าใจวิธีการใช้ประโยชน์จากการเชื่อมต่อข้อมูลองค์กรและการนำเวิร์กโฟลว์ RAG ไปใช้

เวิร์กโฟลว์ RAG พร้อม Nanonets

ในขอบเขตของโมเดลภาษาเสริมเพื่อการตอบสนองที่แม่นยำและลึกซึ้งยิ่งขึ้น การดึงข้อมูล Augmented Generation (RAG) ถือเป็นกลไกสำคัญ กระบวนการที่ซับซ้อนนี้ยกระดับความน่าเชื่อถือและประโยชน์ของระบบ AI เพื่อให้แน่ใจว่าระบบเหล่านั้นไม่ได้ทำงานอยู่ในสุญญากาศข้อมูลเท่านั้น

หัวใจสำคัญของสิ่งนี้คือ Nanonets AI Assistant กลายเป็นคู่หู AI อเนกประสงค์ที่ปลอดภัยและออกแบบมาเพื่อเชื่อมช่องว่างระหว่างความรู้ในองค์กรของคุณและโมเดลภาษาขนาดใหญ่ (LLM) ทั้งหมดนี้อยู่ในอินเทอร์เฟซที่ใช้งานง่าย

ต่อไปนี้เป็นภาพรวมของการบูรณาการอย่างราบรื่นและการปรับปรุงขั้นตอนการทำงานที่นำเสนอโดยความสามารถของ RAG ของ Nanonets:

การเชื่อมต่อข้อมูล:

Nanonets อำนวยความสะดวกในการเชื่อมต่ออย่างราบรื่นกับแอปพลิเคชันพื้นที่ทำงานยอดนิยมกว่า 100 รายการ รวมถึง Slack, Notion, Google Suite, Salesforce และ Zendesk และอื่นๆ อีกมากมาย มีความเชี่ยวชาญในการจัดการข้อมูลประเภทต่างๆ ที่หลากหลาย ไม่ว่าจะเป็นไฟล์ที่ไม่มีโครงสร้าง เช่น ไฟล์ PDF, TXT, รูปภาพ, เสียง และวิดีโอ หรือข้อมูลที่มีโครงสร้าง เช่น CSV, สเปรดชีต, ฐานข้อมูล MongoDB และ SQL การเชื่อมต่อข้อมูลในวงกว้างนี้ช่วยให้มั่นใจได้ถึงฐานความรู้ที่แข็งแกร่งสำหรับกลไก RAG ที่จะดึงออกมา

ทริกเกอร์และตัวแทนการดำเนินการ:

ด้วย Nanonets การตั้งค่าทริกเกอร์/เอเจนต์การกระทำจึงเป็นเรื่องง่าย เจ้าหน้าที่เหล่านี้จะเฝ้าระวังเหตุการณ์ในแอปพื้นที่ทำงานของคุณ โดยเริ่มต้นการดำเนินการตามที่จำเป็น เช่น สร้างขั้นตอนการทำงานเพื่อตรวจสอบอีเมลใหม่ที่ support@your_company.comใช้เอกสารของคุณและการสนทนาทางอีเมลที่ผ่านมาเป็นฐานความรู้ ร่างการตอบกลับอีเมลเชิงลึก และส่งออกไป ทั้งหมดนี้จัดทำได้อย่างราบรื่น

การนำเข้าและการจัดทำดัชนีข้อมูลที่คล่องตัว:

การนำเข้าและการจัดทำดัชนีข้อมูลที่ได้รับการปรับปรุงให้เหมาะสมเป็นส่วนหนึ่งของแพ็คเกจ ทำให้มั่นใจได้ว่าการประมวลผลข้อมูลที่ราบรื่นซึ่งจะได้รับการจัดการในฉากหลังโดย Nanonets AI Assistant การเพิ่มประสิทธิภาพนี้มีความสำคัญอย่างยิ่งต่อการซิงค์แบบเรียลไทม์กับแหล่งข้อมูล เพื่อให้มั่นใจว่ากลไก RAG มีข้อมูลล่าสุดที่จะใช้งานได้

ในการเริ่มต้น คุณสามารถโทรคุยกับผู้เชี่ยวชาญ AI ของเรา และเราจะให้การสาธิตและทดลองใช้ Nanonets AI Assistant แบบส่วนตัวแก่คุณตามกรณีการใช้งานของคุณ

เมื่อตั้งค่าแล้ว คุณสามารถใช้ Nanonets AI Assistant เพื่อ –

สร้างเวิร์กโฟลว์การแชท RAG

เสริมศักยภาพทีมของคุณด้วยข้อมูลที่ครอบคลุมแบบเรียลไทม์จากแหล่งข้อมูลทั้งหมดของคุณ

สร้างเวิร์กโฟลว์ตัวแทน RAG

ใช้ภาษาที่เป็นธรรมชาติเพื่อสร้างและรันเวิร์กโฟลว์ที่ซับซ้อนซึ่งขับเคลื่อนโดย LLM ที่โต้ตอบกับแอปและข้อมูลทั้งหมดของคุณ

ปรับใช้ Chatbot ที่ใช้ RAG

สร้างและปรับใช้พร้อมที่จะใช้แชทบอท AI แบบกำหนดเองที่รู้จักคุณภายในไม่กี่นาที

ขับเคลื่อนประสิทธิภาพของทีมของคุณ

ด้วย Nanonets AI คุณไม่เพียงแต่บูรณาการข้อมูลเท่านั้น คุณกำลังเพิ่มขีดความสามารถของทีมของคุณ ด้วยการทำให้งานธรรมดาๆ เป็นอัตโนมัติและให้การตอบสนองอย่างชาญฉลาด ทีมของคุณจะสามารถจัดสรรการมุ่งเน้นที่ความคิดริเริ่มเชิงกลยุทธ์ใหม่ได้

ผู้ช่วย AI ที่ขับเคลื่อนด้วย RAG ของ Nanonets เป็นมากกว่าเครื่องมือ เป็นตัวเร่งที่ปรับปรุงการดำเนินงาน เพิ่มการเข้าถึงข้อมูล และขับเคลื่อนองค์กรของคุณไปสู่อนาคตของการตัดสินใจโดยใช้ข้อมูลและการทำงานอัตโนมัติ

เนื้อหาที่ขับเคลื่อนด้วย SEO และการเผยแพร่ประชาสัมพันธ์ รับการขยายวันนี้
PlatoData.Network Vertical Generative Ai เพิ่มพลังให้กับตัวเอง เข้าถึงได้ที่นี่.
เพลโตไอสตรีม. Web3 อัจฉริยะ ขยายความรู้ เข้าถึงได้ที่นี่.
เพลโตESG. คาร์บอน, คลีนเทค, พลังงาน, สิ่งแวดล้อม แสงอาทิตย์, การจัดการของเสีย. เข้าถึงได้ที่นี่.
เพลโตสุขภาพ เทคโนโลยีชีวภาพและข่าวกรองการทดลองทางคลินิก เข้าถึงได้ที่นี่.
ที่มา: https://nanonets.com/blog/retrieval-augmented-generation/

ประทับเวลา: ตุลาคม 24, 2023

การสร้างโมเดล OCR ตามการเรียนรู้เชิงลึกที่กำหนดเอง

คลัสเตอร์ต้นทาง:

AI และการเรียนรู้ของเครื่อง

โหนดต้นทาง: 1852921

ประทับเวลา: May 13, 2021

เผยแพร่ซ้ำโดยเพลโต

การรายงานทางการเงินอัตโนมัติคืออะไร?

การแยกข้อมูลแบบฟอร์ม

แยกวิเคราะห์ต่อ

การสร้างโมเดล OCR ตามการเรียนรู้เชิงลึกที่กำหนดเอง

เกี่ยวกับเรา

การค้นหาแนวตั้ง & Ai

ระบบปฏิบัติการ

การติดต่อ

ลงชื่อเข้าใช้