เทคนิคทางวิศวกรรมพร้อมท์ Kick Ass เพื่อเพิ่มโมเดล LLM ของเรา - KDnuggets

เผยแพร่ซ้ำโดยเพลโต

ผู้ติดตาม: 0

เทคนิคทางวิศวกรรมพร้อมท์ Kick Ass เพื่อเพิ่มโมเดล LLM ของเรา
ภาพที่สร้างด้วย DALL-E3

ปัญญาประดิษฐ์ถือเป็นการปฏิวัติครั้งยิ่งใหญ่ในโลกเทคโนโลยี

ความสามารถในการเลียนแบบสติปัญญาของมนุษย์และทำงานที่ครั้งหนึ่งเคยถูกพิจารณาว่าเป็นเพียงโดเมนของมนุษย์ยังคงสร้างความประหลาดใจให้กับพวกเราส่วนใหญ่

อย่างไรก็ตาม ไม่ว่าการก้าวกระโดดของ AI ในช่วงท้ายๆ เหล่านี้จะดีแค่ไหน แต่ก็ยังมีช่องว่างให้ปรับปรุงได้เสมอ

และนี่คือจุดเริ่มต้นของวิศวกรรมที่รวดเร็ว!

ป้อนข้อมูลในช่องนี้ซึ่งสามารถเพิ่มประสิทธิภาพการทำงานของโมเดล AI ได้อย่างมาก

มาค้นพบมันด้วยกันเถอะ!

Prompt Engineering เป็นโดเมนที่เติบโตอย่างรวดเร็วภายใน AI ซึ่งมุ่งเน้นไปที่การปรับปรุงประสิทธิภาพและประสิทธิผลของโมเดลภาษา มันคือทั้งหมดที่เกี่ยวกับการสร้างคำแนะนำที่สมบูรณ์แบบเพื่อเป็นแนวทางให้กับโมเดล AI เพื่อสร้างผลลัพธ์ที่เราต้องการ

คิดว่าเป็นการเรียนรู้วิธีให้คำแนะนำที่ดีขึ้นแก่ผู้อื่นเพื่อให้แน่ใจว่าพวกเขาเข้าใจและปฏิบัติงานได้อย่างถูกต้อง

เหตุใดจึงต้องคำนึงถึงวิศวกรรมพร้อมท์

เพิ่มผลผลิต: ด้วยการใช้พร้อมท์คุณภาพสูง โมเดล AI สามารถสร้างการตอบสนองที่แม่นยำและเกี่ยวข้องมากขึ้น ซึ่งหมายความว่าจะใช้เวลาในการแก้ไขน้อยลง และมีเวลามากขึ้นในการใช้ประโยชน์จากความสามารถของ AI
ประสิทธิภาพต้นทุน: การฝึกอบรมโมเดล AI ต้องใช้ทรัพยากรมาก วิศวกรรมพร้อมท์สามารถลดความจำเป็นในการฝึกอบรมใหม่ได้โดยการเพิ่มประสิทธิภาพโมเดลด้วยการแจ้งเตือนที่ดีขึ้น
เก่งกาจ: ข้อความแจ้งที่ออกแบบมาอย่างดีสามารถทำให้โมเดล AI มีความหลากหลายมากขึ้น ช่วยให้สามารถรับมือกับงานและความท้าทายที่หลากหลายยิ่งขึ้น

ก่อนที่จะเจาะลึกเทคนิคขั้นสูงสุด เรามาดูเทคนิคทางวิศวกรรมที่เป็นประโยชน์ที่สุด (และเป็นพื้นฐาน) สองข้อก่อน

การคิดตามลำดับด้วย “คิดทีละขั้นตอน”

ปัจจุบันเป็นที่ทราบกันดีว่าความแม่นยำของแบบจำลอง LLM ได้รับการปรับปรุงอย่างมากเมื่อเพิ่มลำดับคำ "ลองคิดดูทีละขั้นตอน"

ทำไม…คุณอาจถาม?

นี่เป็นเพราะว่าเรากำลังบังคับให้โมเดลแบ่งงานใดๆ ออกเป็นหลายขั้นตอน เพื่อให้แน่ใจว่าโมเดลมีเวลาเพียงพอในการประมวลผลแต่ละงาน

ตัวอย่างเช่น ฉันสามารถท้าทาย GPT3.5 ด้วยข้อความแจ้งต่อไปนี้:

ถ้าจอห์นมีลูกแพร์ 5 ลูก แล้วกิน 2 ลูก ซื้อเพิ่มอีก 5 ลูก แล้วให้เพื่อน 3 ลูก เขามีลูกแพร์กี่ลูก?

นางแบบจะตอบให้ทันที อย่างไรก็ตาม หากฉันเพิ่มส่วนสุดท้าย “มาคิดกันทีละขั้นตอน” ฉันกำลังบังคับให้โมเดลสร้างกระบวนการคิดที่มีหลายขั้นตอน

ไม่กี่ Shot Prompting

แม้ว่าการพร้อมท์แบบ Zero-shot หมายถึงการขอให้โมเดลทำงานโดยไม่ต้องให้บริบทหรือความรู้เดิม เทคนิคการพร้อมท์แบบไม่กี่ช็อตก็หมายความว่าเรานำเสนอ LLM พร้อมด้วยตัวอย่างผลลัพธ์ที่เราต้องการบางส่วนพร้อมกับคำถามเฉพาะบางข้อ

ตัวอย่างเช่น หากเราต้องการสร้างแบบจำลองที่กำหนดคำใดๆ โดยใช้น้ำเสียงเชิงกวี ก็อาจจะค่อนข้างอธิบายได้ยาก ขวา?

อย่างไรก็ตาม เราสามารถใช้คำแนะนำสั้นๆ ต่อไปนี้เพื่อบังคับโมเดลไปในทิศทางที่เราต้องการ

งานของคุณคือตอบในรูปแบบที่สอดคล้องกันซึ่งสอดคล้องกับสไตล์ต่อไปนี้

: สอนฉันเรื่องความยืดหยุ่น

: ความยืดหยุ่นก็เหมือนต้นไม้ที่โค้งตามลมแต่ไม่เคยหัก

มันคือความสามารถในการฟื้นตัวจากความยากลำบากและก้าวไปข้างหน้า

: ข้อมูลของคุณที่นี่

หากคุณยังไม่ได้ลองใช้คุณสามารถไปท้าทาย GPT ได้

อย่างไรก็ตาม เนื่องจากฉันค่อนข้างแน่ใจว่าพวกคุณส่วนใหญ่รู้เทคนิคพื้นฐานเหล่านี้อยู่แล้ว ฉันจะพยายามท้าทายคุณด้วยเทคนิคขั้นสูงบางอย่าง

1. การกระตุ้นด้วยห่วงโซ่แห่งความคิด (CoT)

แนะนำโดย Google ในปี 2022วิธีนี้เกี่ยวข้องกับการสั่งแบบจำลองให้ผ่านขั้นตอนการให้เหตุผลหลายขั้นตอนก่อนที่จะให้การตอบสนองขั้นสุดท้าย

ฟังดูคุ้นเคยใช่ไหม? ถ้าเป็นเช่นนั้นคุณก็พูดถูก

มันเหมือนกับการผสมผสานทั้งการคิดตามลำดับและการเตือนใจแบบ Few-Shot

ได้อย่างไร

โดยพื้นฐานแล้ว CoT prompting จะสั่งให้ LLM ประมวลผลข้อมูลตามลำดับ ซึ่งหมายความว่าเรายกตัวอย่างวิธีแก้ปัญหาแรกด้วยการให้เหตุผลหลายขั้นตอน จากนั้นส่งงานจริงของเราไปยังโมเดล โดยคาดหวังว่ามันจะจำลองห่วงโซ่ความคิดที่เทียบเคียงได้เมื่อตอบคำถามจริงที่เราต้องการให้แก้ไข

เทคนิคทางวิศวกรรมพร้อมท์ Kick Ass เพื่อเพิ่มโมเดล LLM ของเรา
ภาพที่นำมาจาก กระดาษ.

ดังนั้น จากตัวอย่างแรกสุด เราสามารถให้ข้อมูลปัญหาแรกพร้อมทั้งคำอธิบายวิธีแก้ปัญหาตามลำดับได้ จากนั้นเราสามารถส่งข้อมูลของเราและดูว่าความมหัศจรรย์เกิดขึ้นได้อย่างไร!

ถ้าจอห์นมีลูกแพร์ 5 ลูก แล้วกิน 2 ลูก ซื้อเพิ่มอีก 5 ลูก แล้วให้เพื่อน 3 ลูก เขามีลูกแพร์กี่ลูก? ลองคิดทีละขั้นตอน

เราไปทีละขั้นตอนกัน จอห์นเริ่มต้นด้วยลูกแพร์ 5 ลูก เขากินลูกแพร์ 2 ลูก ดังนั้นเขาจึงเหลือลูกแพร์ 5–2 = 3 ลูก จากนั้นเขาก็ซื้อลูกแพร์เพิ่มอีก 5 ลูก ตอนนี้เขามีลูกแพร์ 3 + 5 = 8 ลูก ในที่สุดเขาก็มอบลูกแพร์ 3 ลูกให้เพื่อน ดังนั้นเขาจึงเหลือลูกแพร์ 8–3 = 5 ลูก หลังจากทำตามขั้นตอนทั้งหมดนี้ จอห์นก็มีลูกแพร์ 5 ลูก

ข้อมูลของคุณที่นี่

อย่างไรก็ตาม พวกคุณส่วนใหญ่คงกำลังคิดว่า... ทุกครั้งที่ฉันต้องการถามอะไรใน ChatGPT ฉันจะต้องคิดวิธีแก้ปัญหาตามลำดับหรือไม่?

ก็…คุณไม่ใช่คนแรก! และสิ่งนี้นำเราไปสู่...

2. ห่วงโซ่แห่งความคิดอัตโนมัติ (Auto-CoT)

ใน 2022, เหวย และเพื่อนร่วมงานได้แนะนำวิธีการหลีกเลี่ยงกระบวนการที่ต้องดำเนินการด้วยตนเองนี้ มีเหตุผลหลักสองประการที่ควรหลีกเลี่ยงงานที่ต้องทำเอง:

มันอาจจะน่าเบื่อ
มันสามารถให้ผลลัพธ์ที่ไม่ดีได้ เช่น เมื่อกระบวนการทางจิตของเราผิดไป

พวกเขาแนะนำให้ใช้ LLM ร่วมกับข้อความ "ลองคิดดูทีละขั้นตอน" เพื่อสร้างห่วงโซ่การให้เหตุผลตามลำดับสำหรับการสาธิตแต่ละครั้ง

นี่หมายถึงการถาม ChatGPT ถึงวิธีแก้ปัญหาตามลำดับ จากนั้นใช้ตัวอย่างเดียวกันนี้เพื่อฝึกให้ ChatGPT ทราบวิธีแก้ปัญหาอื่นๆ

3. ความสม่ำเสมอในตนเอง

ความสม่ำเสมอในตนเองเป็นอีกเทคนิคการกระตุ้นเตือนที่น่าสนใจซึ่งมีจุดมุ่งหมายเพื่อปรับปรุงห่วงโซ่แห่งความคิดที่กระตุ้นให้เกิดปัญหาการใช้เหตุผลที่ซับซ้อนมากขึ้น

ดังนั้น… อะไรคือความแตกต่างที่สำคัญ?

แนวคิดหลักภายใต้ Self-Consistency คือการตระหนักว่าเราสามารถฝึกโมเดลด้วยตัวอย่างที่ไม่ถูกต้องได้ ลองจินตนาการว่าฉันแก้ไขปัญหาก่อนหน้านี้ด้วยกระบวนการทางจิตที่ผิด:

ถ้าจอห์นมีลูกแพร์ 5 ลูก แล้วกิน 2 ลูก ซื้อเพิ่มอีก 5 ลูก แล้วให้เพื่อน 3 ลูก เขามีลูกแพร์กี่ลูก? ลองคิดทีละขั้นตอน

เริ่มต้นด้วย 5 ลูกแพร์ จอห์นกินลูกแพร์ 2 ลูก จากนั้นเขาก็มอบลูกแพร์ 3 ลูกให้เพื่อน การกระทำเหล่านี้สามารถรวมกันได้: 2 (กิน) + 3 (ให้) = ผลรวมลูกแพร์ 5 ลูก ตอนนี้ ลบลูกแพร์ทั้งหมดที่ได้รับผลกระทบจากลูกแพร์ 5 ลูกเริ่มต้น: 5 (เริ่มต้น) – 5 (ได้รับผลกระทบ) = เหลือลูกแพร์ 0 ลูก
จากนั้นงานอื่นๆ ที่ฉันส่งไปยังโมเดลก็จะผิดพลาด

นี่คือเหตุผลว่าทำไมความสม่ำเสมอในตนเองจึงเกี่ยวข้องกับการสุ่มตัวอย่างจากเส้นทางการให้เหตุผลต่างๆ ซึ่งแต่ละเส้นทางมีสายโซ่แห่งความคิด จากนั้นให้ LLM เลือกเส้นทางที่ดีที่สุดและสม่ำเสมอที่สุดในการแก้ปัญหา

เทคนิคทางวิศวกรรมพร้อมท์ Kick Ass เพื่อเพิ่มโมเดล LLM ของเรา
ภาพที่นำมาจาก กระดาษ

ในกรณีนี้ และทำตามตัวอย่างแรกอีกครั้ง เราสามารถแสดงแบบจำลองวิธีแก้ปัญหาต่างๆ ได้

ถ้าจอห์นมีลูกแพร์ 5 ลูก แล้วกิน 2 ลูก ซื้อเพิ่มอีก 5 ลูก แล้วให้เพื่อน 3 ลูก เขามีลูกแพร์กี่ลูก?

เริ่มต้นด้วย 5 ลูกแพร์ จอห์นกินลูกแพร์ 2 ลูก เหลือลูกแพร์ 5–2 = 3 ลูก เขาซื้อลูกแพร์เพิ่ม 5 ลูก รวมเป็น 3 + 5 = 8 ลูกแพร์ ในที่สุด เขาให้ลูกแพร์ 3 ลูกกับเพื่อน ดังนั้นเขาจึงเหลือลูกแพร์ 8–3 = 5 ลูก

ถ้าจอห์นมีลูกแพร์ 5 ลูก แล้วกิน 2 ลูก ซื้อเพิ่มอีก 5 ลูก แล้วให้เพื่อน 3 ลูก เขามีลูกแพร์กี่ลูก?

เริ่มต้นด้วย 5 ลูกแพร์ จากนั้นเขาก็ซื้อลูกแพร์เพิ่มอีก 5 ลูก ตอนนี้จอห์นกินลูกแพร์ 2 ลูก การกระทำเหล่านี้สามารถรวมกันได้: 2 (กิน) + 5 (ซื้อ) = รวมลูกแพร์ 7 ลูก ลบลูกแพร์ที่จอนกินออกจากจำนวนลูกแพร์ทั้งหมด 7 (จำนวนทั้งหมด) – 2 (กินแล้ว) = เหลือลูกแพร์ 5 ลูก

ข้อมูลของคุณที่นี่

และมาถึงเทคนิคสุดท้าย

4. การแจ้งความรู้ทั่วไป

แนวทางปฏิบัติทั่วไปของวิศวกรรมพร้อมท์คือการเพิ่มการค้นหาด้วยความรู้เพิ่มเติม ก่อนที่จะส่งการเรียก API สุดท้ายไปยัง GPT-3 หรือ GPT-4

ตามที่ เจียเฉิง หลิว แอนด์ โคเราสามารถเพิ่มความรู้ให้กับคำขอใดๆ ได้เสมอ เพื่อให้ LLM รู้ดีเกี่ยวกับคำถามนั้น

ตัวอย่างเช่น เมื่อถาม ChatGPT ว่าส่วนหนึ่งของกอล์ฟพยายามทำคะแนนรวมให้สูงกว่าส่วนอื่นหรือไม่ จะเป็นการยืนยันเรา แต่เป้าหมายหลักของการเล่นกอล์ฟกลับตรงกันข้าม นี่คือเหตุผลที่เราสามารถเพิ่มความรู้ก่อนหน้านี้โดยบอกว่า "ผู้เล่นที่มีคะแนนต่ำกว่าจะเป็นผู้ชนะ"

เทคนิคทางวิศวกรรมพร้อมท์ Kick Ass เพื่อเพิ่มโมเดล LLM ของเรา

แล้ว.. อะไรคือส่วนที่ตลกหากเราบอกแบบจำลองให้ทราบคำตอบอย่างชัดเจน?

ในกรณีนี้ เทคนิคนี้ใช้เพื่อปรับปรุงวิธีที่ LLM โต้ตอบกับเรา

ดังนั้น แทนที่จะดึงบริบทเสริมจากฐานข้อมูลภายนอก ผู้เขียนรายงานแนะนำให้ LLM สร้างความรู้ของตนเอง ความรู้ที่สร้างขึ้นเองนี้จะถูกรวมเข้ากับพรอมต์เพื่อสนับสนุนการใช้เหตุผลทั่วไปและให้ผลลัพธ์ที่ดีกว่า

นี่คือวิธีที่สามารถปรับปรุง LLM ได้โดยไม่ต้องเพิ่มชุดข้อมูลการฝึกอบรม!

วิศวกรรมพร้อมท์กลายเป็นเทคนิคสำคัญในการเสริมสร้างขีดความสามารถของ LLM ด้วยการทำซ้ำและปรับปรุงการแจ้งเตือน เราสามารถสื่อสารกับโมเดล AI ได้โดยตรงมากขึ้น และทำให้ได้รับผลลัพธ์ที่แม่นยำและเกี่ยวข้องกับบริบทมากขึ้น ซึ่งช่วยประหยัดทั้งเวลาและทรัพยากร

สำหรับผู้ที่ชื่นชอบเทคโนโลยี นักวิทยาศาสตร์ข้อมูล และผู้สร้างเนื้อหา การทำความเข้าใจและความเชี่ยวชาญด้านวิศวกรรมที่รวดเร็วสามารถเป็นทรัพย์สินที่มีค่าในการควบคุมศักยภาพของ AI ได้อย่างเต็มที่

ด้วยการรวมอินพุตที่ออกแบบอย่างพิถีพิถันเข้ากับเทคนิคขั้นสูงเหล่านี้ การมีชุดทักษะด้านวิศวกรรมพร้อมท์จะทำให้คุณได้เปรียบในปีต่อๆ ไปอย่างไม่ต้องสงสัย

โจเซป เฟอร์เรอร์ เป็นวิศวกรวิเคราะห์จากบาร์เซโลนา เขาสำเร็จการศึกษาด้านวิศวกรรมฟิสิกส์และกำลังทำงานในสาขาวิทยาศาสตร์ข้อมูลที่ประยุกต์ใช้กับการเคลื่อนที่ของมนุษย์ เขาเป็นผู้สร้างเนื้อหานอกเวลาที่มุ่งเน้นด้านวิทยาศาสตร์ข้อมูลและเทคโนโลยี สามารถติดต่อเขาได้ที่ LinkedIn, Twitter or กลาง.