การเรียนรู้ ChatGPT: การสรุปอย่างมีประสิทธิภาพด้วย LLM

เผยแพร่ซ้ำโดยเพลโต

ผู้ติดตาม: 0

การสรุปข้อความ ChatGPT

ตัวแทนการสรุปที่จินตนาการโดยเครื่องมือสร้างภาพ AI Dall-E

คุณเป็นส่วนหนึ่งของประชากรที่เขียนรีวิวบน Google แผนที่ทุกครั้งที่คุณไปร้านอาหารใหม่หรือไม่?

หรือบางทีคุณเป็นคนประเภทที่จะแบ่งปันความคิดเห็นเกี่ยวกับการซื้อของใน Amazon โดยเฉพาะอย่างยิ่งเมื่อคุณถูกกระตุ้นด้วยผลิตภัณฑ์คุณภาพต่ำ

ไม่ต้องกังวล ฉันจะไม่โทษคุณ เราทุกคนมีช่วงเวลาของเรา!

ในโลกของข้อมูลปัจจุบัน เราทุกคนต่างมีส่วนทำให้ข้อมูลท่วมท้นด้วยวิธีต่างๆ ข้อมูลประเภทหนึ่งที่ฉันพบว่าน่าสนใจเป็นพิเศษเนื่องจากความหลากหลายและความยากในการตีความคือข้อมูลที่เป็นข้อความ เช่น บทวิจารณ์นับไม่ถ้วนที่โพสต์ทางอินเทอร์เน็ตทุกวัน คุณเคยหยุดพิจารณาถึงความสำคัญของการกำหนดมาตรฐานและการย่อข้อมูลที่เป็นข้อความหรือไม่?
ยินดีต้อนรับสู่โลกแห่งตัวแทนการสรุป!

ตัวแทนการสรุปได้รวมเข้ากับข้อมูลย่อในชีวิตประจำวันของเราอย่างราบรื่นและให้การเข้าถึงอย่างรวดเร็วไปยังเนื้อหาที่เกี่ยวข้องผ่านแอพพลิเคชั่นและแพลตฟอร์มที่หลากหลาย

ในบทความนี้ เราจะสำรวจการใช้ ChatGPT ในฐานะตัวแทนการสรุปที่มีประสิทธิภาพสำหรับแอปพลิเคชันที่กำหนดเองของเรา ด้วยความสามารถของ Large Language Models (LLM) ในการประมวลผลและทำความเข้าใจข้อความ พวกเขาสามารถช่วยในการอ่านข้อความและสร้างบทสรุปที่ถูกต้องหรือข้อมูลมาตรฐาน. อย่างไรก็ตาม สิ่งสำคัญคือต้องรู้วิธีดึงศักยภาพของตนออกมาทำงานดังกล่าว ตลอดจนรับทราบข้อจำกัดของตน

ข้อ จำกัด ที่ใหญ่ที่สุดสำหรับการสรุป?
LLM มักจะขาดเมื่อต้องปฏิบัติตามข้อจำกัดของอักขระหรือคำที่เฉพาะเจาะจง ในบทสรุปของพวกเขา

มาสำรวจแนวทางปฏิบัติที่ดีที่สุดสำหรับการสร้างข้อมูลสรุปด้วย ChatGPT สำหรับแอ็พพลิเคชันแบบกำหนดเองของเรา ตลอดจนเหตุผลที่อยู่เบื้องหลังข้อจำกัดและวิธีเอาชนะข้อจำกัดเหล่านั้น!

หากเนื้อหาการศึกษาเชิงลึกนี้มีประโยชน์สำหรับคุณ คุณสามารถ สมัครรับจดหมายข่าวการวิจัย AI ของเรา เพื่อรับการแจ้งเตือนเมื่อเราเผยแพร่เนื้อหาใหม่

การสรุปที่มีประสิทธิภาพด้วย ChatGPT

Summarization Agent ถูกใช้ทั่วอินเทอร์เน็ต ตัวอย่างเช่น เว็บไซต์ใช้ตัวแทนการสรุปเพื่อเสนอบทสรุปที่กระชับของบทความ ทำให้ผู้ใช้สามารถดูภาพรวมอย่างรวดเร็วของข่าวโดยไม่ต้องเจาะลึกเนื้อหาทั้งหมด แพลตฟอร์มโซเชียลมีเดียและเครื่องมือค้นหาก็ทำเช่นนี้เช่นกัน

ตั้งแต่ผู้รวบรวมข่าวและแพลตฟอร์มโซเชียลมีเดียไปจนถึงเว็บไซต์อีคอมเมิร์ซ ตัวแทนสรุปได้กลายเป็นส่วนสำคัญของภูมิทัศน์ดิจิทัลของเรา. และด้วยการเพิ่มขึ้นของ LLM ตัวแทนเหล่านี้บางส่วนกำลังใช้ AI เพื่อผลการสรุปผลที่มีประสิทธิภาพมากขึ้น

ChatGPT สามารถเป็นพันธมิตรที่ดีเมื่อสร้างแอปพลิเคชันโดยใช้เอเจนต์การสรุปข้อมูลเพื่อเพิ่มความเร็วในการอ่านงานและการจัดประเภทข้อความ ตัวอย่างเช่น สมมติว่าเรามีธุรกิจอีคอมเมิร์ซและเราสนใจที่จะดำเนินการกับรีวิวจากลูกค้าทั้งหมดของเรา ChatGPT สามารถช่วยเราในการสรุปบทวิจารณ์ใด ๆ ที่ได้รับในไม่กี่ประโยค สร้างมาตรฐานให้อยู่ในรูปแบบทั่วไป พิจารณา ความรู้สึกของการทบทวนและการจัดประเภท ตามนั้น.

แม้ว่าเราจะสามารถส่งบทวิจารณ์ไปยัง ChatGPT ได้ แต่ก็มีรายการแนวทางปฏิบัติที่ดีที่สุด — และสิ่งที่ควรหลีกเลี่ยง — เพื่อใช้ประโยชน์จากพลังของ ChatGPT ในงานที่เป็นรูปธรรมนี้

มาสำรวจตัวเลือกโดยทำให้ตัวอย่างนี้เป็นจริง!

ตัวอย่าง: บทวิจารณ์อีคอมเมิร์ซ

พิจารณาตัวอย่างด้านบนที่เราสนใจในการประมวลผลบทวิจารณ์ทั้งหมดสำหรับผลิตภัณฑ์ที่กำหนดบนเว็บไซต์อีคอมเมิร์ซของเรา เราสนใจที่จะประมวลผลบทวิจารณ์ เช่น บทวิจารณ์ต่อไปนี้เกี่ยวกับผลิตภัณฑ์ดาวเด่นของเรา: คอมพิวเตอร์เครื่องแรกสำหรับเด็ก!

prod_review = """
I purchased this children's computer for my son, and he absolutely adores it. He spends hours exploring its various features and engaging with the educational games. The colorful design and intuitive interface make it easy for him to navigate. The computer is durable and built to withstand rough handling, which is perfect for active kids. My only minor gripe is that the volume could be a bit louder. Overall, it's an excellent educational toy that provides hours of fun and learning for my son. It arrived a day earlier
than expected, so I got to play with it myself before I gave it to him. """

ในกรณีนี้ เราต้องการให้ ChatGPT นั้น:

จัดประเภทบทวิจารณ์เป็นบวกหรือลบ
จัดทำสรุปการตรวจทานจำนวน 20 คำ
แสดงคำตอบด้วยโครงสร้างที่เป็นรูปธรรมเพื่อสร้างมาตรฐานบทวิจารณ์ทั้งหมดในรูปแบบเดียว

หมายเหตุการใช้งาน

นี่คือโครงสร้างรหัสพื้นฐานที่เราสามารถใช้เพื่อแจ้ง ChatGPT จากแอปพลิเคชันที่กำหนดเองของเรา ฉันยังให้ลิงค์ไปยัง โน้ตบุ๊ค Jupyter ด้วยตัวอย่างทั้งหมดที่ใช้ในบทความนี้

import openai
import os openai.api_key_path = "/path/to/key" def get_completion(prompt, model="gpt-3.5-turbo"): """
This function calls ChatGPT API with a given prompt
and returns the response back. """ messages = [{"role": "user", "content": prompt}] response = openai.ChatCompletion.create( model=model, messages=messages, temperature=0 ) return response.choices[0].message["content"] user_text = f"""
&amp;lt;Any given text&gt; """ prompt = f"""
&amp;lt;Any prompt with additional text&gt; """{user_text}""" """ # A simple call to ChatGPT
response = get_completion(prompt)

ฟังก์ชั่น get_completion() เรียก ChatGPT API ด้วยค่าที่กำหนด รวดเร็ว. หากพรอมต์มีเพิ่มเติม ข้อความของผู้ใช้เช่น บทวิจารณ์ในกรณีของเรา จะแยกออกจากโค้ดที่เหลือด้วยเครื่องหมายอัญประกาศสามตัว

มาใช้ไฟล์ get_completion() ฟังก์ชั่นแจ้ง ChatGPT!

นี่คือข้อความแจ้งให้ปฏิบัติตามข้อกำหนดที่อธิบายไว้ข้างต้น:

prompt = f"""
Your task is to generate a short summary of a product review from an e-commerce site. Summarize the review below, delimited by triple backticks, in exactly 20 words. Output a json with the sentiment of the review, the summary and original review as keys. Review: ```{prod_review}``` """
response = get_completion(prompt)
print(response)

⚠️ แนวทางการเตือนที่ใช้ในตัวอย่างนี้ เช่น การใช้ตัวคั่นเพื่อแยกข้อความอินพุตออกจากส่วนที่เหลือของพรอมต์ และการขอเอาต์พุตที่มีโครงสร้าง มีคำอธิบายอย่างครบถ้วนที่ สิ่งที่ฉันได้เรียนรู้จากหลักสูตรของ OpenAI เกี่ยวกับ Prompt Engineering — แนวทางการแจ้ง.

นี่คือคำตอบของ ChatGPT:

{ "sentiment": "positive", "summary": "Durable and engaging children's computer with intuitive interface and educational games. Volume could be louder.", "review": "I purchased this children's computer for my son, and he absolutely adores it. He spends hours exploring its various features and engaging with the educational games. The colorful design and intuitive interface make it easy for him to navigate. The computer is durable and built to withstand rough handling, which is perfect for active kids. My only minor gripe is that the volume could be a bit louder. Overall, it's an excellent educational toy that provides hours of fun and learning for my son. It arrived a day earlierthan expected, so I got to play with it myself before I gave it to him."
}

ดังที่เราสังเกตได้จากผลลัพธ์ การตรวจทานมีความถูกต้องและมีโครงสร้างที่ดี มันขาดข้อมูลบางอย่างที่เราอาจสนใจในฐานะเจ้าของอีคอมเมิร์ซเช่นข้อมูลเกี่ยวกับการส่งมอบสินค้า

สรุปโดยเน้นที่

เราสามารถปรับปรุงข้อความแจ้งของเราที่ขอให้ ChatGPT ให้ความสำคัญกับบางสิ่งในข้อมูลสรุปซ้ำๆ. ในกรณีนี้ เราสนใจรายละเอียดเกี่ยวกับการจัดส่งและการจัดส่ง:

prompt = f"""
Your task is to generate a short summary of a product review from an ecommerce site. Summarize the review below, delimited by triple backticks, in exactly 20 words and focusing on any aspects that mention shipping and delivery of the product. Output a json with the sentiment of the review, the summary and original review as keys. Review: ```{prod_review}``` """ response = get_completion(prompt)
print(response)

ครั้งนี้ คำตอบของ ChatGPT มีดังต่อไปนี้:

{ "sentiment": "positive", "summary": "Durable and engaging children's computer with intuitive interface. Arrived a day earlier than expected.", "review": "I purchased this children's computer for my son, and he absolutely adores it. He spends hours exploring its various features and engaging with the educational games. The colorful design and intuitive interface make it easy for him to navigate. The computer is durable and built to withstand rough handling, which is perfect for active kids. My only minor gripe is that the volume could be a bit louder. Overall, it's an excellent educational toy that provides hours of fun and learning for my son. It arrived a day earlierthan expected, so I got to play with it myself before I gave it to him."
}

ตอนนี้การตรวจสอบมีความสมบูรณ์มากขึ้น การให้รายละเอียดเกี่ยวกับประเด็นสำคัญของการตรวจสอบต้นฉบับเป็นสิ่งสำคัญเพื่อหลีกเลี่ยงไม่ให้ ChatGPT ข้ามข้อมูลบางอย่างที่อาจมีประโยชน์สำหรับกรณีการใช้งานของเรา.

คุณสังเกตไหมว่าแม้ว่าการทดลองครั้งที่สองนี้มีข้อมูลเกี่ยวกับการจัดส่ง แต่ก็ข้ามประเด็นเชิงลบเพียงอย่างเดียวของบทวิจารณ์เดิม

มาแก้ไขกันเถอะ!

“แยกส่วน” แทน “สรุป”

จากการตรวจสอบงานสรุป ฉันพบว่า การสรุปอาจเป็นงานที่ยุ่งยากสำหรับ LLM หากผู้ใช้แจ้งไม่ถูกต้องเพียงพอ.

เมื่อขอให้ ChatGPT สรุปข้อความที่กำหนด ระบบอาจข้ามข้อมูลที่อาจเกี่ยวข้องกับเรา — อย่างที่เราเพิ่งประสบ — หรือจะให้ความสำคัญเท่ากันกับทุกหัวข้อในข้อความโดยให้ภาพรวมของประเด็นหลักเท่านั้น

ผู้เชี่ยวชาญใน LLM ใช้คำว่า สารสกัด และข้อมูลเพิ่มเติมเกี่ยวกับจุดเน้นของพวกเขาแทน สรุป เมื่อทำงานดังกล่าวได้รับความช่วยเหลือจากโมเดลประเภทนี้

ในขณะที่การสรุปมีจุดประสงค์เพื่อให้ภาพรวมที่กระชับของประเด็นหลักของข้อความ รวมถึงหัวข้อที่ไม่เกี่ยวข้องกับหัวข้อที่มุ่งเน้น การดึงข้อมูลจะเน้นไปที่การดึงรายละเอียดเฉพาะ และสามารถให้สิ่งที่เรากำลังมองหา มาลองสกัดกันเลย!

prompt = f"""
Your task is to extract relevant information from a product review from an ecommerce site to give feedback to the Shipping department. From the review below, delimited by triple quotes extract the information relevant to shipping and delivery. Use 100 characters. Review: ```{prod_review}``` """ response = get_completion(prompt)
print(response)

ในกรณีนี้ เมื่อใช้การดึงข้อมูล เราจะได้รับเฉพาะข้อมูลเกี่ยวกับหัวข้อที่เราสนใจเท่านั้น: Shipping: Arrived a day earlier than expected.

การทำให้เป็นอัตโนมัติ

ระบบนี้ใช้ได้กับการตรวจสอบเพียงครั้งเดียว อย่างไรก็ตาม เมื่อออกแบบพรอมต์สำหรับการใช้งานที่เป็นรูปธรรม สิ่งสำคัญคือต้องทดสอบในชุดตัวอย่างเพื่อให้เราสามารถตรวจจับค่าผิดปกติหรือพฤติกรรมที่ไม่เหมาะสมในแบบจำลองได้.

ในกรณีที่ต้องประมวลผลรีวิวหลายรายการ นี่คือตัวอย่างโครงสร้างโค้ด Python ที่สามารถช่วยได้

reviews = [ "The children's computer I bought for my daughter is absolutely fantastic! She loves it and can't get enough of the educational games. The delivery was fast and arrived right on time. Highly recommend!", "I was really disappointed with the children's computer I received. It didn't live up to my expectations, and the educational games were not engaging at all. The delivery was delayed, which added to my frustration.", "The children's computer is a great educational toy. My son enjoys playing with it and learning new things. However, the delivery took longer than expected, which was a bit disappointing.", "I am extremely happy with the children's computer I purchased. It's highly interactive and keeps my kids entertained for hours. The delivery was swift and hassle-free.", "The children's computer I ordered arrived damaged, and some of the features didn't work properly. It was a huge letdown, and the delivery was also delayed. Not a good experience overall."
] prompt = f""" Your task is to generate a short summary of each product review from an e-commerce site. Extract positive and negative information from each of the given reviews below, delimited by triple backticks in at most 20 words each. Extract information about the delivery, if included. Review: ```{reviews}``` """

ต่อไปนี้คือบทสรุปของบทวิจารณ์ชุดต่างๆ ของเรา:

1. Positive: Fantastic children's computer, fast delivery. Highly recommend.
2. Negative: Disappointing children's computer, unengaging games, delayed delivery.
3. Positive: Great educational toy, son enjoys it. Delivery took longer than expected.
4. Positive: Highly interactive children's computer, swift and hassle-free delivery.
5. Negative: Damaged children's computer, some features didn't work, delayed delivery.

⚠️ โปรดทราบว่าแม้ว่าการจำกัดคำในบทสรุปของเราจะชัดเจนเพียงพอในข้อความแจ้งของเรา แต่เราสังเกตได้ง่ายว่าการจำกัดคำนี้ไม่สามารถทำได้ในการทำซ้ำใดๆ

การนับคำที่ไม่ตรงกันนี้เกิดขึ้นเนื่องจาก LLM ไม่มีความเข้าใจที่ชัดเจนเกี่ยวกับการนับคำหรืออักขระ เหตุผลเบื้องหลังนี้ขึ้นอยู่กับหนึ่งในองค์ประกอบหลักที่สำคัญของสถาปัตยกรรม: โทเค็นไนเซอร์.

tokenizer

LLM เช่น ChatGPT ได้รับการออกแบบมาเพื่อสร้างข้อความตามรูปแบบทางสถิติที่เรียนรู้จากข้อมูลภาษาจำนวนมหาศาล แม้ว่าพวกเขาจะมีประสิทธิภาพสูงในการสร้างข้อความที่ลื่นไหลและสอดคล้องกัน แต่ก็ขาดการควบคุมที่แม่นยำในการนับจำนวนคำ.

ในตัวอย่างข้างต้น เมื่อเราให้คำแนะนำเกี่ยวกับการนับจำนวนคำที่แม่นยำมาก ChatGPT ประสบปัญหาในการปฏิบัติตามข้อกำหนดเหล่านั้น. แต่ได้สร้างข้อความที่สั้นกว่าจำนวนคำที่ระบุ

ในกรณีอื่นๆ ก็อาจสร้างข้อความที่ยาวขึ้นหรือข้อความธรรมดาที่มีความละเอียดมากเกินไปหรือขาดรายละเอียด นอกจากนี้ ChatGPT อาจจัดลำดับความสำคัญของปัจจัยอื่นๆ เช่น ความเชื่อมโยงกันและความเกี่ยวข้อง มากกว่าการปฏิบัติตามจำนวนคำอย่างเคร่งครัด. ซึ่งอาจส่งผลให้ข้อความมีคุณภาพสูงในแง่ของเนื้อหาและการเชื่อมโยงกัน แต่ไม่ตรงกับข้อกำหนดการนับคำอย่างแม่นยำ

โทเค็นไนเซอร์เป็นองค์ประกอบหลักในสถาปัตยกรรมของ ChatGPT ซึ่งมีผลอย่างชัดเจนต่อจำนวนคำในเอาต์พุตที่สร้างขึ้น.

สถาปัตยกรรมโทเค็นไนเซอร์

โทเค็นไนเซอร์เป็นขั้นตอนแรกในกระบวนการสร้างข้อความ มีหน้าที่แยกส่วนของข้อความที่เราป้อนไปยัง ChatGPT ออกเป็นองค์ประกอบแต่ละส่วน — โทเค็น — ซึ่งจะถูกประมวลผลโดยโมเดลภาษาเพื่อสร้างข้อความใหม่

เมื่อโทเค็นไนเซอร์แบ่งส่วนของข้อความออกเป็นโทเค็น โทเค็นจะแยกตามชุดของกฎที่ออกแบบมาเพื่อระบุหน่วยที่มีความหมายของภาษาเป้าหมาย อย่างไรก็ตาม กฎเหล่านี้ไม่ได้สมบูรณ์แบบเสมอไป และ อาจมีบางกรณีที่ tokenizer แยกหรือรวมโทเค็นในลักษณะที่ส่งผลต่อจำนวนคำโดยรวมของข้อความ.

ตัวอย่างเช่น พิจารณาประโยคต่อไปนี้: “อยากกินแซนด์วิชเนยถั่ว” ถ้าโทเค็นได้รับการกำหนดค่าให้แยกโทเค็นตามช่องว่างและเครื่องหมายวรรคตอน ประโยคนี้อาจแบ่งลงเป็นโทเค็นต่อไปนี้โดยมีจำนวนคำทั้งหมด 8 เท่ากับจำนวนโทเค็น

อย่างไรก็ตาม หากโทเค็นไนเซอร์ได้รับการกำหนดค่าให้ปฏิบัติต่อ "เนยถั่ว" เป็นคำประสมอาจแบ่งประโยคออกเป็นโทเค็นดังต่อไปนี้ ด้วยจำนวนคำทั้งหมด 8 แต่โทเค็นนับ 7.

ดังนั้น วิธีกำหนดค่าโทเค็นไนเซอร์จึงส่งผลต่อจำนวนคำโดยรวมของข้อความและสิ่งนี้อาจส่งผลต่อความสามารถของ LLM ในการปฏิบัติตามคำแนะนำเกี่ยวกับการนับจำนวนคำที่แม่นยำ แม้ว่าโทเค็นบางตัวจะเสนอตัวเลือกในการปรับแต่งวิธีการโทเค็นข้อความ แต่ก็ไม่เพียงพอที่จะรับประกันการปฏิบัติตามข้อกำหนดการนับจำนวนคำอย่างแม่นยำ สำหรับ ChatGPT ในกรณีนี้ เราไม่สามารถควบคุมส่วนนี้ของสถาปัตยกรรมได้.

สิ่งนี้ทำให้ ChatGPT ทำได้ไม่ดีนักในการจำกัดอักขระหรือคำให้สำเร็จ แต่สามารถลองใช้ประโยคแทนได้เนื่องจาก tokenizer ไม่ส่งผลกระทบต่อ จำนวนประโยคแต่มีความยาว.

การตระหนักถึงข้อจำกัดนี้สามารถช่วยให้คุณสร้างพรอมต์ที่เหมาะสมที่สุดสำหรับแอปพลิเคชันของคุณได้ เมื่อมีความรู้นี้เกี่ยวกับการนับจำนวนคำบน ChatGPT แล้ว เรามาทำซ้ำขั้นสุดท้ายด้วยการแจ้งเตือนสำหรับแอปพลิเคชันอีคอมเมิร์ซกันเถอะ!

สรุป: บทวิจารณ์อีคอมเมิร์ซ

เรามารวมการเรียนรู้ของเราจากบทความนี้เข้ากับคำแนะนำสุดท้ายกันเถอะ! ในกรณีนี้ เราจะขอทราบผลใน HTML รูปแบบสำหรับผลลัพธ์ที่ดีกว่า:

from IPython.display import display, HTML prompt = f"""
Your task is to extract relevant information from a product review from an ecommerce site to give feedback to the Shipping department and generic feedback from the product. From the review below, delimited by triple quotes construct an HTML table with the sentiment of the review, general feedback from
the product in two sentences and information relevant to shipping and delivery. Review: ```{prod_review}``` """ response = get_completion(prompt)
display(HTML(response))

และนี่คือผลลัพธ์สุดท้ายจาก ChatGPT:

ภาพหน้าจอที่สร้างขึ้นเองจาก โน้ตบุ๊ค Jupyter ด้วยตัวอย่างที่ใช้ในบทความนี้

สรุป

ในบทความนี้, เราได้พูดถึงแนวทางปฏิบัติที่ดีที่สุดสำหรับการใช้ ChatGPT เป็นตัวแทนการสรุปสำหรับแอปพลิเคชันที่กำหนดเองของเรา.

เราได้เห็นแล้วว่าเมื่อสร้างแอปพลิเคชัน เป็นเรื่องยากอย่างยิ่งที่จะได้คำแนะนำที่สมบูรณ์แบบซึ่งตรงกับข้อกำหนดแอปพลิเคชันของคุณในการทดลองใช้ครั้งแรก ฉันคิดว่าข้อความกลับบ้านที่ดีคือการ คิดเกี่ยวกับการกระตุ้นให้เป็นกระบวนการซ้ำ ซึ่งคุณปรับแต่งและสร้างแบบจำลองพรอมต์ของคุณจนกว่าจะได้ผลลัพธ์ที่ต้องการ

การปรับแต่งพรอมต์ของคุณซ้ำแล้วซ้ำเล่าและนำไปใช้กับกลุ่มตัวอย่างก่อนที่จะปรับใช้ในการผลิต คุณจะมั่นใจได้ว่า ผลลัพธ์จะสอดคล้องกันในหลาย ๆ ตัวอย่างและครอบคลุมการตอบสนองที่ผิดปกติ. ในตัวอย่างของเรา อาจเกิดขึ้นได้ว่ามีคนให้ข้อความแบบสุ่มแทนที่จะเป็นบทวิจารณ์ เราสามารถสั่งให้ ChatGPT มีเอาต์พุตมาตรฐานเพื่อแยกการตอบสนองที่ผิดปกติเหล่านี้ออกไปได้.

นอกจากนี้ เมื่อใช้ ChatGPT สำหรับงานเฉพาะ แนวทางปฏิบัติที่ดีคือการเรียนรู้เกี่ยวกับข้อดีและข้อเสียของการใช้ LLM สำหรับงานเป้าหมายของเรา นั่นคือวิธีที่เราพบข้อเท็จจริงที่ว่างานการดึงข้อมูลมีประสิทธิภาพมากกว่าการสรุปเมื่อเราต้องการสรุปข้อความอินพุตที่เหมือนมนุษย์ทั่วไป เรายังได้เรียนรู้ว่าการให้ความสำคัญกับบทสรุปสามารถเป็น เกมเปลี่ยน เกี่ยวกับเนื้อหาที่สร้างขึ้น

ประการสุดท้าย แม้ว่า LLM จะมีประสิทธิภาพสูงในการสร้างข้อความ ไม่เหมาะสำหรับการทำตามคำแนะนำที่ถูกต้องเกี่ยวกับการนับจำนวนคำหรือข้อกำหนดการจัดรูปแบบเฉพาะอื่นๆ. เพื่อให้บรรลุเป้าหมายเหล่านี้ อาจจำเป็นต้องยึดติดกับการนับประโยคหรือใช้เครื่องมือหรือวิธีการอื่นๆ เช่น การแก้ไขด้วยตนเองหรือซอฟต์แวร์เฉพาะทาง

บทความนี้ถูกเผยแพร่เมื่อวันที่ ต่อวิทยาศาสตร์ข้อมูล และเผยแพร่ซ้ำไปยัง TOPBOTS โดยได้รับอนุญาตจากผู้เขียน