นักวิจัย AI เปิดเผยช่องโหว่ที่สำคัญภายใน LLM หลัก

เผยแพร่ซ้ำโดยเพลโต

ผู้ติดตาม: 0

15 ต.ค. 2023 (ข่าวนาโนเวิร์ค) โมเดลภาษาขนาดใหญ่ (LLM) เช่น ChatGPT และ Bard สร้างความฮือฮาให้กับโลกในปีนี้ โดยบริษัทต่างๆ ลงทุนนับล้านเพื่อพัฒนาเครื่องมือ AI เหล่านี้ และแชทบอท AI ชั้นนำบางรายการมีมูลค่านับพันล้าน LLM เหล่านี้ซึ่งมีการใช้งานมากขึ้นในแชทบอท AI จะดึงข้อมูลอินเทอร์เน็ตทั้งหมดเพื่อเรียนรู้และแจ้งคำตอบที่พวกเขาให้กับคำขอที่ผู้ใช้ระบุหรือที่เรียกว่า 'พร้อมท์' อย่างไรก็ตาม นักวิทยาศาสตร์คอมพิวเตอร์จากบริษัทสตาร์ทอัพด้านความปลอดภัย AI Mindgard และ Lancaster University ในสหราชอาณาจักรได้แสดงให้เห็นว่าชิ้นส่วนของ LLM เหล่านี้สามารถคัดลอกได้ในเวลาน้อยกว่าหนึ่งสัปดาห์ด้วยเงินเพียง 50 ดอลลาร์ และข้อมูลที่ได้รับสามารถนำไปใช้ในการโจมตีแบบกำหนดเป้าหมายได้ . นักวิจัยเตือนว่าผู้โจมตีที่ใช้ประโยชน์จากช่องโหว่เหล่านี้อาจเปิดเผยข้อมูลที่เป็นความลับส่วนตัว หลีกเลี่ยงรั้ว ให้คำตอบที่ไม่ถูกต้อง หรือโจมตีแบบกำหนดเป้าหมายเพิ่มเติม รายละเอียดในเอกสารใหม่ (“การดูดแบบจำลอง: การโจมตีแบบสกัดที่กำหนดเป้าหมาย LLM”) ที่จะนำเสนอที่ CAMLIS 2023 (การประชุมเรื่อง Applied Machine Learning for Information Security) นักวิจัยแสดงให้เห็นว่ามีความเป็นไปได้ที่จะคัดลอกประเด็นสำคัญของ LLM ที่มีอยู่ได้ในราคาถูก และแสดงให้เห็นถึงหลักฐานของการถ่ายโอนช่องโหว่ระหว่างโมเดลต่างๆ การโจมตีนี้เรียกว่า 'การดูดแบบจำลอง' ทำงานโดยการพูดคุยกับ LLM ในลักษณะดังกล่าว โดยขอชุดการแจ้งเตือนแบบกำหนดเป้าหมาย เพื่อให้ LLM ดึงข้อมูลที่ลึกซึ้งออกมาโดยบอกวิธีการทำงานของแบบจำลอง ทีมวิจัยซึ่งมุ่งเน้นการศึกษาเกี่ยวกับ ChatGPT-3.5-Turbo จากนั้นใช้ความรู้นี้เพื่อสร้างแบบจำลองสำเนาของตนเอง ซึ่งมีขนาดเล็กกว่า 100 เท่า แต่จำลองลักษณะสำคัญของ LLM จากนั้นนักวิจัยก็สามารถใช้สำเนาแบบจำลองนี้เป็นพื้นที่ทดสอบเพื่อหาวิธีใช้ประโยชน์จากช่องโหว่ใน ChatGPT โดยไม่ต้องตรวจพบ จากนั้นพวกเขาจึงใช้ความรู้ที่รวบรวมมาจากแบบจำลองเพื่อโจมตีช่องโหว่ใน ChatGPT โดยมีอัตราความสำเร็จเพิ่มขึ้น 11% ดร.ปีเตอร์ การ์ราแกน จากมหาวิทยาลัยแลงคาสเตอร์ ซีอีโอของ Mindgard และผู้วิจัยหลักด้านการวิจัย กล่าวว่า "สิ่งที่เราค้นพบนั้นน่าสนใจทางวิทยาศาสตร์ แต่ก็น่ากังวลอย่างยิ่ง นี่เป็นหนึ่งในผลงานชิ้นแรกๆ ที่แสดงให้เห็นเชิงประจักษ์ว่าช่องโหว่ด้านความปลอดภัยสามารถถ่ายโอนระหว่างโมเดล Machine Learning แบบโอเพ่นซอร์สและโอเพ่นซอร์สได้สำเร็จ ซึ่งน่ากังวลอย่างยิ่งเมื่อพิจารณาว่าอุตสาหกรรมต้องอาศัยโมเดล Machine Learning ที่เปิดเผยต่อสาธารณะมากน้อยเพียงใด ซึ่งโฮสต์อยู่ในสถานที่ต่างๆ เช่น HuggingFace” นักวิจัยกล่าวว่างานของพวกเขาเน้นย้ำว่าแม้ว่าเทคโนโลยี AI ดิจิทัลอันทรงพลังเหล่านี้จะมีประโยชน์ที่ชัดเจน แต่ก็มีจุดอ่อนที่ซ่อนอยู่ และอาจมีช่องโหว่ทั่วไปในโมเดลต่างๆ ด้วย ธุรกิจทั่วทั้งอุตสาหกรรมกำลังเตรียมที่จะลงทุนหลายพันล้านเพื่อสร้าง LLM ของตนเองเพื่อดำเนินงานที่หลากหลาย เช่น ผู้ช่วยอัจฉริยะ บริการทางการเงินและองค์กรขนาดใหญ่กำลังนำเทคโนโลยีเหล่านี้มาใช้ แต่นักวิจัยกล่าวว่าช่องโหว่เหล่านี้ควรเป็นปัญหาสำคัญสำหรับทุกธุรกิจที่วางแผนจะสร้างหรือใช้ LLM ของบุคคลที่สาม ดร. Garraghan กล่าวว่า “แม้ว่าเทคโนโลยี LLM อาจมีการเปลี่ยนแปลง แต่ธุรกิจและนักวิทยาศาสตร์ก็จะต้องคิดอย่างรอบคอบในการทำความเข้าใจและวัดความเสี่ยงทางไซเบอร์ที่เกี่ยวข้องกับการนำ LLM มาใช้”

เนื้อหาที่ขับเคลื่อนด้วย SEO และการเผยแพร่ประชาสัมพันธ์ รับการขยายวันนี้
PlatoData.Network Vertical Generative Ai เพิ่มพลังให้กับตัวเอง เข้าถึงได้ที่นี่.
เพลโตไอสตรีม. Web3 อัจฉริยะ ขยายความรู้ เข้าถึงได้ที่นี่.
เพลโตESG. คาร์บอน, คลีนเทค, พลังงาน, สิ่งแวดล้อม แสงอาทิตย์, การจัดการของเสีย. เข้าถึงได้ที่นี่.
เพลโตสุขภาพ เทคโนโลยีชีวภาพและข่าวกรองการทดลองทางคลินิก เข้าถึงได้ที่นี่.
ที่มา: https://www.nanowerk.com/news2/robotics/newsid=63842.php

ประทับเวลา: ตุลาคม 15, 2023

ประทับเวลา: ม.ค. 27, 2023

นักวิจัย AI เปิดเผยช่องโหว่ที่สำคัญภายใน LLM หลัก ๆ

เผยแพร่ซ้ำโดยเพลโต

เพิ่มเติมจาก นาโนเวิร์ค

ตัวทำละลาย 'เมจิก' สร้างฟิล์มบางที่แข็งแรงขึ้น

ด้วยกรดฟอร์มิกที่มีต่อความเป็นกลางของ CO2

แยกซ้ายขวาด้วยแม่เหล็ก

เมื่อสสารเข้าสู่ควอนตัม อิเล็กตรอนจะเคลื่อนที่ช้าลงและก่อตัวเป็นผลึก

วิศวกรพัฒนากระบวนการที่มีประสิทธิภาพในการผลิตเชื้อเพลิงจากคาร์บอนไดออกไซด์

'ลายนิ้วมือด้วยแสง' บนลำอิเล็กตรอน

การพิมพ์ชีวภาพ 3 มิติภายในไฮโดรเจล

ทีมตั้งเป้าที่จะค้นหา 'Earth 2.0'

เกี่ยวกับเรา

การค้นหาแนวตั้ง & Ai

ระบบปฏิบัติการ

การติดต่อ

ลงชื่อเข้าใช้