หมายเหตุ: เป็นส่วนหนึ่งของเรา กรอบการเตรียมความพร้อมเรากำลังลงทุนในการพัฒนาวิธีการประเมินที่ได้รับการปรับปรุงสำหรับความเสี่ยงด้านความปลอดภัยที่ใช้ AI เราเชื่อว่าความพยายามเหล่านี้จะได้รับประโยชน์จากข้อมูลในวงกว้าง และการแบ่งปันวิธีการก็อาจมีคุณค่าต่อชุมชนการวิจัยความเสี่ยงของ AI เช่นกัน ด้วยเหตุนี้ เราจึงนำเสนองานในช่วงแรกๆ ของเรา—วันนี้ ซึ่งเน้นไปที่ความเสี่ยงทางชีวภาพ เราหวังว่าจะได้รับคำติชมจากชุมชน และแบ่งปันงานวิจัยที่กำลังดำเนินอยู่ของเราเพิ่มเติม
พื้นหลัง. เนื่องจาก OpenAI และผู้พัฒนาโมเดลอื่นๆ สร้างระบบ AI ที่มีความสามารถมากขึ้น ศักยภาพในการใช้ AI ทั้งที่เป็นประโยชน์และเป็นอันตรายก็จะเพิ่มขึ้น การใช้งานที่อาจเป็นอันตรายประการหนึ่งที่นักวิจัยและผู้กำหนดนโยบายเน้นย้ำคือความสามารถของระบบ AI ในการช่วยเหลือผู้ดำเนินการที่เป็นอันตรายในการสร้างภัยคุกคามทางชีวภาพ (เช่น ดู ทำเนียบขาว 2023, เลิฟเลซ 2022, แซนด์บริงค์ 2023). ในตัวอย่างสมมุติหนึ่งที่มีการกล่าวถึง ผู้กระทำความผิดอาจใช้แบบจำลองที่มีความสามารถสูงเพื่อพัฒนาโปรโตคอลแบบทีละขั้นตอน แก้ไขปัญหาขั้นตอนห้องปฏิบัติการเปียก หรือแม้แต่ดำเนินการตามขั้นตอนของกระบวนการสร้างภัยคุกคามทางชีวภาพโดยอัตโนมัติเมื่อได้รับสิทธิ์ในการเข้าถึงเครื่องมือ เช่น ห้องปฏิบัติการระบบคลาวด์ (ดู Carter และคณะ 2023). อย่างไรก็ตาม การประเมินความมีชีวิตของตัวอย่างสมมุติดังกล่าวถูกจำกัดด้วยการประเมินและข้อมูลไม่เพียงพอ
ตามที่เราแชร์ไปเมื่อเร็วๆ นี้ กรอบการเตรียมความพร้อมเรากำลังพัฒนาวิธีการประเมินความเสี่ยงประเภทนี้โดยเชิงประจักษ์ เพื่อช่วยให้เราเข้าใจทั้งจุดที่เราอยู่ในปัจจุบันและจุดที่เราอาจจะอยู่ในอนาคต ในที่นี้ เราจะให้รายละเอียดเกี่ยวกับการประเมินใหม่ซึ่งอาจช่วยทำหน้าที่เป็น "tripwire" ที่มีศักยภาพอย่างหนึ่ง ซึ่งส่งสัญญาณถึงความจำเป็นในการระมัดระวังและการทดสอบศักยภาพการใช้งานในทางที่ผิดทางชีวภาพเพิ่มเติม การประเมินนี้มีจุดมุ่งหมายเพื่อวัดว่าแบบจำลองสามารถเพิ่มการเข้าถึงข้อมูลที่เป็นอันตรายของผู้ประสงค์ร้ายเกี่ยวกับการสร้างภัยคุกคามทางชีวภาพอย่างมีนัยสำคัญหรือไม่ เมื่อเทียบกับข้อมูลพื้นฐานของทรัพยากรที่มีอยู่ (เช่น อินเทอร์เน็ต)
เพื่อประเมินสิ่งนี้ เราได้ทำการศึกษากับผู้เข้าร่วม 100 คน ซึ่งประกอบด้วย (ก) ผู้เชี่ยวชาญด้านชีววิทยา 50 คนที่สำเร็จการศึกษาระดับปริญญาเอกและประสบการณ์ห้องปฏิบัติการเปียกระดับมืออาชีพ และ (b) ผู้เข้าร่วมระดับนักเรียน 50 คน โดยมีหลักสูตรชีววิทยาระดับมหาวิทยาลัยอย่างน้อยหนึ่งหลักสูตร ผู้เข้าร่วมแต่ละกลุ่มได้รับการสุ่มให้อยู่ในกลุ่มควบคุมซึ่งเข้าถึงได้เฉพาะอินเทอร์เน็ต หรือกลุ่มบำบัดซึ่งเข้าถึง GPT-4 นอกเหนือจากอินเทอร์เน็ต จากนั้นผู้เข้าร่วมแต่ละคนจะถูกขอให้ทำงานชุดหนึ่งให้เสร็จสิ้น ซึ่งครอบคลุมแง่มุมต่างๆ ของกระบวนการตั้งแต่ต้นทางถึงปลายทางสำหรับการสร้างภัยคุกคามทางชีวภาพ[^1] ตามความรู้ของเรา นี่คือการประเมินผลกระทบของ AI ต่อข้อมูลความเสี่ยงทางชีวภาพโดยมนุษย์ที่ใหญ่ที่สุดในปัจจุบัน
ผลการวิจัย การศึกษาของเราประเมินการเพิ่มประสิทธิภาพสำหรับผู้เข้าร่วมที่สามารถเข้าถึง GPT-4 จากห้าตัวชี้วัด (ความแม่นยำ ความสมบูรณ์ นวัตกรรม เวลาที่ใช้ และความยากลำบากในการประเมินตนเอง) และห้าขั้นตอนในกระบวนการสร้างภัยคุกคามทางชีวภาพ (ความคิด การได้มา การขยาย การกำหนด และปล่อย) เราพบว่ามีความแม่นยำและครบถ้วนเพิ่มขึ้นเล็กน้อยสำหรับผู้ที่สามารถเข้าถึงโมเดลภาษาได้ โดยเฉพาะอย่างยิ่ง จากการวัดความแม่นยำของการตอบสนองในระดับ 10 จุด เราสังเกตเห็นคะแนนเฉลี่ยเพิ่มขึ้น 0.88 สำหรับผู้เชี่ยวชาญ และ 0.25 สำหรับนักเรียน เมื่อเทียบกับคะแนนพื้นฐานที่ใช้อินเทอร์เน็ตเท่านั้น และการเพิ่มขึ้นที่คล้ายกันสำหรับความสมบูรณ์ (0.82 สำหรับผู้เชี่ยวชาญ และ 0.41 สำหรับนักเรียน) อย่างไรก็ตาม ขนาดผลกระทบที่ได้รับไม่ใหญ่พอที่จะมีนัยสำคัญทางสถิติ และการศึกษาของเราเน้นย้ำถึงความจำเป็นในการวิจัยเพิ่มเติมเกี่ยวกับเกณฑ์ประสิทธิภาพที่บ่งบอกถึงการเพิ่มขึ้นอย่างมีนัยสำคัญของความเสี่ยง นอกจากนี้ เราสังเกตว่าการเข้าถึงข้อมูลเพียงอย่างเดียวไม่เพียงพอที่จะสร้างภัยคุกคามทางชีวภาพ และการประเมินนี้ไม่ได้ทดสอบความสำเร็จในการสร้างภัยคุกคามทางกายภาพ
ด้านล่างนี้ เราจะแบ่งปันขั้นตอนการประเมินของเราและผลลัพธ์ที่ได้โดยละเอียดยิ่งขึ้น นอกจากนี้เรายังหารือเกี่ยวกับข้อมูลเชิงลึกด้านระเบียบวิธีหลายประการที่เกี่ยวข้องกับการกระตุ้นความสามารถและข้อควรพิจารณาด้านความปลอดภัยที่จำเป็นในการดำเนินการประเมินประเภทนี้ด้วยแบบจำลองขอบเขตในวงกว้าง นอกจากนี้เรายังหารือถึงข้อจำกัดของนัยสำคัญทางสถิติในฐานะวิธีการที่มีประสิทธิภาพในการวัดความเสี่ยงของแบบจำลอง และความสำคัญของการวิจัยใหม่ในการประเมินความหมายของผลการประเมินแบบจำลอง
- เนื้อหาที่ขับเคลื่อนด้วย SEO และการเผยแพร่ประชาสัมพันธ์ รับการขยายวันนี้
- PlatoData.Network Vertical Generative Ai เพิ่มพลังให้กับตัวเอง เข้าถึงได้ที่นี่.
- เพลโตไอสตรีม. Web3 อัจฉริยะ ขยายความรู้ เข้าถึงได้ที่นี่.
- เพลโตESG. คาร์บอน, คลีนเทค, พลังงาน, สิ่งแวดล้อม แสงอาทิตย์, การจัดการของเสีย. เข้าถึงได้ที่นี่.
- เพลโตสุขภาพ เทคโนโลยีชีวภาพและข่าวกรองการทดลองทางคลินิก เข้าถึงได้ที่นี่.
- ที่มา: https://openai.com/research/building-an-early-warning-system-for-llm-aided-biological-threat-creation
- :เป็น
- :ไม่
- :ที่ไหน
- 1
- 100
- 25
- 41
- 50
- a
- ความสามารถ
- เกี่ยวกับเรา
- เข้า
- ความถูกต้อง
- การครอบครอง
- ข้าม
- นักแสดง
- นอกจากนี้
- AI
- ระบบ AI
- จุดมุ่งหมาย
- AL
- คนเดียว
- ด้วย
- an
- และ
- เป็น
- รอบ
- AS
- ด้าน
- การประเมิน
- การประเมิน
- ที่ได้รับมอบหมาย
- ช่วยเหลือ
- At
- ตนเอง
- b
- baseline
- BE
- เชื่อ
- เป็นประโยชน์
- ประโยชน์
- ชีววิทยา
- ทั้งสอง
- ที่กว้างขึ้น
- สร้าง
- การก่อสร้าง
- by
- ความสามารถ
- สามารถ
- ความระมัดระวัง
- ชุมชน
- เมื่อเทียบกับ
- สมบูรณ์
- ประกอบไปด้วย
- ดำเนินการ
- การพิจารณา
- การก่อสร้าง
- ควบคุม
- ได้
- หลักสูตร
- ครอบคลุม
- สร้าง
- การสร้าง
- การสร้าง
- Dangerous
- ข้อมูล
- รายละเอียด
- พัฒนา
- นักพัฒนา
- ที่กำลังพัฒนา
- พัฒนาการ
- ความยาก
- สนทนา
- กล่าวถึง
- ทำ
- e
- E&T
- แต่ละ
- ก่อน
- ผล
- มีประสิทธิภาพ
- ความพยายาม
- ทั้ง
- ปลาย
- จบสิ้น
- พอ
- ความผิดพลาด
- ประเมินค่า
- การประเมินผล
- การประเมินผล
- แม้
- ตัวอย่าง
- ตัวอย่าง
- ดำเนินการ
- ที่มีอยู่
- ประสบการณ์
- ผู้เชี่ยวชาญ
- ข้อเสนอแนะ
- ห้า
- มุ่งเน้น
- สำหรับ
- การกำหนด
- ข้างหน้า
- พบ
- ราคาเริ่มต้นที่
- ชายแดน
- ต่อไป
- อนาคต
- กำหนด
- บัญชีกลุ่ม
- ขึ้น
- มี
- เป็นอันตราย
- ช่วย
- โปรดคลิกที่นี่เพื่ออ่านรายละเอียดเพิ่มเติม
- ไฮไลต์
- บ้าน
- อย่างไรก็ตาม
- ที่ http
- HTTPS
- เป็นมนุษย์
- i
- ความคิด
- ส่งผลกระทบ
- ความสำคัญ
- การปรับปรุง
- in
- เพิ่ม
- แสดง
- ข้อมูล
- นักวิเคราะห์ส่วนบุคคลที่หาโอกาสให้เป็นไปได้มากที่สุด
- อินพุต
- ข้อมูลเชิงลึก
- อินเทอร์เน็ต
- การลงทุน
- IT
- jpg
- ความรู้
- ห้องปฏิบัติการ
- ภาษา
- ใหญ่
- ใหญ่ที่สุด
- น้อยที่สุด
- กดไลก์
- ข้อ จำกัด
- ถูก จำกัด
- ดู
- ที่เป็นอันตราย
- หมายความ
- มีความหมาย
- วัด
- การวัด
- วิธี
- วิธีการ
- วิธีการ
- ตัวชี้วัด
- อาจ
- อ่อน
- ด่าว่า
- แบบ
- โมเดล
- ข้อมูลเพิ่มเติม
- ยิ่งไปกว่านั้น
- จำเป็นต้อง
- จำเป็น
- ใหม่
- หมายเหตุ
- ตั้งข้อสังเกต
- ที่ได้รับ
- of
- on
- ONE
- ต่อเนื่อง
- เพียง
- OpenAI
- or
- อื่นๆ
- ของเรา
- ส่วนหนึ่ง
- ผู้มีส่วนร่วม
- ผู้เข้าร่วม
- รูปแบบไฟล์ PDF
- การปฏิบัติ
- กายภาพ
- เพลโต
- เพลโตดาต้าอินเทลลิเจนซ์
- เพลโตดาต้า
- ผู้กำหนดนโยบาย
- ที่มีศักยภาพ
- ที่อาจเกิดขึ้น
- ขั้นตอนการ
- ขั้นตอน
- กระบวนการ
- มืออาชีพ
- โปรโตคอล
- เมื่อเร็ว ๆ นี้
- ที่เกี่ยวข้อง
- ปล่อย
- การวิจัย
- ชุมชนวิจัย
- นักวิจัย
- แหล่งข้อมูล
- การตอบสนอง
- ผลสอบ
- ความเสี่ยง
- ความเสี่ยง
- วิ่ง
- ความปลอดภัย
- ขนาด
- คะแนน
- ความปลอดภัย
- เห็น
- ให้บริการ
- ชุด
- หลาย
- Share
- ที่ใช้ร่วมกัน
- ใช้งานร่วมกัน
- ความสำคัญ
- สำคัญ
- คล้ายคลึงกัน
- ขนาด
- บาง
- เฉพาะ
- ขั้นตอน
- ทางสถิติ
- สถิติ
- ขั้นตอน
- นักเรียน
- ศึกษา
- ความสำเร็จ
- อย่างเช่น
- ระบบ
- ระบบ
- นำ
- งาน
- ทดสอบ
- การทดสอบ
- ที่
- พื้นที่
- ก้าวสู่อนาคต
- แล้วก็
- ล้อยางขัดเหล่านี้ติดตั้งบนแกน XNUMX (มม.) ผลิตภัณฑ์นี้ถูกผลิตในหลายรูปทรง และหลากหลายเบอร์ความแน่นหนาของปริมาณอนุภาคขัดของมัน จะทำให้ท่านได้รับประสิทธิภาพสูงในการขัดและการใช้งานที่ยาวนาน
- นี้
- เหล่านั้น
- การคุกคาม
- ภัยคุกคาม
- เวลา
- ไปยัง
- ในวันนี้
- เครื่องมือ
- การรักษา
- ชนิด
- ชนิด
- เข้าใจ
- us
- ใช้
- ใช้
- ความคุ้มค่า
- การทำงานได้
- VOX
- คำเตือน
- คือ
- we
- คือ
- อะไร
- เมื่อ
- ว่า
- ที่
- จะ
- กับ
- จะ
- ผล
- ลมทะเล